En comparación con otros modelos sin uso de herramientas, logra un rendimiento de vanguardia en:
🔘 LiveCodeBench V6, que evalúa el rendimiento del código competitivo 🔘 El Último Examen de la Humanidad, un referente desafiante que mide la experiencia de un modelo en diferentes dominios, incluyendo la ciencia.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
En comparación con otros modelos sin uso de herramientas, logra un rendimiento de vanguardia en:
🔘 LiveCodeBench V6, que evalúa el rendimiento del código competitivo
🔘 El Último Examen de la Humanidad, un referente desafiante que mide la experiencia de un modelo en diferentes dominios, incluyendo la ciencia.