Comparé à d'autres modèles sans utilisation d'outils, il atteint des performances de pointe dans les domaines suivants :
🔘 LiveCodeBench V6, qui évalue la performance du code concurrent 🔘 Le Dernier Examen de l'Humanité, un repère difficile qui mesure l'expertise d'un modèle dans différents domaines, y compris la science.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
14 J'aime
Récompense
14
4
Partager
Commentaire
0/400
RegenRestorer
· 08-01 14:57
L'amélioration des performances est assez évidente.
Comparé à d'autres modèles sans utilisation d'outils, il atteint des performances de pointe dans les domaines suivants :
🔘 LiveCodeBench V6, qui évalue la performance du code concurrent
🔘 Le Dernier Examen de l'Humanité, un repère difficile qui mesure l'expertise d'un modèle dans différents domaines, y compris la science.