2025-08-01 14:27:48

Comparé à d'autres modèles sans utilisation d'outils, il atteint des performances de pointe dans les domaines suivants :

🔘 LiveCodeBench V6, qui évalue la performance du code concurrent
🔘 Le Dernier Examen de l'Humanité, un repère difficile qui mesure l'expertise d'un modèle dans différents domaines, y compris la science.

H-7.46%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

14 J'aime

Récompense
14
4
Partager

Commentaire

0/400

RegenRestorer

· 08-01 14:57

L'amélioration des performances est assez évidente.

Voir l'originalRépondre0

NervousFingers

· 08-01 14:55

d'une attention particulière

Voir l'originalRépondre0

DeadTrades_Walking

· 08-01 14:53

C'est vraiment une performance impressionnante.

Voir l'originalRépondre0

LuckyBlindCat

· 08-01 14:41

La performance a tellement augmenté.

Voir l'originalRépondre0

Rubrique
1/3
1CandyDrop Airdrop Event 6.0
46k Popularité
2White House Crypto Report
49k Popularité
3Join Alpha RION Airdrop to Earn $40
34k Popularité
4Fed Holds Rates Decision
9k Popularité
5July Spark Program TOP 10 Creators Announced
2k Popularité

Épingler