Les Transformers mènent l'ère des grands modèles d'IA, une bataille de centaines de modèles s'annonce.

L'ère des grands modèles d'IA : L'essor des Transformateurs et la guerre des centaines de modèles

Le mois dernier, le monde de l'IA a été secoué par une "bataille des animaux". D'un côté se trouve Llama de Meta (lama), de l'autre le grand modèle nommé Falcon (faucon). Ces deux modèles se sont battus pour la première place dans le classement des LLM open source, se relançant tour à tour.

Il est intéressant de noter que les développeurs de Falcon ne sont pas des géants de la technologie, mais un institut de recherche des Émirats. Les fonctionnaires du pays ont déclaré qu'ils participaient à la course à l'IA pour "bousculer les acteurs majeurs". Aujourd'hui, tant qu'il y a suffisamment de ressources financières, presque tous les pays et entreprises créent leur propre grand modèle de langage.

Derrière cette "bataille des cent modèles" se trouve l'algorithme Transformer publié par Google en 2017. Il a résolu le problème de la compréhension des longs textes par les machines, transformant les grands modèles d'une recherche théorique en un problème d'ingénierie. Aujourd'hui, que ce soit GPT ou d'autres modèles, tous sont basés sur le Transformer.

L'apparition des Transformers a considérablement abaissé le seuil d'entrée dans le développement de l'IA. Tant qu'une entreprise dispose de suffisamment de puissance de calcul et de données, elle peut entraîner un grand modèle. Cela a également conduit à une situation florissante - selon les statistiques, le nombre de grands modèles en Chine a déjà dépassé celui des États-Unis, atteignant 130.

Cependant, la capacité à devenir un géant à l'ère de l'IA ne réside pas simplement dans l'accumulation de paramètres. Le succès de Llama de Meta est dû à sa communauté de développeurs active. Quant à GPT-4, son avance considérable provient de la puissance de recherche d'OpenAI.

Actuellement, le plus grand défi auquel l'industrie des grands modèles est confrontée est la question de la rentabilité. Les coûts élevés de calcul entraînent de lourdes pertes pour de nombreuses entreprises dans le domaine de l'IA. On estime que les investissements dans l'infrastructure de l'ensemble de l'industrie pourraient dépasser les 125 milliards de dollars de revenus par an.

Ainsi, la concurrence future ne résidera peut-être pas dans le nombre de paramètres du modèle, mais dans celui qui saura trouver le bon modèle commercial, transformant véritablement l'IA en productivité. Tout comme le succès de l'iPhone 4 ne résidait pas dans le processeur, mais dans un écosystème d'applications riche, les gagnants de l'industrie de l'IA seront probablement ceux qui pourront offrir des solutions pratiques.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
StealthMoonvip
· 07-14 19:49
Quel zoo est-ce ?
Voir l'originalRépondre0
SleepTradervip
· 07-14 19:46
pro sont tous en train de faire de l'IA, comparant qui a le plus d'argent.
Voir l'originalRépondre0
LiquidationAlertvip
· 07-14 19:39
Les nouilles instantanées peuvent aussi être appelées modèle d'IA, c'est tellement nouveau.
Voir l'originalRépondre0
ZKProofEnthusiastvip
· 07-14 19:38
Maintenant, il faut comparer la puissance de calcul et les ressources financières.
Voir l'originalRépondre0
GmGnSleepervip
· 07-14 19:32
C'est cette vitesse, je ne peux pas rivaliser avec llama.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)