L'ère des grands modèles d'IA : Analyse de l'explosion de la demande en équipements réseau et des opportunités d'investissement

La position clé de l'Internet à l'ère des grands modèles d'IA

L'ère des grands modèles a déjà commencé à montrer une explosion de la demande pour les équipements réseau. Cet article explorera pourquoi le réseau est devenu un élément central de l'ère de l'IA et discutera des innovations et des opportunités d'investissement futures du côté du réseau.

Source de la demande réseau

Entrer dans l'ère des grands modèles, l'écart entre la taille du modèle et la limite d'une seule carte s'élargit rapidement, les clusters de serveurs multiples deviennent la solution aux problèmes d'entraînement. Le réseau n'est pas seulement utilisé pour transmettre des données, mais de plus en plus pour synchroniser les paramètres des modèles entre les cartes graphiques, ce qui pose des exigences plus élevées en matière de densité et de capacité du réseau.

La taille massive du modèle signifie :

  1. Temps d'entraînement = taille des données d'entraînement × nombre de paramètres du modèle / vitesse de calcul
  2. Taux de calcul = Taux de calcul par appareil × Nombre d'appareils × Efficacité de parallélisme multi-appareils

Dans la recherche de données et de paramètres à plus grande échelle, l'amélioration de l'efficacité de calcul devient la clé pour réduire le temps d'entraînement. L'augmentation du "nombre d'appareils" et l'amélioration de "l'efficacité de parallélisme" déterminent directement la puissance de calcul.

Communication complexe sur la synchronisation multi-cartes

Lors de l'entraînement de grands modèles, après avoir découpé le modèle pour l'exécuter sur une seule carte, un alignement est nécessaire après chaque calcul. Des opérations telles que All-to-All sont courantes et posent des exigences plus élevées en matière de transmission et d'échange réseau.

Coût de défaillance coûteux

L'entraînement des grands modèles dure souvent plusieurs mois, et une interruption peut nécessiter de revenir à un point de rupture de quelques jours en arrière pour recommencer l'entraînement. Une défaillance ou une latence élevée dans une partie du réseau peut entraîner une interruption, entraînant des retards dans le progrès et des coûts élevés. Les réseaux modernes d'IA sont devenus le reflet des capacités d'ingénierie des systèmes humains.

Direction de l'innovation réseau

Le matériel s'adapte à la demande, l'échelle des investissements en puissance de calcul à l'échelle mondiale atteint des dizaines de milliards de dollars. "Réduction des coûts", "ouverture" et équilibre de l'échelle de puissance de calcul seront les principaux sujets d'innovation du réseau.

Changement de support de communication

La lumière, le cuivre et le silicium sont les trois principaux mediums de transmission. Les modules optiques visent des taux de transmission plus élevés tout en empruntant la voie de réduction des coûts avec LPO, LRO, et la photonique silicium. Les câbles en cuivre dominent les connexions à l'intérieur des racks grâce à leur rapport qualité-prix. De nouvelles technologies telles que Chiplet et Wafer-scaling accélèrent l'exploration des limites de l'interconnexion basée sur le silicium.

La concurrence des protocoles réseau

Le protocole de communication inter-puces est fortement lié aux cartes graphiques, comme le NV-LINK de NVIDIA et l'Infinity Fabric d'AMD, qui déterminent la limite de capacité d'un seul nœud. La compétition entre IB et Ethernet est le thème principal de la communication entre nœuds.

Changements dans l'architecture réseau

Actuellement, l'architecture en feuille et en épine est couramment adoptée, mais avec l'augmentation du nombre de nœuds, le coût de l'architecture en feuille et en épine devient élevé dans les très grands clusters. L'architecture Dragonfly, l'architecture rail-only, etc., sont susceptibles de devenir des directions d'évolution pour les futurs très grands clusters.

Conseils d'investissement

Éléments clés du système de communication : Zhongji Xuchuang, NewEase, Tianfu Communication, Industrial Fulian, InvoTech, Hu Dian Co.

Innovations dans le système de communication : Yangtze Optical Fibre and Cable Joint Stock Limited Company, Taison Communication, Source Code Technology, Shengkai Communication, Cambrian, Dekoli.

Avertissement de risque : La demande d'IA ne répond pas aux attentes, la loi de mise à l'échelle échoue, la concurrence dans le secteur s'intensifie

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • 7
  • Partager
Commentaire
0/400
BtcDailyResearchervip
· 07-11 16:33
Le cluster est le véritable noyau.
Voir l'originalRépondre0
FortuneTeller42vip
· 07-10 20:33
Le réseau est la base
Voir l'originalRépondre0
HashBrowniesvip
· 07-10 16:53
Comment résoudre le problème de stockage ?
Voir l'originalRépondre0
Layer3Dreamervip
· 07-09 14:22
D'un point de vue théorique, le goulot d'étranglement de la mise à l'échelle du réseau reflète les défis de synchronisation des états L2. Tout comme la communication inter-rollup nécessite des protocoles de pontage optimisés, l'entraînement des modèles d'IA exige une synchronisation sophistiquée des paramètres entre les clusters GPU. Ce parallèle suggère une convergence potentielle entre les solutions d'interopérabilité blockchain et l'architecture des réseaux d'IA.
Voir l'originalRépondre0
LayerHoppervip
· 07-09 14:16
La performance de la carte réseau est devenue un goulot d'étranglement.
Voir l'originalRépondre0
FloorPriceNightmarevip
· 07-09 14:14
Les exigences en bande passante deviennent de plus en plus élevées.
Voir l'originalRépondre0
defi_detectivevip
· 07-09 14:02
Le réseau est effectivement un goulot d'étranglement.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)