L'ère des grands modèles : défis de la pénurie de puissance de calcul et stratégies d'adaptation des entreprises

robot
Création du résumé en cours

La guerre des grands modèles face à la pénurie de puissance de calcul

L'essor des grands modèles a fait de la puissance de calcul un nouveau modèle commercial. Cependant, l'industrie est confrontée à des défis tels que la pénurie de GPU haut de gamme et des coûts élevés. Bien que cette vague finisse par se calmer, les fournisseurs de services de puissance de calcul doivent anticiper et se transformer à temps.

Puissance de calcul manque combien?

La pénurie de GPU haut de gamme est devenue un problème reconnu dans l'industrie. À son apogée, le prix d'un NVIDIA A100 a été porté à 200 000 - 300 000 yuan, et le loyer mensuel d'un serveur A100 a également atteint 50 000 - 70 000 yuan. Même ainsi, il est parfois encore difficile d'obtenir des puces. Certains fournisseurs de puissance de calcul ont même rencontré des situations de rupture de contrat avec leurs fournisseurs.

Zhou Lijun, un cadre supérieur de l'industrie du cloud computing, a déclaré que bien que la demande des clients pour des ressources GPU haut de gamme soit forte, l'offre actuelle ne peut toujours pas répondre entièrement à la demande du marché.

Les experts estiment qu'il y a actuellement environ 100 000 GPU sur le marché, et chaque entreprise s'efforce d'accumuler des "stocks" pour évaluer sa part de marché. Des informations indiquent qu'une entreprise pourrait avoir une quantité de 40 000 GPU à la fin de l'année, représentant 20 % de la part de marché.

Le coût de l'entraînement des grands modèles est élevé. Prenons l'exemple du grand modèle météorologique Pangu, dont le coût d'entraînement dépasse 2 millions de yuans. Pour des modèles généraux avec encore plus de paramètres, le coût peut être de 10 à 100 fois ce chiffre. Qiu Yuepeng, vice-président de Tencent, a révélé qu'il est difficile de continuer à développer de grands modèles sans un investissement de plusieurs milliards.

Comment les entreprises doivent-elles réagir ?

Face à la Puissance de calcul limitée, les entreprises adoptent diverses stratégies :

  1. Utiliser des données de haute qualité pour améliorer l'efficacité de l'entraînement
  2. Optimiser l'infrastructure pour réaliser un fonctionnement stable à l'échelle des kilocalories.
  3. Améliorer la Puissance de calcul et augmenter l'utilisation des ressources
  4. Passer de l'informatique en nuage à une architecture de supercalculateur réduit les coûts
  5. Utiliser des plateformes nationales pour remplacer les GPU Nvidia

Les petites et moyennes entreprises ont du mal à construire leurs propres centres de données et choisissent souvent des fournisseurs de services de puissance de calcul spécialisés. Les clusters GPU de niveau kilocalorie ont un effet d'échelle, et le choix d'un fournisseur peut réduire les coûts marginaux.

Puissance de calcul service nouveau mode

La puissance de calcul devient une industrie émergente, incluant la puissance de calcul générale, la puissance de calcul intelligente et la puissance de calcul super. Elle ne fournit pas seulement de la puissance de calcul, mais intègre également des ressources de stockage, de réseau, etc., pour livrer des services sous forme d'API.

La chaîne industrielle de la puissance de calcul se divise en trois niveaux :

  • Amont : Fournisseur de ressources de base ( comme Nvidia )
  • Fournisseur de services cloud, fournisseur de puissance de calcul
  • En aval : utilisateurs de l'industrie

Les entreprises de grands modèles utilisent principalement la puissance de calcul de trois manières : appels API, construction de petits modèles en interne, collaboration avec des fournisseurs de cloud.

Évolution du modèle commercial

Les modèles de facturation dominants incluent la facturation à l'utilisation et les abonnements annuels ou mensuels. Les utilisateurs peuvent choisir des instances GPU ou des services de plateforme MaaS.

L'industrie promeut l'"intégration de la puissance de calcul et du réseau", réalisant la planification des ressources inter-architectures, inter-régions et inter-fournisseurs de services. Les fournisseurs de services cloud considèrent également la puissance de calcul comme un produit unique.

En 2022, la puissance de calcul totale de la Chine a atteint 180 EFLOPS, avec une taille de l'industrie de 1,8 billion de yuans. Les grands modèles ont accéléré le développement de l'industrie de la puissance de calcul.

Il existe des opinions selon lesquelles les services de puissance de calcul actuels ressemblent à un nouveau modèle de "vente d'électricité", mais pourraient nécessiter des services d'optimisation système et de maintenance supplémentaires.

Avec la normalisation de la demande, les services de puissance de calcul forment une chaîne d'industrie et un modèle commercial uniques. Actuellement, le principal point de concurrence réside dans l'acquisition de capacités GPU au sein de la chaîne d'approvisionnement. Cependant, les chercheurs à long terme choisissent souvent d'attendre, principalement en raison de la concurrence des start-ups pour les ressources.

La tendance des services de puissance de calcul est claire pour l'avenir, les prestataires doivent anticiper et se préparer aux changements du marché.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • 5
  • Partager
Commentaire
0/400
Fren_Not_Foodvip
· Il y a 15h
J'ai compris, c'est juste une carte pour les Grands investisseurs.
Voir l'originalRépondre0
ZkProofPuddingvip
· 07-12 11:10
C'est tout ce qu'il y a à faire.
Voir l'originalRépondre0
AirdropSweaterFanvip
· 07-12 11:09
Stupéfait, je ne peux même pas obtenir une carte.
Voir l'originalRépondre0
DeFiCaffeinatorvip
· 07-12 10:55
Quand la carte A va-t-elle faire un grand retour...
Voir l'originalRépondre0
0xSoullessvip
· 07-12 10:45
La capacité de l'argent est la véritable productivité. Les vieux pigeons nourrissent les nouveaux pigeons.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)