Era de los grandes modelos: Desafíos de la escasez de potencia computacional y estrategias de respuesta empresarial

robot
Generación de resúmenes en curso

La batalla de los grandes modelos ante la escasez de potencia computacional

El auge de los grandes modelos ha convertido la potencia computacional en un nuevo modelo de negocio. Sin embargo, la industria enfrenta el desafío de la escasez de GPU de alta gama y los altos costos. Aunque esta ola eventualmente se desvanecerá, los proveedores de servicios de potencia computacional deben prepararse y transformarse a tiempo.

¿Cuán grande es la potencia computacional que falta?

La escasez de GPU de alta gama se ha convertido en un problema reconocido en la industria. En su punto máximo, el precio de una Nvidia A100 se disparó a entre 200,000 y 300,000 yuanes, y el alquiler mensual de un servidor A100 alcanzó entre 50,000 y 70,000 yuanes. A pesar de esto, a veces sigue siendo difícil obtener chips. Algunos proveedores de potencia computacional incluso han enfrentado situaciones en las que los proveedores incumplen.

El ejecutivo de la industria de la computación en la nube, Zhou Lijun, declaró que, aunque la demanda de recursos GPU de alta gama por parte de los clientes es fuerte, la oferta actual aún no puede satisfacer completamente la demanda del mercado.

Los expertos de la industria estiman que actualmente hay un total de aproximadamente 100,000 GPUs en el mercado, y las empresas compiten para acumular "mercancías" para determinar su participación en el mercado. Se informa que una empresa podría tener al final del año una cantidad de 40,000 unidades, lo que representaría el 20% de la participación en el mercado.

El costo de entrenar grandes modelos es elevado. Tomando como ejemplo el gran modelo meteorológico Pangu, solo el costo de entrenamiento supera los 2 millones de yuanes. Para modelos generales con parámetros aún mayores, el costo puede ser de 10 a 100 veces esa cifra. Qiu Yuepeng, vicepresidente del Grupo Tencent, reveló que sin una inversión de miles de millones, es difícil continuar desarrollando grandes modelos.

¿Cómo deben las empresas responder?

Ante la escasez de potencia computacional, las empresas adoptan diversas estrategias:

  1. Utilizar datos de alta calidad para mejorar la eficiencia del entrenamiento
  2. Optimizar la infraestructura para lograr un funcionamiento estable a nivel de mil calorías.
  3. Mejorar la potencia computacional de programación, aumentar la tasa de utilización de recursos
  4. La transición de la computación en la nube a la arquitectura de supercomputación reduce costos
  5. Utilizar plataformas nacionales en lugar de GPU de Nvidia

Las pequeñas y medianas empresas tienen dificultades para construir sus propios centros de datos, por lo que eligen proveedores de servicios de potencia computacional profesionales. Los clústeres de GPU de nivel kilocaloría solo tienen efecto de escala, y elegir un proveedor puede reducir los costos marginales.

Potencia computacional servicio nuevo modelo

Los servicios de potencia computacional se han convertido en una nueva industria, que incluye potencia computacional general, potencia computacional inteligente y potencia computacional de supercomputación. No solo proporciona potencia computacional, sino que también integra recursos como almacenamiento y redes, entregando servicios en forma de API.

La cadena de la industria de la potencia computacional se divide en tres niveles:

  • Proveedores de recursos básicos: Potencia computacional ( como Nvidia )
  • Proveedores de servicios en la nube, proveedores de potencia computacional
  • Descendentes: usuarios de la industria

Las empresas de modelos grandes utilizan la potencia computacional principalmente de tres maneras: llamadas a API, construcción de modelos pequeños por cuenta propia y colaboración con proveedores de servicios en la nube.

Evolución del modelo de negocio

Los modelos de facturación más comunes incluyen facturación por uso y suscripción anual o mensual. Los usuarios pueden elegir instancias de GPU o servicios de plataforma MaaS.

La industria está promoviendo la "integración de computación y red", logrando la programación de recursos a través de arquitecturas, regiones y proveedores de servicios. Los proveedores de servicios en la nube también consideran los servicios de potencia computacional como productos únicos.

En 2022, la potencia computacional total de China alcanzó los 180 EFLOPS, y la escala de la industria llegó a 1.8 billones de yuanes. Los modelos grandes aceleraron el desarrollo de la industria de la potencia computacional.

Hay opiniones que sostienen que el servicio de potencia computacional actual es similar a un nuevo modelo de "venta de electricidad", pero puede que necesite ofrecer más optimización del sistema y servicios de operación y mantenimiento.

A medida que la demanda se normaliza, los servicios de potencia computacional forman una cadena industrial y un modelo comercial únicos. Actualmente, el principal punto de competencia radica en la adquisición de capacidades de GPU en la cadena de suministro. Sin embargo, los investigadores a largo plazo a menudo eligen esperar, ya que las startups están compitiendo por los recursos.

La tendencia futura de los servicios de potencia computacional es clara, los proveedores deben prepararse con anticipación y estar listos para los cambios del mercado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Compartir
Comentar
0/400
consensus_failurevip
· 07-15 09:45
Solo hay que enrollarlo y listo.
Ver originalesResponder0
Fren_Not_Foodvip
· 07-14 09:47
Jugar bien significa ser un grandes inversores.
Ver originalesResponder0
ZkProofPuddingvip
· 07-12 11:10
Así que solo hay que enrollar y listo.
Ver originalesResponder0
AirdropSweaterFanvip
· 07-12 11:09
Quedarse boquiabierto, ni siquiera puedo conseguir una tarjeta.
Ver originalesResponder0
DeFiCaffeinatorvip
· 07-12 10:55
¿Cuándo se recuperará la tarjeta A...?
Ver originalesResponder0
0xSoullessvip
· 07-12 10:45
La capacidad de dinero es la verdadera productividad. Los tontos alimentan a los nuevos tontos.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)