Transformer lidera la era de los grandes modelos de IA, la guerra de los cien modelos se intensifica.

Era de los grandes modelos de IA: El surgimiento de Transformer y la guerra de los cien modelos

El mes pasado, en el mundo de la IA, se desató una "guerra de animales". Por un lado está Llama de Meta (la llama), y por el otro un gran modelo llamado Falcon (el halcón). Estos dos modelos han estado compitiendo en la clasificación de LLM de código abierto, alternando en la cima.

Curiosamente, los desarrolladores de Falcon no son gigantes tecnológicos, sino un instituto de investigación de los Emiratos Árabes Unidos. Funcionarios del país han declarado que participan en la competencia de IA para "desafiar a los jugadores clave". Hoy en día, casi todos los países y empresas están creando sus propios modelos de lenguaje grande, siempre que tengan suficiente capacidad financiera.

Detrás de esta "guerra de modelos", se encuentra el algoritmo Transformer publicado por Google en 2017. Este algoritmo resolvió el problema de que las máquinas entendieran textos largos, convirtiendo los grandes modelos de un problema de investigación teórica a un problema de ingeniería. Hoy en día, tanto GPT como otros modelos se basan en la arquitectura Transformer.

La aparición de Transformer ha reducido en gran medida la barrera de entrada para la investigación y desarrollo de IA. Con suficiente potencia de cálculo y datos, cualquier empresa puede entrenar un gran modelo. Esto también ha llevado a la situación actual de gran diversidad: según las estadísticas, el número de grandes modelos en China ha superado al de Estados Unidos, alcanzando los 130.

Sin embargo, la clave para convertirse en un gigante en la era de la IA no radica simplemente en acumular parámetros. El éxito de Llama de Meta se debe a su activa comunidad de desarrolladores. Por otro lado, la ventaja de GPT-4 proviene de la poderosa capacidad de investigación de OpenAI.

Actualmente, el mayor desafío que enfrenta la industria de modelos grandes es el problema de la rentabilidad. Los altos costos de computación han llevado a muchas empresas a sufrir pérdidas significativas en IA. Se estima que la inversión en infraestructura de toda la industria podría superar los 125 mil millones de dólares en ingresos anuales.

Por lo tanto, la competencia futura puede que no esté en quién tiene más parámetros en su modelo, sino en quién puede encontrar el modelo de negocio adecuado y realmente transformar la IA en productividad. Así como el éxito del iPhone 4 no radicó en su procesador, sino en su rica ecosistema de aplicaciones, los ganadores de la industria de la IA en el futuro probablemente serán también aquellas empresas que puedan ofrecer soluciones prácticas.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
StealthMoonvip
· 07-14 19:49
¿Qué zoológico es este?
Ver originalesResponder0
SleepTradervip
· 07-14 19:46
experto están todos compitiendo en AI para ver quién tiene más dinero.
Ver originalesResponder0
LiquidationAlertvip
· 07-14 19:39
Los fideos instantáneos también pueden llamarse modelos de IA, ¡qué novedoso!
Ver originalesResponder0
ZKProofEnthusiastvip
· 07-14 19:38
Ahora hay que comparar la Potencia computacional y el capital.
Ver originalesResponder0
GmGnSleepervip
· 07-14 19:32
Es esta velocidad, no puedo competir con llama.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)