Era dos grandes modelos: Desafios de escassez de poder de computação e estratégias de resposta das empresas

2025-07-12 10:43:45

Geração do resumo em andamento

A guerra dos grandes modelos em meio à escassez de Poder de computação

A ascensão da onda dos grandes modelos fez com que o poder de computação se tornasse um novo modelo de negócios. No entanto, a indústria enfrenta desafios de escassez de GPUs de alta gama e altos custos. Embora esta onda eventualmente diminua, os prestadores de serviços de poder de computação precisam se preparar e se transformar a tempo.

Poder de computação em falta: quão grande é?

A alta demanda por GPUs de alto desempenho tornou-se um problema reconhecido na indústria. No auge, o preço de uma placa gráfica Nvidia A100 foi inflacionado para 200.000 a 300.000 RMB, e o aluguel mensal de um servidor A100 também chegou a 50.000 a 70.000 RMB. Mesmo assim, às vezes ainda é difícil obter chips. Alguns fornecedores de poder de computação até enfrentaram situações em que os fornecedores não cumpriram as promessas.

O executivo da indústria de computação em nuvem, Zhou Lijun, afirmou que, apesar da forte demanda dos clientes por recursos de GPU de alto desempenho, a oferta atual ainda não consegue satisfazer completamente a demanda do mercado.

Especialistas do setor estimam que o número total de GPUs no mercado seja atualmente cerca de 100.000, com cada empresa a acumular "mercadorias" para avaliar a quota de mercado. Há informações de que uma certa empresa pode ter um estoque de 40.000 até o final do ano, o que representa 20% da quota de mercado.

O custo de treinar grandes modelos é elevado. Tomando como exemplo o grande modelo de meteorologia Pangu, o custo de apenas o treinamento ultrapassa 2 milhões de yuan. Para modelos gerais com parâmetros ainda maiores, o custo pode ser de 10 a 100 vezes esse valor. Qiu Yuepeng, vice-presidente do Grupo Tencent, revelou que sem um investimento de bilhões, é difícil continuar a desenvolver grandes modelos.

Como as empresas devem reagir?

Diante da escassez de poder de computação, as empresas adotam várias estratégias:

Utilizar dados de alta qualidade para aumentar a eficiência do treinamento
Otimizar infraestrutura, alcançar funcionamento estável a nível de mil calorias
Melhorar o Poder de computação e aumentar a taxa de utilização de recursos
A transição da computação em nuvem para a arquitetura de supercomputação reduz custos
Usar plataformas nacionais em vez de GPUs da Nvidia

As pequenas e médias empresas têm dificuldade em construir centros de dados próprios, optando por prestadores de serviços de poder de computação profissionais. Apenas os clusters de GPU de nível quilocalórico têm efeito de escala, e escolher um prestador de serviços pode reduzir o custo marginal.

Poder de computação serviço novo modelo

O serviço de Poder de computação tornou-se uma indústria emergente, incluindo Poder de computação geral, Poder de computação inteligente e Poder de computação super. Ele não apenas fornece Poder de computação, mas também integra recursos como armazenamento, rede, entre outros, para entregar serviços na forma de API.

Poder de computação indústria cadeia é dividida em três camadas:

Upstream: Fornecedores de recursos básicos ( como a Nvidia )
Provedor de serviços em nuvem: fornecedor de serviços de poder de computação
A montante: utilizadores da indústria

As empresas de grandes modelos utilizam o poder de computação principalmente de três maneiras: chamadas de API, construção de pequenos modelos próprios e colaboração com fornecedores de nuvem.

Evolução do modelo de negócios

Atualmente, os modelos de cobrança mais comuns incluem cobrança por uso e planos anuais ou mensais. Os usuários podem escolher instâncias de GPU ou serviços de plataforma MaaS.

A indústria está promovendo a "integração de computação e rede", realizando o agendamento de recursos entre arquiteturas, regiões e provedores de serviços. Os provedores de serviços em nuvem também considerarão o Poder de computação como um produto único.

Em 2022, a escala total de poder de computação da China atingiu 180 EFLOPS, e a escala da indústria alcançou 1,8 trilhões de yuans. Grandes modelos aceleraram o desenvolvimento da indústria de poder de computação.

Há opiniões que consideram que os serviços de poder de computação atuais são semelhantes a um novo modelo de "venda de eletricidade", mas podem precisar de oferecer mais serviços de otimização de sistema e manutenção.

Com a normalização da demanda, os serviços de poder de computação formaram uma cadeia industrial e um modelo de negócio únicos. O principal ponto de competição atualmente é a obtenção de capacidade de GPU na cadeia de suprimentos. No entanto, pesquisadores de longo prazo costumam optar por esperar, principalmente porque startups estão competindo por recursos.

A tendência dos serviços de poder de computação no futuro é clara, os prestadores de serviços devem se preparar antecipadamente para as mudanças no mercado.

Ver original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

9 Curtidas