大模型时代:算力短缺挑战与企业应对策略

robot
摘要生成中

算力资源紧缺下的大模型之战

大模型热潮的兴起使算力成为新的商业模式。然而,行业面临高端GPU短缺和成本高昂的挑战。虽然这股热潮终将退去,算力服务商需未雨绸缪,及时转型。

算力缺口有多大?

高端GPU供不应求已成行业公认的难题。顶峰时期,一张英伟达A100的价格被炒至20-30万元,单台A100服务器月租也达到5-7万元。即便如此,有时仍难以获得芯片。一些算力供应商甚至遇到供应商爽约的情况。

云计算行业高管周立军表示,尽管客户对高端GPU资源需求旺盛,但目前供给仍无法完全满足市场需求。

业内人士估计,目前市场总GPU数量约为10万张,各家争相囤积"货"以判断市场份额。有消息称,某公司年底保有量可能达4万张,占20%市场份额。

训练大模型成本高昂。以盘古气象大模型为例,仅训练成本就超过200万元。对于参数更大的通用大模型,成本可能是这个数字的10-100倍。腾讯集团副总裁邱跃鹏透露,没有数十亿资金投入,很难持续开发大模型。

企业如何应对?

面对算力短缺,企业采取多种策略:

  1. 使用高质量数据提升训练效率
  2. 优化基础设施,实现千卡级稳定运行
  3. 改进算力调度,提高资源利用率
  4. 从云计算过渡到超算架构降低成本
  5. 使用国产平台替代英伟达GPU

中小企业难以自建数据中心,多选择专业算力服务商。千卡级GPU集群才有规模效应,选择服务商可降低边际成本。

算力服务新模式

算力服务成为新兴产业,包括通用算力、智能算力和超算算力。它不仅提供算力,还整合存储、网络等资源,以API形式交付服务。

算力产业链分为三层:

  • 上游:基础资源供应商(如英伟达)
  • 中游:云服务商、算力服务提供商
  • 下游:行业用户

大模型企业主要通过三种方式使用算力:API调用、自建小模型、与云厂商合作。

商业模式演进

目前主流计费模式包括按量计费和包年包月。用户可选择GPU实例或MaaS平台服务。

行业正推进"算网一体化",实现跨架构、跨地域、跨服务商的资源调度。云服务商也将算力服务作为独特产品。

2022年中国算力总规模达180EFLOPS,产业规模达1.8万亿元。大模型加速了算力产业发展。

有观点认为,当前算力服务类似新型"卖电"模式,但可能需要提供更多系统优化和运维服务。

随着需求常态化,算力服务形成独特产业链和商业模式。当前主要竞争点在于供应链获取GPU能力。然而,长期研究者往往选择等待,主要是创业公司在抢夺资源。

未来算力服务趋势明确,服务商需未雨绸缪,为市场变化做好准备。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 分享
评论
0/400
Fren_Not_Foodvip
· 19小时前
玩明白了 就是卡大户
回复0
ZkProofPuddingvip
· 07-12 11:10
卷就完事了呗
回复0
资深毛衣爱好者vip
· 07-12 11:09
傻眼 连块卡都抢不到了
回复0
DeFiCaffeinatorvip
· 07-12 10:55
啥时候A卡大翻身啊…
回复0
0xSoullessvip
· 07-12 10:45
钞能力才是真生产力 老韭菜喂饱新韭菜
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)