大模型時代:算力短缺挑戰與企業應對策略

robot
摘要生成中

算力資源緊缺下的大模型之戰

大模型熱潮的興起使算力成爲新的商業模式。然而,行業面臨高端GPU短缺和成本高昂的挑戰。雖然這股熱潮終將退去,算力服務商需未雨綢繆,及時轉型。

算力缺口有多大?

高端GPU供不應求已成行業公認的難題。頂峯時期,一張英偉達A100的價格被炒至20-30萬元,單臺A100服務器月租也達到5-7萬元。即便如此,有時仍難以獲得芯片。一些算力供應商甚至遇到供應商爽約的情況。

雲計算行業高管周立軍表示,盡管客戶對高端GPU資源需求旺盛,但目前供給仍無法完全滿足市場需求。

業內人士估計,目前市場總GPU數量約爲10萬張,各家爭相囤積"貨"以判斷市場份額。有消息稱,某公司年底保有量可能達4萬張,佔20%市場份額。

訓練大模型成本高昂。以盤古氣象大模型爲例,僅訓練成本就超過200萬元。對於參數更大的通用大模型,成本可能是這個數字的10-100倍。騰訊集團副總裁邱躍鵬透露,沒有數十億資金投入,很難持續開發大模型。

企業如何應對?

面對算力短缺,企業採取多種策略:

  1. 使用高質量數據提升訓練效率
  2. 優化基礎設施,實現千卡級穩定運行
  3. 改進算力調度,提高資源利用率
  4. 從雲計算過渡到超算架構降低成本
  5. 使用國產平台替代英偉達GPU

中小企業難以自建數據中心,多選擇專業算力服務商。千卡級GPU集羣才有規模效應,選擇服務商可降低邊際成本。

算力服務新模式

算力服務成爲新興產業,包括通用算力、智能算力和超算算力。它不僅提供算力,還整合存儲、網路等資源,以API形式交付服務。

算力產業鏈分爲三層:

  • 上遊:基礎資源供應商(如英偉達)
  • 中遊:雲服務商、算力服務提供商
  • 下遊:行業用戶

大模型企業主要通過三種方式使用算力:API調用、自建小模型、與雲廠商合作。

商業模式演進

目前主流計費模式包括按量計費和包年包月。用戶可選擇GPU實例或MaaS平台服務。

行業正推進"算網一體化",實現跨架構、跨地域、跨服務商的資源調度。雲服務商也將算力服務作爲獨特產品。

2022年中國算力總規模達180EFLOPS,產業規模達1.8萬億元。大模型加速了算力產業發展。

有觀點認爲,當前算力服務類似新型"賣電"模式,但可能需要提供更多系統優化和運維服務。

隨着需求常態化,算力服務形成獨特產業鏈和商業模式。當前主要競爭點在於供應鏈獲取GPU能力。然而,長期研究者往往選擇等待,主要是創業公司在搶奪資源。

未來算力服務趨勢明確,服務商需未雨綢繆,爲市場變化做好準備。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 5
  • 分享
留言
0/400
Fren_Not_Foodvip
· 13小時前
玩明白了 就是卡大户
回復0
ZkProofPuddingvip
· 07-12 11:10
卷就完事了呗
回復0
资深毛衣爱好者vip
· 07-12 11:09
傻眼 连块卡都抢不到了
回復0
DeFiCaffeinatorvip
· 07-12 10:55
啥时候A卡大翻身啊…
回復0
0xSoullessvip
· 07-12 10:45
钞能力才是真生产力 老韭菜喂饱新韭菜
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)