AI大模型時代:網路設備需求爆發與投資機遇分析

網路在AI大模型時代的關鍵地位

大模型時代已經開始顯現網路設備需求的爆發。本文將探討網路爲何成爲AI時代的核心環節,並討論未來網路側的創新與投資機會。

網路需求的來源

進入大模型時代,模型體積與單卡上限差距迅速拉大,多服務器集羣成爲解決訓練問題的方案。網路不僅用於傳輸數據,更多用於同步顯卡間的模型參數,對網路密度和容量提出更高要求。

龐大的模型體積意味着:

  1. 訓練耗時 = 訓練數據規模 × 模型參數量 / 計算速率
  2. 計算速率 = 單設備計算率 × 設備數 × 多設備並行效率

在追求更大規模數據和參數的同時,提升計算效率成爲縮短訓練時間的關鍵。而擴大"設備數"和提高"並行效率"直接決定了算力。

多卡同步的復雜溝通

大模型訓練中,將模型切分至單卡後,每次計算後都需要進行對齊。All-to-All等操作較爲常見,對網路傳輸和交換提出更高要求。

昂貴的故障成本

大模型訓練往往持續數月,中斷可能需要回到幾天前的斷點重新訓練。網路某一環節的故障或高延遲都可能導致中斷,帶來進度落後和高昂成本。現代AI網路已成爲考驗人類系統工程能力的結晶。

網路創新的方向

硬件隨需求而動,全球算力投資規模已達數百億美元級。"降本"、"開放"和算力規模的平衡將是網路創新的主要議題。

通信介質的更迭

光、銅與硅是三大傳輸介質。光模塊追求更高速率的同時,也開始LPO、LRO、硅光等降本之路。銅纜憑藉性價比佔領機櫃內連接。Chiplet、Wafer-scaling等新技術加速探索硅基互聯上限。

網路協議的競爭

片間通信協議與顯卡強綁定,如英偉達NV-LINK、AMD Infinity Fabric等決定單節點能力上限。IB與以太網的競爭則是節點間通信的主旋律。

網路架構的變化

當前普遍採用葉脊架構,但隨着節點數增多,葉脊架構在超大集羣中成本較高。Dragonfly架構、rail-only架構等有望成爲面向下一代超大集羣的演進方向。

投資建議

通信系統核心環節:中際旭創、新易盛、天孚通信、工業富聯、英維克、滬電股份。

通信系統創新環節:長飛光纖、太辰光、源傑科技、盛科通信、寒武紀、德科立。

風險提示:AI需求不及預期,Scaling law失效,行業競爭加劇

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 7
  • 分享
留言
0/400
大饼单日线研究者vip
· 16小時前
集群才是真正核心
回復0
FortuneTeller42vip
· 07-10 20:33
网络就是根基
回復0
HashBrowniesvip
· 07-10 16:53
存储难题如何解
回復0
Layer3梦想家vip
· 07-09 14:22
从理论上讲,网络扩展瓶颈反映了L2状态同步的挑战。正如跨Rollup通信需要优化的桥接协议,AI模型训练也需要跨GPU集群的复杂参数同步。这种平行表明区块链互操作性解决方案与AI网络架构之间的潜在融合。
查看原文回復0
LayerHoppervip
· 07-09 14:16
网卡性能是瓶颈了
回復0
地板价梦魇vip
· 07-09 14:14
带宽要求越来越高
回復0
defi_detectivevip
· 07-09 14:02
网络确实是瓶颈
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)