AI大模型时代:网络设备需求爆发与投资机遇分析

网络在AI大模型时代的关键地位

大模型时代已经开始显现网络设备需求的爆发。本文将探讨网络为何成为AI时代的核心环节,并讨论未来网络侧的创新与投资机会。

网络需求的来源

进入大模型时代,模型体积与单卡上限差距迅速拉大,多服务器集群成为解决训练问题的方案。网络不仅用于传输数据,更多用于同步显卡间的模型参数,对网络密度和容量提出更高要求。

庞大的模型体积意味着:

  1. 训练耗时 = 训练数据规模 × 模型参数量 / 计算速率
  2. 计算速率 = 单设备计算率 × 设备数 × 多设备并行效率

在追求更大规模数据和参数的同时,提升计算效率成为缩短训练时间的关键。而扩大"设备数"和提高"并行效率"直接决定了算力。

多卡同步的复杂沟通

大模型训练中,将模型切分至单卡后,每次计算后都需要进行对齐。All-to-All等操作较为常见,对网络传输和交换提出更高要求。

昂贵的故障成本

大模型训练往往持续数月,中断可能需要回到几天前的断点重新训练。网络某一环节的故障或高延迟都可能导致中断,带来进度落后和高昂成本。现代AI网络已成为考验人类系统工程能力的结晶。

网络创新的方向

硬件随需求而动,全球算力投资规模已达数百亿美元级。"降本"、"开放"和算力规模的平衡将是网络创新的主要议题。

通信介质的更迭

光、铜与硅是三大传输介质。光模块追求更高速率的同时,也开始LPO、LRO、硅光等降本之路。铜缆凭借性价比占领机柜内连接。Chiplet、Wafer-scaling等新技术加速探索硅基互联上限。

网络协议的竞争

片间通信协议与显卡强绑定,如英伟达NV-LINK、AMD Infinity Fabric等决定单节点能力上限。IB与以太网的竞争则是节点间通信的主旋律。

网络架构的变化

当前普遍采用叶脊架构,但随着节点数增多,叶脊架构在超大集群中成本较高。Dragonfly架构、rail-only架构等有望成为面向下一代超大集群的演进方向。

投资建议

通信系统核心环节:中际旭创、新易盛、天孚通信、工业富联、英维克、沪电股份。

通信系统创新环节:长飞光纤、太辰光、源杰科技、盛科通信、寒武纪、德科立。

风险提示:AI需求不及预期,Scaling law失效,行业竞争加剧

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 7
  • 分享
评论
0/400
大饼单日线研究者vip
· 07-11 16:33
集群才是真正核心
回复0
FortuneTeller42vip
· 07-10 20:33
网络就是根基
回复0
HashBrowniesvip
· 07-10 16:53
存储难题如何解
回复0
Layer3梦想家vip
· 07-09 14:22
从理论上讲,网络扩展瓶颈反映了L2状态同步的挑战。正如跨Rollup通信需要优化的桥接协议,AI模型训练也需要跨GPU集群的复杂参数同步。这种平行表明区块链互操作性解决方案与AI网络架构之间的潜在融合。
查看原文回复0
LayerHoppervip
· 07-09 14:16
网卡性能是瓶颈了
回复0
地板价梦魇vip
· 07-09 14:14
带宽要求越来越高
回复0
defi_detectivevip
· 07-09 14:02
网络确实是瓶颈
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)