This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AI大モデル時代:ネットワーク機器の需要爆発と投資機会分析
AI大模型時代におけるネットワークの重要な地位
大規模モデルの時代がネットワーク機器の需要の爆発を示し始めています。本記事では、なぜネットワークがAI時代の核心的要素となるのかを探討し、未来のネットワークにおける革新と投資機会について論じます。
ネットワーク需要の源
大規模モデル時代に入り、モデルのサイズと単一カードの上限の差が急速に拡大し、複数のサーバークラスタがトレーニング問題を解決するためのソリューションとなっています。ネットワークはデータの伝送だけでなく、GPU間のモデルパラメータの同期にも使用され、ネットワークの密度と容量に対する要求が高まっています。
巨大なモデルのサイズは意味します:
より大規模なデータとパラメータを追求する中で、計算効率を向上させることがトレーニング時間を短縮する鍵となります。そして、「デバイス数」を増やし「並列効率」を向上させることが、計算能力を直接決定します。
マルチカードの同期に関する複雑なコミュニケーション
大規模モデルの訓練中、モデルを単一のカードに分割した後、計算のたびに整合性を取る必要があります。All-to-Allなどの操作は一般的であり、ネットワークの転送と交換に対してより高い要求を提起します。
高価な故障コスト
大規模モデルのトレーニングは通常数ヶ月続き、途中で中断した場合は数日前の中断点に戻って再トレーニングする必要がある。ネットワークのある部分の障害や高遅延が中断を引き起こし、進捗の遅れや高コストをもたらす可能性がある。現代のAIネットワークは、人間のシステムエンジニアリング能力を試す結晶となっている。
ネットワーク革新の方向
ハードウェアは需要に応じて動き、世界の計算力投資規模は数百億ドルに達しています。"コスト削減"、"オープン"、および計算力のスケールのバランスがネットワーク革新の主要なテーマとなるでしょう。
通信メディアの交代
光、銅、シリコンは三大伝送媒体です。光モジュールはより高速なデータ転送を追求する一方で、LPO、LRO、シリコン光などのコスト削減の道にも取り組んでいます。銅ケーブルはコストパフォーマンスの優位性を活かしてラック内の接続を占めています。Chiplet、Wafer-scalingなどの新技術がシリコン基盤の相互接続の限界を加速的に探求しています。
ネットワークプロトコルの競争
片間通信プロトコルとグラフィックカードの強いバインディング、例えばNVIDIAのNV-LINKやAMDのInfinity Fabricなどが、単一ノードの能力の上限を決定します。IBとイーサネットの競争は、ノード間通信の主旋律です。
ネットワークアーキテクチャの変化
現在一般的に葉脊アーキテクチャが採用されていますが、ノード数が増えるにつれて、葉脊アーキテクチャは超大規模クラスターにおいてコストが高くなります。Dragonflyアーキテクチャやrail-onlyアーキテクチャなどは、次世代の超大規模クラスターに向けた進化の方向性として期待されています。
投資アドバイス
通信システムのコアリンク:Zhongji Innolight、Xin Yisheng、Tianfu Communication、Industrial Fortune Union、Invic、Shanghai Electric Co.、Ltd。
通信システムの革新:YOFC、Taichenguang、Yuanjie Technology、Centec Communications、Cambrian、Taclink。
リスク警告: AIの需要が予想を下回り、スケーリング法則が無効になり、業界競争が激化する可能性があります。