Эра больших моделей ИИ: анализ взрывного роста спроса на сетевое оборудование и инвестиционных возможностей

Ключевая роль сети в эпоху больших моделей ИИ

Эра больших моделей уже начала проявлять взрывной спрос на сетевые устройства. В этой статье будет рассмотрено, почему сеть стала核心环节 эпохи ИИ, а также обсуждены инновации и инвестиционные возможности в области сетей в будущем.

Источник сетевого спроса

В эпоху больших моделей объем моделей и пределы одной карты быстро увеличиваются, кластеры из нескольких серверов становятся решением для проблем обучения. Сеть используется не только для передачи данных, но и в большей степени для синхронизации параметров моделей между графическими картами, что предъявляет более высокие требования к плотности и ёмкости сети.

Огромный объем модели означает:

  1. Время тренировки = Объем тренировочных данных × Количество параметров модели / Скорость вычислений
  2. Скорость вычислений = вычислительная мощность одного устройства × количество устройств × эффективность параллельной работы нескольких устройств

При стремлении к более крупным масштабам данных и параметров повышение вычислительной эффективности становится ключом к сокращению времени обучения. Расширение "числа устройств" и повышение "параллельной эффективности" напрямую определяют вычислительную мощность.

Сложная коммуникация с многокартами

Во время обучения больших моделей, после разделения модели на одну карту, необходимо выполнять выравнивание после каждого вычисления. Операции All-to-All и подобные являются довольно распространенными и предъявляют более высокие требования к сетевой передаче и обмену.

Дорогие затраты на сбой

Обучение больших моделей часто продолжается несколько месяцев, и прерывание может потребовать возврата к точке остановки несколько дней назад для повторного обучения. Сбой или высокая задержка на каком-либо этапе сети могут привести к прерыванию, что вызывает отставание в прогрессе и высокие затраты. Современные AI-сети стали проверкой инженерных способностей человека.

Направление сетевых инноваций

Аппаратное обеспечение движется в соответствии с требованиями, глобальные инвестиции в вычислительные мощности достигли сотен миллиардов долларов. "Снижение затрат", "открытость" и баланс масштабов вычислительных мощностей будут основными темами сетевых инноваций.

Смена коммуникационных сред

Свет, медь и кремний являются тремя основными средами передачи. Оптические модули стремятся к более высокой скорости, одновременно начиная путь снижения затрат, такой как LPO, LRO, кремниевый свет и т. д. Медь занимает рынок подключения в шкафах благодаря своей рентабельности. Новые технологии, такие как Chiplet, Wafer-scaling, ускоряют исследование пределов кремниевых соединений.

Конкуренция сетевых протоколов

Протоколы связи между узлами и сильная привязка к видеокартам, такие как NVIDIA NV-LINK и AMD Infinity Fabric, определяют верхний предел возможностей одного узла. Конкуренция между IB и Ethernet является главной мелодией связи между узлами.

Изменение сетевой архитектуры

В настоящее время широко используется архитектура Leaf Spine, но с увеличением числа узлов стоимость архитектуры Leaf Spine в сверхбольших кластерах становится высокой. Архитектуры Dragonfly, rail-only и другие могут стать эволюционным направлением для следующего поколения сверхбольших кластеров.

Инвестиционные рекомендации

Основное звено системы связи: Zhongji Innolight, Xin Yisheng, Tianfu Communication, Industrial Fortune Union, Invic, Shanghai Electric Co., Ltd.

Инновации в системах связи: YOFC, Taichenguang, Yuanjie Technology, Centec Communications, Cambrian, Taclink.

Предупреждение о рисках: Спрос на ИИ ниже ожиданий, закон масштабирования не работает, конкуренция в отрасли усиливается

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • 6
  • Поделиться
комментарий
0/400
FortuneTeller42vip
· 11ч назад
Сеть — это основа
Посмотреть ОригиналОтветить0
HashBrowniesvip
· 14ч назад
Как решить проблему хранения
Посмотреть ОригиналОтветить0
Layer3Dreamervip
· 07-09 14:22
Теоретически говоря, узкое место масштабирования сети отражает проблемы синхронизации состояния L2. Так же как связь между роллапами требует оптимизированных протоколов моста, обучение моделей ИИ требует сложной синхронизации параметров между кластерами GPU. Этот параллел подсказывает потенциальное сближение между решениями по интероперабельности блокчейна и архитектурой сетей ИИ.
Посмотреть ОригиналОтветить0
LayerHoppervip
· 07-09 14:16
Производительность сетевой карты стала узким местом.
Посмотреть ОригиналОтветить0
FloorPriceNightmarevip
· 07-09 14:14
Требования к пропускной способности становятся все выше.
Посмотреть ОригиналОтветить0
defi_detectivevip
· 07-09 14:02
Сеть действительно является узким местом
Посмотреть ОригиналОтветить0
  • Закрепить