Ера великих моделей вже почала проявляти вибуховий попит на мережеві пристрої. У цій статті ми розглянемо, чому мережа стала центральним елементом ери ШІ, та обговоримо майбутні інновації та інвестиційні можливості в мережевій сфері.
Джерела мережевих вимог
Входячи в епоху великих моделей, різниця між обсягом моделі та обмеженням однієї карти швидко збільшується, кластери з кількох серверів стають рішенням для проблеми навчання. Мережа використовується не лише для передачі даних, але й для синхронізації параметрів моделей між графічними картами, що висуває вищі вимоги до щільності та ємності мережі.
Великий обсяг моделі означає:
Час тренування = Обсяг навчальних даних × Кількість параметрів моделі / Швидкість обчислень
Швидкість обчислення = Швидкість обчислення одного пристрою × Кількість пристроїв × Ефективність паралельної роботи декількох пристроїв
Під час прагнення до більших обсягів даних і параметрів підвищення обчислювальної ефективності стає ключем до скорочення часу навчання. Розширення "кількості пристроїв" та підвищення "паралельної ефективності" безпосередньо визначають обчислювальну потужність.
Складна комунікація з багатьма картами
Під час навчання великої моделі, після розділення моделі на одну картку, після кожного обчислення потрібно виконувати вирівнювання. Операції типу All-to-All є досить поширеними і висувають вищі вимоги до мережевої передачі та обміну.
Висока вартість збоїв
Навчання великих моделей часто триває кілька місяців, і перерва може вимагати повернення до точки зупинки кілька днів тому для повторного навчання. Збої або висока затримка в будь-якому з етапів мережі можуть призвести до перерви, затримки в прогресі та високих витрат. Сучасні AI-мережі стали випробуванням для здібностей людської системної інженерії.
Напрямки мережевих інновацій
Апаратура рухається відповідно до потреб, світові інвестиції в обчислювальну потужність досягли кількох сотень мільярдів доларів. «Зниження витрат», «відкритість» та баланс обчислювальної потужності стануть основними темами інновацій у мережі.
Зміна комунікаційних засобів
Світло, мідь та кремній є трьома основними середовищами передачі. Оптичні модулі прагнуть до вищих швидкостей, одночасно починаючи шляхи зниження витрат, такі як LPO, LRO, кремнієва оптика тощо. Мідні кабелі займають позицію в підключенні в шафах завдяки співвідношенню ціни та якості. Нові технології, такі як Chiplet, Wafer-scaling, прискорюють дослідження меж кремнієвих з'єднань.
Конкуренція мережевих протоколів
Протоколи зв'язку між платами та сильна прив'язка до графічних процесорів, такі як NVIDIA NV-LINK, AMD Infinity Fabric тощо, визначають максимально можливу потужність одного вузла. Конкуренція між IB та Ethernet є основною темою комунікації між вузлами.
Зміни в мережевій архітектурі
В даний час загально прийнято використовувати архітектуру Leaf Spine, але з ростом кількості вузлів витрати на архітектуру Leaf Spine у надвеликому кластері є досить високими. Архітектура Dragonfly, архітектура лише для рейок та інші можуть стати еволюційними напрямками для наступного покоління надвеликих кластерів.
Інвестиційні поради
Основна ланка системи зв'язку: Zhongji Innolight, Xin Yisheng, Tianfu Communication, Industrial Fortune Union, Invic, Shanghai Electric Co., Ltd.
Інновації в системах зв'язку: YOFC, Taichenguang, Yuanjie Technology, Centec Communications, Cambrian, Taclink.
Попередження про ризики: Попит на ШІ не відповідає очікуванням, закон масштабування втрачає дію, посилюється конкуренція в галузі.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
15 лайків
Нагородити
15
7
Поділіться
Прокоментувати
0/400
BtcDailyResearcher
· 07-11 16:33
Кластер є справжнім ядром
Переглянути оригіналвідповісти на0
FortuneTeller42
· 07-10 20:33
Мережа є основою
Переглянути оригіналвідповісти на0
HashBrownies
· 07-10 16:53
Як вирішити проблему зберігання?
Переглянути оригіналвідповісти на0
Layer3Dreamer
· 07-09 14:22
Теоретично кажучи, вузьке місце масштабування мережі відображає проблеми синхронізації стану L2. Так само, як комунікація між роллапами вимагає оптимізованих мостових протоколів, навчання моделей ШІ вимагає складної синхронізації параметрів між кластерами GPU. Ця паралель свідчить про потенційне зближення між рішеннями для інтероперабельності блокчейнів та архітектурою мереж ШІ.
Переглянути оригіналвідповісти на0
LayerHopper
· 07-09 14:16
Продуктивність мережевої карти стала вузьким місцем.
Епоха великих моделей штучного інтелекту: аналіз сплеску попиту на мережеві пристрої та інвестиційних можливостей
Ключова роль мережі в епоху великих моделей ШІ
Ера великих моделей вже почала проявляти вибуховий попит на мережеві пристрої. У цій статті ми розглянемо, чому мережа стала центральним елементом ери ШІ, та обговоримо майбутні інновації та інвестиційні можливості в мережевій сфері.
Джерела мережевих вимог
Входячи в епоху великих моделей, різниця між обсягом моделі та обмеженням однієї карти швидко збільшується, кластери з кількох серверів стають рішенням для проблеми навчання. Мережа використовується не лише для передачі даних, але й для синхронізації параметрів моделей між графічними картами, що висуває вищі вимоги до щільності та ємності мережі.
Великий обсяг моделі означає:
Під час прагнення до більших обсягів даних і параметрів підвищення обчислювальної ефективності стає ключем до скорочення часу навчання. Розширення "кількості пристроїв" та підвищення "паралельної ефективності" безпосередньо визначають обчислювальну потужність.
Складна комунікація з багатьма картами
Під час навчання великої моделі, після розділення моделі на одну картку, після кожного обчислення потрібно виконувати вирівнювання. Операції типу All-to-All є досить поширеними і висувають вищі вимоги до мережевої передачі та обміну.
Висока вартість збоїв
Навчання великих моделей часто триває кілька місяців, і перерва може вимагати повернення до точки зупинки кілька днів тому для повторного навчання. Збої або висока затримка в будь-якому з етапів мережі можуть призвести до перерви, затримки в прогресі та високих витрат. Сучасні AI-мережі стали випробуванням для здібностей людської системної інженерії.
Напрямки мережевих інновацій
Апаратура рухається відповідно до потреб, світові інвестиції в обчислювальну потужність досягли кількох сотень мільярдів доларів. «Зниження витрат», «відкритість» та баланс обчислювальної потужності стануть основними темами інновацій у мережі.
Зміна комунікаційних засобів
Світло, мідь та кремній є трьома основними середовищами передачі. Оптичні модулі прагнуть до вищих швидкостей, одночасно починаючи шляхи зниження витрат, такі як LPO, LRO, кремнієва оптика тощо. Мідні кабелі займають позицію в підключенні в шафах завдяки співвідношенню ціни та якості. Нові технології, такі як Chiplet, Wafer-scaling, прискорюють дослідження меж кремнієвих з'єднань.
Конкуренція мережевих протоколів
Протоколи зв'язку між платами та сильна прив'язка до графічних процесорів, такі як NVIDIA NV-LINK, AMD Infinity Fabric тощо, визначають максимально можливу потужність одного вузла. Конкуренція між IB та Ethernet є основною темою комунікації між вузлами.
Зміни в мережевій архітектурі
В даний час загально прийнято використовувати архітектуру Leaf Spine, але з ростом кількості вузлів витрати на архітектуру Leaf Spine у надвеликому кластері є досить високими. Архітектура Dragonfly, архітектура лише для рейок та інші можуть стати еволюційними напрямками для наступного покоління надвеликих кластерів.
Інвестиційні поради
Основна ланка системи зв'язку: Zhongji Innolight, Xin Yisheng, Tianfu Communication, Industrial Fortune Union, Invic, Shanghai Electric Co., Ltd.
Інновації в системах зв'язку: YOFC, Taichenguang, Yuanjie Technology, Centec Communications, Cambrian, Taclink.
Попередження про ризики: Попит на ШІ не відповідає очікуванням, закон масштабування втрачає дію, посилюється конкуренція в галузі.