Епоха великих моделей: виклики нестачі обчислювальної потужності та стратегії реагування підприємств

robot
Генерація анотацій у процесі

Війна великих моделей за обчислювальну потужність в умовах дефіциту ресурсів

Поява великих моделей сприяла тому, що обчислювальна потужність стала новою бізнес-моделлю. Однак галузь стикається з викликами нестачі висококласних GPU та високими витратами. Хоча цей бум зрештою згасне, постачальникам обчислювальної потужності потрібно заздалегідь підготуватися та вчасно змінити напрямок.

Який розмір дефіциту обчислювальної потужності?

Високоякісні GPU стали визнаною проблемою в галузі через їхній дефіцит. У піковий період ціна на одну картку NVIDIA A100 зросла до 200-300 тисяч юанів, а місячна орендна плата за сервер A100 досягла 50-70 тисяч юанів. Навіть при цьому, іноді все ще важко отримати чіпи. Деякі постачальники обчислювальної потужності навіть зустрілися з ситуацією, коли постачальники не виконали свої зобов'язання.

Генеральний директор галузі хмарних обчислень Чжоу Ліцзюнь заявив, що незважаючи на високий попит клієнтів на ресурси висококласних GPU, наразі пропозиція все ще не може повністю задовольнити ринковий попит.

Експерти оцінюють, що наразі загальна кількість GPU на ринку становить близько 100 тисяч одиниць, компанії змагаються за накопичення "товару" для оцінки частки на ринку. Є повідомлення, що одна компанія може зберігати до 40 тисяч одиниць до кінця року, що становитиме 20% частки на ринку.

Витрати на навчання великих моделей є високими. Наприклад, вартість навчання моделі Паньгу перевищує 2 мільйони юанів. Для ще більших універсальних моделей вартість може бути в 10-100 разів більшою за цю цифру. Віце-президент групи Tencent Цю Юепенг повідомив, що без інвестицій у десятки мільярдів важко продовжувати розробку великих моделей.

Як підприємствам реагувати?

Перед обличчям нестачі обчислювальної потужності підприємства вживають різноманітні стратегії:

  1. Використання високоякісних даних для підвищення ефективності навчання
  2. Оптимізація інфраструктури, досягнення стабільної роботи на рівні тисячі калорій
  3. Покращення обчислювальної потужності, підвищення ефективності використання ресурсів
  4. Перехід від хмарних обчислень до архітектури надпотужних обчислень знижує витрати
  5. Використання вітчизняної платформи замість GPU від NVIDIA

Малі та середні підприємства стикаються з труднощами у створенні власних дата-центрів, тому обирають професійних постачальників обчислювальної потужності. Групи GPU рівня тисячі калорій мають масштабний ефект, вибір постачальника може знизити граничні витрати.

Обчислювальна потужність сервісу нова модель

Обчислювальна потужність служби стала новою галуззю, включаючи загальну обчислювальну потужність, інтелектуальну обчислювальну потужність та надпотужну обчислювальну потужність. Вона не лише надає обчислювальну потужність, а й інтегрує зберігання, мережу та інші ресурси, щоб надавати послуги у формі API.

Обчислювальна потужність промисловий ланцюг ділиться на три рівні:

  • Виробники: постачальники базових ресурсів (, такі як NVIDIA )
  • Середній рівень: постачальники хмарних послуг, постачальники обчислювальної потужності
  • Вниз за течією: галузеві користувачі

Великі моделі підприємства в основному використовують обчислювальну потужність трьома способами: виклики API, створення малих моделей самостійно, співпраця з постачальниками хмарних послуг.

Еволюція бізнес-моделі

Наразі основні моделі оплати включають оплату за обсяги та річну або місячну підписку. Користувачі можуть вибрати GPU-екземпляри або послуги платформи MaaS.

Індустрія просуває "інтеграцію обчислювальної потужності та мережі", реалізуючи ресурсне планування між архітектурами, регіонами та постачальниками послуг. Хмарні провайдери також вважають обчислювальну потужність унікальним продуктом.

У 2022 році загальний обсяг обчислювальної потужності Китаю досяг 180 EFLOPS, а обсяг промисловості становив 1,8 трильйона юанів. Великі моделі прискорили розвиток індустрії обчислювальної потужності.

Існує думка, що поточні послуги обчислювальної потужності подібні до нового типу "продажу електроенергії", але, можливо, потрібно надати більше послуг з оптимізації системи та експлуатаційного обслуговування.

З огляду на нормалізацію попиту, обчислювальна потужність сформувала унікальну промислову ланцюг та бізнес-модель. Наразі основні конкуренційні переваги полягають у здобутті можливостей GPU в рамках постачальницького ланцюга. Проте, довгострокові дослідники зазвичай обирають чекати, оскільки стартапи змагаються за ресурси.

Майбутні тенденції обчислювальної потужності чітко визначені, постачальники послуг повинні заздалегідь підготуватись до змін на ринку.

Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • 5
  • Поділіться
Прокоментувати
0/400
Fren_Not_Foodvip
· 15год тому
Зрозуміти, означає, що це картка великих інвесторів
Переглянути оригіналвідповісти на0
ZkProofPuddingvip
· 07-12 11:10
Просто завершуйте справу.
Переглянути оригіналвідповісти на0
AirdropSweaterFanvip
· 07-12 11:09
В шоці, навіть картку не вдалося отримати.
Переглянути оригіналвідповісти на0
DeFiCaffeinatorvip
· 07-12 10:55
Коли A-карта знову стане популярною...
Переглянути оригіналвідповісти на0
0xSoullessvip
· 07-12 10:45
Грошова здатність — це справжня продуктивність. Старі невдахи годують нових невдах.
Переглянути оригіналвідповісти на0
  • Закріпити