Епоха великих моделей ШІ: Підйом Transformer та битва ста моделей
Минулого місяця в світі штучного інтелекту розгорілася "війна тварин". З одного боку - Llama (лама) від Meta, з іншого - великий модель Falcon (сокол). Ці дві моделі змагалися на рейтингу відкритих LLM, по черзі займаючи перші місця.
Цікаво, що розробники Falcon не є технологічними гігантами, а є дослідницьким інститутом з ОАЕ. Представники країни заявили, що вони беруть участь у змаганні з штучного інтелекту, щоб "підривати основних гравців". Тепер, якщо є достатньо фінансових ресурсів, практично всі країни та компанії створюють свої великі мовні моделі.
За цим «Битвою моделей» стоїть алгоритм Transformer, випущений Google у 2017 році. Він вирішив проблему розуміння машиной довгих текстів, перетворивши великі моделі з теоретичних досліджень на інженерні завдання. Сьогодні, чи то GPT, чи інші моделі, всі вони базуються на основі Transformer.
Поява Transformer значно знизила бар'єри для розробки ШІ. Якщо є достатня обчислювальна потужність і дані, будь-яка компанія може навчити велику модель. Це також призвело до нинішньої ситуації, коли існує безліч різних рішень - за статистикою, кількість великих моделей у Китаї вже перевищила США і становить 130.
Однак, чи зможе хтось стати гігантом в епоху ШІ, залежить не просто від накопичення параметрів. Успіх Llama від Meta полягає в активній спільноті розробників. А GPT-4 випереджає всіх завдяки потужній науковій базі OpenAI.
На сьогоднішній день найбільшим викликом, з яким стикається індустрія великих моделей, є проблема прибутковості. Високі витрати на обчислення призводять до серйозних збитків багатьох компаній у сфері ШІ. За оцінками, загальні інвестиції в інфраструктуру в галузі можуть перевищувати доходи на 125 мільярдів доларів США щорічно.
Отже, майбутня конкуренція, можливо, полягатиме не в тому, у кого більше параметрів моделі, а в тому, хто зможе знайти відповідну бізнес-модель, яка справді перетворить AI на продуктивність. Як успіх iPhone 4 полягав не в процесорі, а в багатому екосистемі застосувань, переможцями в AI-індустрії, ймовірно, стануть ті компанії, які зможуть запропонувати практичні рішення.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
18 лайків
Нагородити
18
5
Поділіться
Прокоментувати
0/400
StealthMoon
· 07-14 19:49
Що це за зоопарк?
Переглянути оригіналвідповісти на0
SleepTrader
· 07-14 19:46
про всі конкурують в AI, хто більше заробить.
Переглянути оригіналвідповісти на0
LiquidationAlert
· 07-14 19:39
Навіть локшина швидкого приготування може називатися AI моделлю, наскільки це ново.
Переглянути оригіналвідповісти на0
ZKProofEnthusiast
· 07-14 19:38
Зараз потрібно порівнювати обчислювальну потужність і фінансові ресурси.
Transformer веде еру великих моделей ШІ: Битва багатьох моделей на підйомі.
Епоха великих моделей ШІ: Підйом Transformer та битва ста моделей
Минулого місяця в світі штучного інтелекту розгорілася "війна тварин". З одного боку - Llama (лама) від Meta, з іншого - великий модель Falcon (сокол). Ці дві моделі змагалися на рейтингу відкритих LLM, по черзі займаючи перші місця.
Цікаво, що розробники Falcon не є технологічними гігантами, а є дослідницьким інститутом з ОАЕ. Представники країни заявили, що вони беруть участь у змаганні з штучного інтелекту, щоб "підривати основних гравців". Тепер, якщо є достатньо фінансових ресурсів, практично всі країни та компанії створюють свої великі мовні моделі.
За цим «Битвою моделей» стоїть алгоритм Transformer, випущений Google у 2017 році. Він вирішив проблему розуміння машиной довгих текстів, перетворивши великі моделі з теоретичних досліджень на інженерні завдання. Сьогодні, чи то GPT, чи інші моделі, всі вони базуються на основі Transformer.
Поява Transformer значно знизила бар'єри для розробки ШІ. Якщо є достатня обчислювальна потужність і дані, будь-яка компанія може навчити велику модель. Це також призвело до нинішньої ситуації, коли існує безліч різних рішень - за статистикою, кількість великих моделей у Китаї вже перевищила США і становить 130.
Однак, чи зможе хтось стати гігантом в епоху ШІ, залежить не просто від накопичення параметрів. Успіх Llama від Meta полягає в активній спільноті розробників. А GPT-4 випереджає всіх завдяки потужній науковій базі OpenAI.
На сьогоднішній день найбільшим викликом, з яким стикається індустрія великих моделей, є проблема прибутковості. Високі витрати на обчислення призводять до серйозних збитків багатьох компаній у сфері ШІ. За оцінками, загальні інвестиції в інфраструктуру в галузі можуть перевищувати доходи на 125 мільярдів доларів США щорічно.
Отже, майбутня конкуренція, можливо, полягатиме не в тому, у кого більше параметрів моделі, а в тому, хто зможе знайти відповідну бізнес-модель, яка справді перетворить AI на продуктивність. Як успіх iPhone 4 полягав не в процесорі, а в багатому екосистемі застосувань, переможцями в AI-індустрії, ймовірно, стануть ті компанії, які зможуть запропонувати практичні рішення.