Хвиля штучного інтелекту охоплює світ, DeepSeek вирізняється та викликає хвилювання на ринку
Нещодавно в сфері ШІ сталася помітна подія. Китайська AI велика модель під назвою DeepSeek вперше перевищила завантаження ChatGPT в американському App Store і зайняла перше місце. Це явище не тільки привернуло широку увагу світової технологічної, інвестиційної та медійної спільноти, але й викликало короткочасний панічний настрій на американському фондовому ринку.
У результаті цього акції багатьох технологічних гігантів впали на різні відсотки. Акції NVIDIA знизилися на 5,3%, ARM - на 5,5%, Broadcom - на 4,9%, а TSMC - на 4,5%. Інші компанії, такі як Micron, AMD, Intel також зазнали відповідних знижень. Ф'ючерси на Nasdaq 100 впали до -400 пунктів, що може стати найбільшим одноденним падінням з 18 грудня. За неповними даними, ринкова вартість акцій у США могла зменшитися на понад 1 трильйон доларів під час торгів у понеділок, що дорівнює третині загальної ринкової капіталізації криптовалют.
Ринок криптовалют також не зміг уникнути цієї хвилі спадного тренду. Ціна біткоїна впала нижче 100500 доларів, за 24 години зниження склало 4,48%. Ефір впав нижче 3200 доларів, за 24 години зниження склало 3,83%. Багато інвесторів вважають цю раптову волатильність ринку заплутаною, деякі вважають, що це може бути пов'язано зі зниженням очікувань щодо зниження процентних ставок Федеральної резервної системи або з іншими макрофакторами.
Зростання DeepSeek викликало переосмислення моделей розвитку ШІ. На відміну від компаній OpenAI, Meta та інших, DeepSeek не розвивався на основі потужного капіталу та значних апаратних ресурсів. У порівнянні, OpenAI була заснована 10 років тому, має 4500 працівників і залучила 6,6 мільярда доларів фінансування. Одна соціальна медіа-компанія витратила 60 мільярдів доларів на розробку AI-центру даних, розміром з Манхеттен. У той же час, DeepSeek існує менше 2 років, має лише 200 працівників, витрати на розробку менше 10 мільйонів доларів і не закуповував велику кількість дорогих GPU.
Ця контрастність змушує представників галузі запитувати: як традиційні технологічні гіганти можуть конкурувати з DeepSeek? Успіх DeepSeek не тільки відображає переваги в капіталі та технологіях, але й руйнує усталені уявлення про розвиток ШІ.
Віце-президент з продуктів відомої технологічної компанії прокоментував у соціальних мережах, що історія DeepSeek відображає типовий приклад руйнівних інновацій. Існуючі компанії оптимізують існуючі процеси, тоді як руйнівники переосмислюють основні підходи. DeepSeek висунув нову ідею: що було б, якби ми робили це розумніше, а не просто витрачали більше обладнання?
Наразі витрати на навчання провідних AI великих моделей є надзвичайно високими. Деякі провідні AI компанії витрачають на обчислення понад 100 мільйонів доларів, потребуючи великих дата-центрів, оснащених тисячами графічних процесорів (GPU) вартістю по 40 тисяч доларів. Однак DeepSeek запропонував вражаюче рішення: виконати це завдання за 5 мільйонів доларів. Ще більш вражаючим є те, що вони не тільки висунули цю ідею, але й справді реалізували її. Їхня модель в багатьох завданнях порівнянна або навіть перевершує провідні AI системи в галузі.
Успіх DeepSeek зумовлений тим, що вони переосмислили все з нуля. Традиційні моделі ШІ використовують 32-бітні дроби для представлення кожного числа, тоді як DeepSeek намагається використовувати 8-бітні дроби і виявляє, що точності все ще достатньо. Це змінює вимоги до пам'яті на 75%. В результаті, вартість навчання знижена з 100 мільйонів доларів до 5 мільйонів доларів, кількість необхідних GPU зменшилася з 100 тисяч до 2000, а вартість API зменшилася на 95%. Ще важливіше, що їхня модель може працювати на звичайних ігрових GPU без спеціалізованого апаратного забезпечення в дата-центрах.
Успіх DeepSeek кидає виклик кільком традиційним уявленням у сфері ШІ, включаючи те, що Китай може лише створювати закритий вихідний код, абсолютну перевагу Силіконової долини в галузі ШІ та те, що для розробки топових моделей ШІ потрібні величезні інвестиції. Ці погляди, навіть якщо не були повністю спростовані, зазнали серйозних коливань.
Відомий американський інвестиційний фонд у своїй доповіді оцінив DeepSeek, зазначивши, що це є перемогою відкритого коду над закритим. Внески відкритого спільноти можуть швидко перетворитися на процвітання всього екосистеми. Водночас, вони також вважають, що шлях розвитку традиційних компаній штучного інтелекту, хоча й виглядає простим і примітивним, не виключає появи нових якісних змін після досягнення певного масштабу. З огляду на розвиток AI за останні 70 років, обчислювальна потужність все ще залишається надзвичайно важливою, і це може залишатися вірним у майбутньому.
Поява DeepSeek дозволила відкритим моделям досягти рівня, аналогічного закритим моделям, а в деяких випадках навіть перевершити їх за ефективністю. Це зменшило необхідність для компаній купувати комерційні API штучного інтелекту, забезпечивши більш широкий простір для розвитку downstream додатків. Очікується, що в найближчі один-два роки ми станемо свідками більш різноманітних продуктів для обробки даних і більш розвиненої екосистеми застосувань великих мовних моделей.
Незважаючи на те, що DeepSeek демонструє високу ефективність, експерти вважають, що попит на обчислювальну потужність не зменшиться. Це відповідає парадоксу Джевонса в економіці, згідно з яким підвищення технологічної ефективності навпаки призводить до збільшення загального споживання ресурсів. Як і в процесі поширення від "дядька" до мобільних телефонів Nokia, саме завдяки зниженню витрат стало можливим їхнє поширення, а поширення, в свою чергу, призвело до збільшення загального обсягу споживання на ринку.
Цей важливий прорив у технологіях штучного інтелекту безумовно матиме глибокий вплив на глобальну технологічну структуру і також надає нові ідеї для майбутнього розвитку штучного інтелекту. У міру постійного розвитку технологій ми очікуємо побачити більше інновацій та проривів, які сприятимуть розвитку сфери штучного інтелекту у більш ефективному та доступному напрямку.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
14 лайків
Нагородити
14
7
Поділіться
Прокоментувати
0/400
ContractFreelancer
· 7год тому
GPT тепер приречений
Переглянути оригіналвідповісти на0
LuckyBlindCat
· 7год тому
Влучили в больову точку великої компанії
Переглянути оригіналвідповісти на0
WhaleStalker
· 7год тому
Відкритий вихідний код才是正道啊!
Переглянути оригіналвідповісти на0
BankruptcyArtist
· 8год тому
Знову хтось, хто намагається привернути увагу.
Переглянути оригіналвідповісти на0
LightningLady
· 8год тому
Не вірю, що таке можливо.
Переглянути оригіналвідповісти на0
BlockchainDecoder
· 8год тому
З точки зору теорії архітектури ШІ,突破点 DeepSeek полягає в оптимізації базових алгоритмів, посилаючись на дані статей конференції AAAI 2023.
DeepSeek прориває технологічні бар'єри ШІ, викликаючи коливання на американському ринку акцій
Хвиля штучного інтелекту охоплює світ, DeepSeek вирізняється та викликає хвилювання на ринку
Нещодавно в сфері ШІ сталася помітна подія. Китайська AI велика модель під назвою DeepSeek вперше перевищила завантаження ChatGPT в американському App Store і зайняла перше місце. Це явище не тільки привернуло широку увагу світової технологічної, інвестиційної та медійної спільноти, але й викликало короткочасний панічний настрій на американському фондовому ринку.
У результаті цього акції багатьох технологічних гігантів впали на різні відсотки. Акції NVIDIA знизилися на 5,3%, ARM - на 5,5%, Broadcom - на 4,9%, а TSMC - на 4,5%. Інші компанії, такі як Micron, AMD, Intel також зазнали відповідних знижень. Ф'ючерси на Nasdaq 100 впали до -400 пунктів, що може стати найбільшим одноденним падінням з 18 грудня. За неповними даними, ринкова вартість акцій у США могла зменшитися на понад 1 трильйон доларів під час торгів у понеділок, що дорівнює третині загальної ринкової капіталізації криптовалют.
Ринок криптовалют також не зміг уникнути цієї хвилі спадного тренду. Ціна біткоїна впала нижче 100500 доларів, за 24 години зниження склало 4,48%. Ефір впав нижче 3200 доларів, за 24 години зниження склало 3,83%. Багато інвесторів вважають цю раптову волатильність ринку заплутаною, деякі вважають, що це може бути пов'язано зі зниженням очікувань щодо зниження процентних ставок Федеральної резервної системи або з іншими макрофакторами.
! [DeepSeek горить, крипторинок обвалюється?] ](https://img-cdn.gateio.im/webp-social/moments-809cb44dec5bdec77c885201ff28fa42.webp)
Зростання DeepSeek викликало переосмислення моделей розвитку ШІ. На відміну від компаній OpenAI, Meta та інших, DeepSeek не розвивався на основі потужного капіталу та значних апаратних ресурсів. У порівнянні, OpenAI була заснована 10 років тому, має 4500 працівників і залучила 6,6 мільярда доларів фінансування. Одна соціальна медіа-компанія витратила 60 мільярдів доларів на розробку AI-центру даних, розміром з Манхеттен. У той же час, DeepSeek існує менше 2 років, має лише 200 працівників, витрати на розробку менше 10 мільйонів доларів і не закуповував велику кількість дорогих GPU.
Ця контрастність змушує представників галузі запитувати: як традиційні технологічні гіганти можуть конкурувати з DeepSeek? Успіх DeepSeek не тільки відображає переваги в капіталі та технологіях, але й руйнує усталені уявлення про розвиток ШІ.
Віце-президент з продуктів відомої технологічної компанії прокоментував у соціальних мережах, що історія DeepSeek відображає типовий приклад руйнівних інновацій. Існуючі компанії оптимізують існуючі процеси, тоді як руйнівники переосмислюють основні підходи. DeepSeek висунув нову ідею: що було б, якби ми робили це розумніше, а не просто витрачали більше обладнання?
Наразі витрати на навчання провідних AI великих моделей є надзвичайно високими. Деякі провідні AI компанії витрачають на обчислення понад 100 мільйонів доларів, потребуючи великих дата-центрів, оснащених тисячами графічних процесорів (GPU) вартістю по 40 тисяч доларів. Однак DeepSeek запропонував вражаюче рішення: виконати це завдання за 5 мільйонів доларів. Ще більш вражаючим є те, що вони не тільки висунули цю ідею, але й справді реалізували її. Їхня модель в багатьох завданнях порівнянна або навіть перевершує провідні AI системи в галузі.
Успіх DeepSeek зумовлений тим, що вони переосмислили все з нуля. Традиційні моделі ШІ використовують 32-бітні дроби для представлення кожного числа, тоді як DeepSeek намагається використовувати 8-бітні дроби і виявляє, що точності все ще достатньо. Це змінює вимоги до пам'яті на 75%. В результаті, вартість навчання знижена з 100 мільйонів доларів до 5 мільйонів доларів, кількість необхідних GPU зменшилася з 100 тисяч до 2000, а вартість API зменшилася на 95%. Ще важливіше, що їхня модель може працювати на звичайних ігрових GPU без спеціалізованого апаратного забезпечення в дата-центрах.
Успіх DeepSeek кидає виклик кільком традиційним уявленням у сфері ШІ, включаючи те, що Китай може лише створювати закритий вихідний код, абсолютну перевагу Силіконової долини в галузі ШІ та те, що для розробки топових моделей ШІ потрібні величезні інвестиції. Ці погляди, навіть якщо не були повністю спростовані, зазнали серйозних коливань.
Відомий американський інвестиційний фонд у своїй доповіді оцінив DeepSeek, зазначивши, що це є перемогою відкритого коду над закритим. Внески відкритого спільноти можуть швидко перетворитися на процвітання всього екосистеми. Водночас, вони також вважають, що шлях розвитку традиційних компаній штучного інтелекту, хоча й виглядає простим і примітивним, не виключає появи нових якісних змін після досягнення певного масштабу. З огляду на розвиток AI за останні 70 років, обчислювальна потужність все ще залишається надзвичайно важливою, і це може залишатися вірним у майбутньому.
Поява DeepSeek дозволила відкритим моделям досягти рівня, аналогічного закритим моделям, а в деяких випадках навіть перевершити їх за ефективністю. Це зменшило необхідність для компаній купувати комерційні API штучного інтелекту, забезпечивши більш широкий простір для розвитку downstream додатків. Очікується, що в найближчі один-два роки ми станемо свідками більш різноманітних продуктів для обробки даних і більш розвиненої екосистеми застосувань великих мовних моделей.
Незважаючи на те, що DeepSeek демонструє високу ефективність, експерти вважають, що попит на обчислювальну потужність не зменшиться. Це відповідає парадоксу Джевонса в економіці, згідно з яким підвищення технологічної ефективності навпаки призводить до збільшення загального споживання ресурсів. Як і в процесі поширення від "дядька" до мобільних телефонів Nokia, саме завдяки зниженню витрат стало можливим їхнє поширення, а поширення, в свою чергу, призвело до збільшення загального обсягу споживання на ринку.
Цей важливий прорив у технологіях штучного інтелекту безумовно матиме глибокий вплив на глобальну технологічну структуру і також надає нові ідеї для майбутнього розвитку штучного інтелекту. У міру постійного розвитку технологій ми очікуємо побачити більше інновацій та проривів, які сприятимуть розвитку сфери штучного інтелекту у більш ефективному та доступному напрямку.