Зниження цін на великі моделі та Відкритий вихідний код сприяють розвитку AI-додатків
21 травня Alibaba Cloud оголосила про зниження цін на виклики API комерційної моделі Tongyi Qianwen та відкритої моделі. Зокрема, ціна введення основної моделі Qwen-Long рівня GPT-4 знизилася з 0,02 юаня/тисяча токенів до 0,5 юаня/мільйон токенів, що становить зниження до 97%.
9 травня компанія Alibaba Tongyi представила відкритий вихідний код модель Qwen1.5-110B з параметрами обсягом 110 мільярдів. Ця модель показала відмінні результати в ряді бенчмарків, перевершивши деякі конкуренти, і займає перше місце в рейтингу відкритих великих моделей.
"Зниження цін + Відкритий вихідний код" комбінована стратегія стає загальноприйнятою серед виробників великих моделей у всьому світі. Цей напрямок допомагає вирішити дві основні проблеми, з якими стикаються розробники AI-додатків: надто високі ціни на API та недостатня якість відкритих моделей, що сприяє всебічному розвитку AI-додатків.
Останнім часом кілька великих виробників моделей випустили бюджетні продукти або знизили ціни. Наприклад, API нового покоління MoE від одного квантового компанії з відкритим вихідним кодом оцінюється всього в близько одного відсотка від цін конкурентів; одна AI компанія знизила ціну на виклик особистої версії моделі на 80%; один міжнародний виробник випустив нову версію моделі з аналогічною продуктивністю, але за половину ціни; одна інтернет-компанія встановила дуже низькі ціни на вхідні дані для основної моделі; одна технологічна компанія оголосила, що дві основні моделі будуть повністю безкоштовними; одна компанія з технологій голосу відкрила API безкоштовно назавжди тощо.
Схоже, що зниження ціни на API великих моделей може бути результатом прогресу в технологіях висновку та зниження витрат. Це надає розробникам більше вибору, що сприяє збільшенню розробок і застосувань AI великих моделей.
Компанія Alibaba Tongyi нещодавно випустила кілька великих мовних моделей з різними параметрами, охоплюючи від 500 мільйонів до 110 мільярдів. Маленькі моделі можуть бути розгорнуті на мобільних телефонах, ПК та інших пристроях на кінець; великі моделі підтримують корпоративні та наукові застосування; середні моделі шукають баланс між продуктивністю, ефективністю та використанням пам'яті. Крім того, були випущені відкриті моделі для роботи з зображеннями, аудіо, кодом та іншими мультимодальними даними. Ці ініціативи сприятимуть розвитку AI-додатків в різних сценаріях.
Експерти вважають, що застосування великих моделей на кінцевих пристроях також заслуговує на увагу. Завдяки прогресу технологій та зниженню витрат, очікується, що AI-застосунки ширше проникнуть у різні сфери.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
21 лайків
Нагородити
21
8
Поділіться
Прокоментувати
0/400
ZKProofster
· 07-04 00:28
лол, технічно кажучи, це просто гонка до дна... конфіденційність все ще ігнорується при реалізації
Переглянути оригіналвідповісти на0
CounterIndicator
· 07-03 02:06
знову падає, метод зниження ціни хороший
Переглянути оригіналвідповісти на0
SelfSovereignSteve
· 07-02 20:38
Ця хвиля справді смачна~
Переглянути оригіналвідповісти на0
BottomMisser
· 07-02 04:56
Можна, великий модель нарешті більше не спалює стільки грошей.
Переглянути оригіналвідповісти на0
HypotheticalLiquidator
· 07-02 04:47
велике дамп є для ліквідації слабких Відкритий вихідний код дорівнює Пастка для биків
Переглянути оригіналвідповісти на0
GasFeeCrier
· 07-02 04:42
Прийшли, прийшли, починається цінова війна!
Переглянути оригіналвідповісти на0
TokenDustCollector
· 07-02 04:42
Нарешті знизили ціну, ще й відкритий вихідний код. Можна зайнятися цим.
Зниження цін на великі моделі та відкритий вихідний код, подвійний підхід, розробка AI-додатків переходить у нову стадію
Зниження цін на великі моделі та Відкритий вихідний код сприяють розвитку AI-додатків
21 травня Alibaba Cloud оголосила про зниження цін на виклики API комерційної моделі Tongyi Qianwen та відкритої моделі. Зокрема, ціна введення основної моделі Qwen-Long рівня GPT-4 знизилася з 0,02 юаня/тисяча токенів до 0,5 юаня/мільйон токенів, що становить зниження до 97%.
9 травня компанія Alibaba Tongyi представила відкритий вихідний код модель Qwen1.5-110B з параметрами обсягом 110 мільярдів. Ця модель показала відмінні результати в ряді бенчмарків, перевершивши деякі конкуренти, і займає перше місце в рейтингу відкритих великих моделей.
"Зниження цін + Відкритий вихідний код" комбінована стратегія стає загальноприйнятою серед виробників великих моделей у всьому світі. Цей напрямок допомагає вирішити дві основні проблеми, з якими стикаються розробники AI-додатків: надто високі ціни на API та недостатня якість відкритих моделей, що сприяє всебічному розвитку AI-додатків.
Останнім часом кілька великих виробників моделей випустили бюджетні продукти або знизили ціни. Наприклад, API нового покоління MoE від одного квантового компанії з відкритим вихідним кодом оцінюється всього в близько одного відсотка від цін конкурентів; одна AI компанія знизила ціну на виклик особистої версії моделі на 80%; один міжнародний виробник випустив нову версію моделі з аналогічною продуктивністю, але за половину ціни; одна інтернет-компанія встановила дуже низькі ціни на вхідні дані для основної моделі; одна технологічна компанія оголосила, що дві основні моделі будуть повністю безкоштовними; одна компанія з технологій голосу відкрила API безкоштовно назавжди тощо.
Схоже, що зниження ціни на API великих моделей може бути результатом прогресу в технологіях висновку та зниження витрат. Це надає розробникам більше вибору, що сприяє збільшенню розробок і застосувань AI великих моделей.
Компанія Alibaba Tongyi нещодавно випустила кілька великих мовних моделей з різними параметрами, охоплюючи від 500 мільйонів до 110 мільярдів. Маленькі моделі можуть бути розгорнуті на мобільних телефонах, ПК та інших пристроях на кінець; великі моделі підтримують корпоративні та наукові застосування; середні моделі шукають баланс між продуктивністю, ефективністю та використанням пам'яті. Крім того, були випущені відкриті моделі для роботи з зображеннями, аудіо, кодом та іншими мультимодальними даними. Ці ініціативи сприятимуть розвитку AI-додатків в різних сценаріях.
Експерти вважають, що застосування великих моделей на кінцевих пристроях також заслуговує на увагу. Завдяки прогресу технологій та зниженню витрат, очікується, що AI-застосунки ширше проникнуть у різні сфери.