Золоті дані 13 березня, вчора ввечері генеральний директор Google (GOOG.O) Сундар Пічаї оголосив, що відкритий вихідний код останньої багатомодової великої моделі Gemma-3, яка пропонує низькі витрати та високу продуктивність. У Gemma-3 є чотири параметри: 10 мільярдів, 40 мільярдів, 120 мільярдів і 270 мільярдів. Проте навіть для найбільшого параметра 270 мільярдів потрібно лише одну H100 для ефективного розрахунку, що в 10 разів менше обчислювальної потужності, і вона є найсильнішою серед невеликих параметрів на сьогодні. Згідно з даними сліпого тестування LMSYS ChatbotArena, Gemma-3 випереджає лише DeepSeek R1-671B, але перевищує відомі моделі OpenAI o3-mini, Llama3-405B тощо.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
谷歌Відкритий вихідний кодGemma-3:媲美DeepSeek,Обчислювальна потужність 暴降
Золоті дані 13 березня, вчора ввечері генеральний директор Google (GOOG.O) Сундар Пічаї оголосив, що відкритий вихідний код останньої багатомодової великої моделі Gemma-3, яка пропонує низькі витрати та високу продуктивність. У Gemma-3 є чотири параметри: 10 мільярдів, 40 мільярдів, 120 мільярдів і 270 мільярдів. Проте навіть для найбільшого параметра 270 мільярдів потрібно лише одну H100 для ефективного розрахунку, що в 10 разів менше обчислювальної потужності, і вона є найсильнішою серед невеликих параметрів на сьогодні. Згідно з даними сліпого тестування LMSYS ChatbotArena, Gemma-3 випереджає лише DeepSeek R1-671B, але перевищує відомі моделі OpenAI o3-mini, Llama3-405B тощо.