Данные Jin10 от 22 июля: сегодня мы обновили флагманскую модель Qwen3 и выпустили обновленную версию Qwen3-235B-A22B-FP8 в режиме Non-thinking, названную Qwen3-235B-A22B-Instruct-2507-FP8. Новая модель Qwen3 значительно улучшила свои универсальные возможности, включая соблюдение инструкций, логическое мышление, понимание текста, математику, науку, программирование и использование инструментов. Она показала отличные результаты в многочисленных тестах, таких как GQPA (знания), AIME25 (математика), LiveCodeBench (программирование), Arena-Hard (выравнивание человеческих предпочтений), BFCL (возможности агентов) и превзошла такие ведущие открытые модели, как Kimi-K2, DeepSeek-V3, а также передовые закрытые модели, такие как Claude-Opus4-Non-thinking.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Туньи Цяньвэнь: Обновленная флагманская модель Qwen3, универсальные возможности значительно улучшены.
Данные Jin10 от 22 июля: сегодня мы обновили флагманскую модель Qwen3 и выпустили обновленную версию Qwen3-235B-A22B-FP8 в режиме Non-thinking, названную Qwen3-235B-A22B-Instruct-2507-FP8. Новая модель Qwen3 значительно улучшила свои универсальные возможности, включая соблюдение инструкций, логическое мышление, понимание текста, математику, науку, программирование и использование инструментов. Она показала отличные результаты в многочисленных тестах, таких как GQPA (знания), AIME25 (математика), LiveCodeBench (программирование), Arena-Hard (выравнивание человеческих предпочтений), BFCL (возможности агентов) и превзошла такие ведущие открытые модели, как Kimi-K2, DeepSeek-V3, а также передовые закрытые модели, такие как Claude-Opus4-Non-thinking.