Alibaba представил «гибридные» ИИ-модели Qwen3

Alibaba-min

Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.

Introducing Qwen3!
We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC

— Qwen (@Alibaba_Qwen) April 28, 2025

Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.

«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге.

Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов.

На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.

Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.

Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Минюст требует посадить главу Celsius на 20 лет

Министерство юстиции США (DOJ) требует 20 лет тюрьмы для Алекса Машински, экс-гендиректора обанкротившейся криптоплатформы Celsius, за организацию, как утверждается, «многолетней кампании лжи и корыстных...

Корреляция биткоина с золотом резко подскочила

30-дневный коэффициент корреляции Пирсона между биткоином и золотом достиг 0,54, приблизившись к годовому максимуму в 0,73. Это может свидетельствовать об укреплении нарратива о...

Японські ритейлери намагаються відвадити туристів від купівлі відеокарт GeForce RTX 5080/5090

На тлі обмежень на постачання високопродуктивних GPU до Китаю, включно з ігровими відеокартами, заповзятливі китайці почали скуповувати їх у сусідніх країнах. Цю тенденцію можна...