Китайский техгигант Alibaba выпустил новое семейство ИИ-моделей Qwen3, которые «способны сравниться или превзойти в некоторых случаях» лучшие решения от Google и OpenAI.
Introducing Qwen3!
We release and open-weight Qwen3, our latest large language models, including 2 MoE models and 6 dense models, ranging from 0.6B to 235B. Our flagship model, Qwen3-235B-A22B, achieves competitive results in benchmark evaluations of coding, math, general… pic.twitter.com/JWZkJeHWhC— Qwen (@Alibaba_Qwen) April 28, 2025
Их размер варьируется от 600 млн до 235 млрд параметров. Модели являются «гибридными» — они способны как затрачивать больше времени для рассуждений, так и предоставлять быстрые ответы.
«Мы органично объединили режимы мышления и немышления, предоставив пользователям гибкость […]. Такая конструкция позволяет с большей легкостью настраивать бюджеты для конкретных задач», — отметила команда в блоге.
Qwen3 поддерживает 119 языков и обучена на наборе данных, содержащем более 36 трлн токенов.
На платформе по оценке навыков программирования Qwen-3-235B-A22B обошла o3-mini и Gemini 2.5 Pro. o3-mini она опередила в последней версии математического теста AIME и BFCL — оценивает способность «рассуждать» о проблемах.
Qwen-3-235B-A22B пока нет в публичном доступе. Qwen3-32B является крупнейшей среди открытых. Она превосходит o1 в нескольких тестах, включая бенчмарк программирования LiveCodeBench.
Напомним, в марте Alibaba представила ориентированную на рассуждения ИИ-модель QwQ-32.