Компания Alibaba запустила «самый продвинутый ИИ-инструмент для программирования» — ИИ-модель с открытым исходным кодом Qwen3-Coder.
>>> Qwen3-Coder is here! ✅
We’re releasing Qwen3-Coder-480B-A35B-Instruct, our most powerful open agentic code model to date. This 480B-parameter Mixture-of-Experts model (35B active) natively supports 256K context and scales to 1M context with extrapolation. It achieves… pic.twitter.com/Z8HfyrVScE— Qwen (@Alibaba_Qwen) July 22, 2025
Нейросеть предназначена для связанных с программированием задач. Она способна писать код и управлять сложными рабочими процессами, демонстрируя прогресс в других областях:
- следование инструкциям;
- логическое мышление;
- понимание текста;
- математика;
- естественные науки;
- использование инструментов.
Компания позиционирует продукт как «особенно сильный» в агентных ИИ-задачах — когда искусственный интеллект способен самостоятельно работать без вмешательства человека.
pic.twitter.com/M8krjTM4tq
— Qwen (@Alibaba_Qwen) July 22, 2025
Согласно представленным данным, Qwen3-Coder превзошла китайских конкурентов, включая модели от DeepSeek и K2 от Moonshot AI, по ряду показателей. Так, в Американской математической олимпиаде она набрала 70,3 балла против 46,6 у DeepSeek-V3-0324.
В тесте на программирование MultiPL-E языковая модель набрала 87,9 баллов, показатель DeepSeek — 82,2.
В некоторых областях нейросеть сравнима с передовыми американскими аналогами вроде Claude от Anthropic и GPT-4 от OpenAI.
Нейросеть Qwen3-235B-A22B-Instruct-2507-FP8 является обновлением предыдущей версии Qwen3-235B-A22B-FP8, но работает в режиме без рассуждений — выдает результат без пошаговых логических выводов. Благодаря этому максимальная длина обрабатываемого контента увеличена в восемь раз — до 256 000 токенов, что позволяет работать с гораздо более большими текстами в рамках одного диалога.
Напомним, в мае Alibaba объявила о прорыве в снижении стоимости обучения ИИ-моделей, ориентированных на поиск.