DeepSeek улучшил ИИ-модель V3

deepseek

Китайский ИИ-стартап DeepSeek выпустил крупное обновление для своей языковой модели V3. DeepSeek-V3-0324 доступна на платформе Hugging Face.

Новая версия нейросети улучшена в областях рассуждений, программирования и письма. Она обходит предшественника и решения от конкурирующих компаний в ряде бенчмарков.

Сравнение DeepSeek-V3-0324 с другими ИИ-моделями в разных тестах. Данные: Hugging Face.

DeepSeek стала заметным игроком на рынке искусственного интеллекта в январе. Тогда компания выпустила ориентированную на рассуждения модель с открытым исходным кодом DeepSeek-R1, которая разработана на существенно меньший бюджет.

V3 с 671 млрд параметров появилась в декабре 2024 года.

https://forklog.com/exclusive/ai/deepseek-obrushil-rynok-pochemu-kitajskij-ii-okazalsya-v-30-raz-effektivnee-gpt-4

CEO китайского стартапа 01.AI Ли Кай-фу считает, что Китай сократил разрыв с США в развитии искусственного интеллекта до трех месяцев, поскольку компании вроде DeepSeek научились использовать чипы и применять алгоритмы более эффективно.

Страна уже стала лидером в области разработки ПО для инфраструктуры, добавил он.

«Раньше, я думаю, разрыв составлял от шести до девяти месяцев, и мы отставали во всем. А сейчас я думаю, что, возможно, на три месяца отстаем в некоторых основных технологиях, а в других специфических областях опережаем», — сказало Кай-фу.

Санкции США создавали краткосрочные проблемы, но также заставляли китайские компании внедрять инновации, подчеркнул эксперт.

Напомним, после резкого взлета популярности ИИ-моделей DeepSeek на компанию обратили внимание власти Китая. Сотрудники работают в новых, более жестких условиях.

Ранее OpenAI рекомендовала правительству США запретить решения китайского конкурента, поскольку проект «субсидируется государством» и «контролируется им».

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Google Messages теперь поддерживает полноэкранные анимационные эффекты для эмодзи

Экран приложения Google Messages. Источник: Android Central ...

Мошенники добывают криптоввалюту через систему умного дома

Системы умного дома пользуются все большей популярностью как среди обычных людей,...

З’явилися перші тести відеокарти AMD Radeon RX 9070 еталонного дизайну

Відеокарти Radeon RX 9070 (XT) референсного дизайну продовжують з’являтися в Китаї. Молодший 3D-прискорювач вдалося придбати одному з учасників форуму Chiphell, який поділився тестами незвичайного...

Polymarket теперь принимает средства в Solana

Децентрализованная блокчейн-платформа для прогнозов Polymarket позволила пользователям вносить средства через сеть...