Google представила флагманскую ИИ-модель Gemini 2.0 Pro

Gemini 2025

  • Компания Google выпустила Gemini 2.0 Pro Experimental — профессиональную и наиболее производительную модель в линейке.
  • «Думающая» Gemini 2.0 Flash Thinking стала доступна в приложении ИИ-ассистента.
  • Gemini 2.0 Flash обзавелась экономичной и оптимизированной версией Lite.
  • Исследователи из Стэнфорда и Университета Вашингтона создали рассуждающую нейросеть за $50 с применением ответов Gemini 2.0 Flash Thinking Experimental.

Корпорация Google представила новую флагманскую ИИ-модель Gemini 2.0 Pro Experimental. Также она сделала «думающую» нейросеть Gemini 2.0 Flash Thinking доступной в приложении Gemini.

Today we’re expanding the Gemini 2.0 family with new options and broader availability.
This builds on the first model we launched in December: 2.0 Flash, our model with low latency and better performance ⚡
Read more on today’s launches ⬇️ pic.twitter.com/SRpDIJMhUP

— Google (@Google) February 5, 2025

Gemini 2.0 Pro Experimental — преемник Gemini 1.5 Pro. Она доступна на платформах Vertex AI, Google AI Studio и подписчикам Advanced в приложении Gemini. Компания подчеркнула хорошие навыки нейросети в программировании и обработке сложных запросов. Она «лучше понимает и обдумывает знания о мире».

Контекстное окно профессиональной версии составляет 2 млн токенов. Она способна за раз понять все семь книг о Гарри Поттере, оставив в запасе около 400 000 слов.

Gemini 2.0 Flash обзавелась наиболее экономичной и оптимизированной версией Lite.

Производительность серии Gemini 2.0 демонстрирует значительный прирост по сравнению с 1.5 в ряде бенчмарков.

Сравнение Gemini 2.0 с предшественниками. Данные: Google.

Компания уменьшила стоимость вывода для Flash и Flash-Lite, установив ее ниже, чем у Gemini 1.5 Flash, при этом повысив производительность.

Стоимость вывода Gemini 2.0 Flash, Flash-Lite и Gemini 1.5 Flash. Данные: Google.

Хайп вокруг дешевой и эффективной китайской ИИ-модели DeepSeek-R1 вызвал вопросы касательно целесообразности миллиардных трат на искусственный интеллект. Началась гонка за удешевление нейросетей.

Рассуждающая ИИ-модель за $50

В январе компания NovaSky представила думающую ИИ-модель с открытым исходным кодом Sky-T1, обучение которой обошлось всего в $450.

Исследователи из Стэнфорда и Университета Вашингтона пошли дальше и смогли обучить рассуждающий ИИ за менее чем $50. Модель s1 демонстрирует схожие с o1 от OpenAI и R1 от DeepSeek результаты в тестах. Она доступна на GitHub вместе с данными и кодом, который применялся для обучения.

Команда проекта взяла за основу готовую базовую нейросеть и доработала с помощью дистилляции — процесса, при котором из другой ИИ-модели извлекаются способности к «рассуждению» путем обучения на ее ответах.

В основе s1 лежит небольшая бесплатная ИИ-модель Qwen от Alibaba. Исследователи создали набор данных, состоящий из 1000 тщательно подобранных вопросов и ответов на них из Gemini 2.0 Flash Thinking Experimental.

Обучение с применением 16 графических процессоров Nvidia H100 заняло менее 30 минут.

Дистилляция этична?

Идея запуска передовых ИИ-моделей без миллионных вложений может показаться захватывающей. Однако крупные лаборатории, вероятно, недовольны таким подходом.

OpenAI обвинила DeepSeek в неправомерном сборе данных из своего API для дистилляции.

Разработчики s1 стремились найти простейший способ достичь высокой производительности. Для обучения применили подход Supervised Fine-Tuning (SFT), в рамках которого модели дается указание подражать определенному поведению в наборе данных.

SFT дешевле крупномасштабного обучения с подкреплением.

Google предлагает бесплатный доступ к Gemini 2.0 Flash Thinking Experimental на платформе Google AI Studio.

Крупные инвестиции нужны

Несмотря на высокий ажиотаж вокруг дешевых нейросетей, техгиганты не спешат снижать объем инвестиций в обучение новых моделей.

Meta, Google и Microsoft намерены сохранить миллиардные вливания в ИИ-инфраструктуру.

Дистилляция показала себя как хороший метод доработки моделей, но она не создает новые нейросети, которые способны значительно превзойти доступные сегодня решения.

Напомним, 21 января Дональд Трамп объявил об инвестициях частного сектора на сумму $500 млрд в инфраструктуру искусственного интеллекта.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Дело Дурова не поступит в суд в этом году

Дело основателя Telegram Павла Дурова во Франции не будет передано в...

Повідомлень про збої в роботі відеокарт GeForce RTX 50-ї серії стає більше

Від власників відеокарт GeForce RTX 50-ї серії продовжують надходити скарги на проблеми в роботі нових 3D-прискорювачів. Збої почали спостерігатися ще на етапі підготовки оглядів,...

Virtune выводит Avalanche и Cardano ETP на Nasdaq Helsinki

Шведская компания по управлению цифровыми активами Virtune разместила два своих биржевых продукта (ETP) на альткоины на Nasdaq Helsinki. Virtune Avalanche...