Примеры изображений, созданными новой моделью Imagen 3. Источник: Google
Google анонсировала новую версию своей модели генеративного ИИ для видео, Veo 2, которая, по словам компании, теперь лучше понимает физику реального мира и движений человека.
Что известно
Veo 2 позволяет пользователям ссылаться на определенные жанры фильмов, кинематографические эффекты и объективы при создании видео. Модель также уменьшает количество артефактов, таких как лишние пальцы, и улучшает качество изображения. Ниже показано видео, полностью созданное моделью Veo 2.
Кроме того, Google улучшила свою модель преобразования текста в изображение, Imagen 3, которая теперь генерирует более яркие и лучше скомпонованные изображения, а также точнее следует подсказкам.
Изображение, созданное моделью Imagen 3. Иллюстрация: Google
Google также добавила новый инструмент Whisk, который сочетает возможности Imagen 3 и модели визуального понимания Gemini, позволяя создавать уникальные изображения, объединяя несколько идей или объектов в одной иллюстрации.
Модели включают невидимый водяной знак SynthID для снижения вероятности дезинформации. Veo 2 будет постепенно доступна пользователям Google Labs в США и сейчас пока ограничена для тестеров на создание видео до восьми секунд в формате 720p. Улучшения для модели Imagen 3 уже доступны пользователям Google Labs в более чем 100 странах через ImageFX.
Источник: Google