Google разработает ИИ-модель для генерации звука к видео

Google_logo-min

Компания Google DeepMind разрабатывает технологию на базе искусственного интеллекта для создания саундтреков к видео.

Исследовательское подразделение Google в области ИИ и другие организации уже создавали модели для видео, но они не способны генерировать под них звуковые эффекты. Для этих целей DeepMind использует технологию V2A (video-to-audio).

«Модели для генерации видео развиваются невероятными темпами, но многие современные системы не создают звуковую дорожку. Одним из следующих важных шагов на пути к генерации фильмов является появление саундтреков к этим немым видеороликам», — говорится в сообщении DeepMind.

Технология V2A от DeepMind использует промпты в сочетании с видео для создания музыки, звуковых эффектов и диалогов. Например: «Пульсирующая под водой медуза, морская жизнь, океан». Лежащая в основе V2A диффузионная ИИ-модель обучена на базе звуков, расшифровок диалогов и видеоклипов.

https://www.youtube.com/watch?v=b6Elcke3JMc&t=9s

Для создания звука к видео использовались следующие подсказки: кинематограф, триллер, фильм ужасов, музыка, напряжение, атмосфера, шаги по бетону.

DeepMind отмечает, что технология пока не идеальна, а звук нельзя назвать высококачественным и убедительным. Перед полноценным запуском V2A требуются доработки и тестирования.

Напомним, в феврале OpenAI представила новую генеративную ИИ-модель Sora, которая позволяет преобразовывать текст в видео.

В июне ученые из Гарварда и DeepMind создали виртуальную крысу с искусственным интеллектом в качестве мозга.
Ранее дочерняя компания Google представила генеративную ИИ-модель Genie для создания игр.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

2 1 голос
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Марк Цукерберг создает собственного AI-клона, чтобы не ходить на совещания (и его все понимают)

Визуализация AI-клона Цукерберга. Источник: Сгенерировано ChatGPT ...

Офіційно: Metro 2039 представлять цього четверга

Видавництво Deep Silver та українська студія 4A Games формально анонсували наступну гру серії Metro, тим самим підтвердивши недавні чутки. Новий проєкт отримав назву Metro...

Geely i-HEV Zhiqing: 48% КПД и расход топлива как у мопеда

Прогресс без границ: Как Geely сочетает двигатели будущего и умные технологии. Источник: AI ...

ШІ-інструменти допомагають NVIDIA багаторазово прискорити деякі етапи проектування чипів

Фахівці NVIDIA застосовують інструменти на базі ШІ під час створення як програмного, так і апаратного забезпечення. Як розповів старший дослідник Білл Деллі (Bill Dally),...

OpenAI отзывает сертификаты приложений для macOS: когда «надежные» библиотеки подводят

Цифровая ловушка для OpenAI: как цепочка поставок стала каналом для атак. Источник: AI ...