Видит, слышит и говорит: Вышло крупное обновление ChatGPT

Разработчики OpenAI выпустили глобальный апдейт для чат-бота ChatGPT, который научился «видеть, слышать и говорить». Обновление знаменует собой важный шаг в развитии искусственного интеллекта, который может воспринимать и обрабатывать информацию в нескольких форматах, а не только в текстовом.

«Мы начинаем внедрять голосовые и графические возможности в ChatGPT. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяя вести разговор c нейросетью или показывать ей предмет беседы», — пояснили в OpenAI.

Беседы с ИИ

Обновленный чат-бот умеет слышать и распознавать речь пользователей. Любой запрос к ИИ можно сделать с помощью голоса, что уже больше напоминает виртуальных помощников вроде Siri от Apple.

Для начала работы с речевыми функциями необходимо включить их в настройках приложения. ChatGPT предлагает выбор из пяти различных голосов — «можжевельник», «бухта», «небо», «бриз» и «уголь». В их записи участвовали профессиональные актеры.

Для распознавания речи нейросеть использует систему с открытым исходным кодом Whisper.

«Новая технология, способная создавать реалистичные синтетические голоса всего за несколько секунд прослушивания реальной речи, открывает двери для многих творческих приложений, ориентированных на доступность», — отметили в OpenAI.

Новой функцией уже пользуется стриминговый сервис Spotify для перевода подкастов на другие языки, сохраняя оригинальный голос ведущего.

Покажи и расскажи

Пользователи также могут присылать ChatGPT различные изображения в дополнение к обычным запросам. Функция Vision или GPT-V помогает нейросети давать более точные ответы.

В качестве примера разработчики привели ситуацию, когда необходимо что-то починить. Область поломки можно обвести инструментами для рисования для облегчения задачи чат-боту.

Анализ изображений обеспечивается мультимодальными GPT-3.5 и GPT-4. Эти модели применяют свои навыки языкового мышления к широкому спектру вложений: от скриншотов и диаграмм до обычных фотографий.

«Vision призвана помогать вам в повседневной жизни. Лучше всего нейросеть делает это, когда видит то же, что и вы. Подход основан непосредственно на нашей работе с Be My Eyes, бесплатным мобильным приложением для слепых и слабовидящих людей, чтобы понять рамки использования и ограничения», — объяснили представитель компании.

Новые возможности — новые риски

Основная цель OpenAI — создание безопасного и полезного общего искусственного интеллекта (AGI). Однако вопрос защиты пользователей стал более актуальным с появлением новых функций.

По мнению разработчиков, возможность преобразования голоса открывает новые возможности для мошенников. Например, преступники могут создавать дипфеки, имитирующие известных личностей.

Визуальные модели также создают проблемы: от неправильной интерпретации изображений до оскорбительных суждений о людях на фото. Перед запуском утилиты OpenAI протестировала ее на «красной команде» на предмет экстремизма и неточных научных высказываний.

«Мы также приняли технические меры, чтобы значительно ограничить способность нейросети анализировать и делать прямые заявления о людях, поскольку ChatGPT не всегда точен, и эти системы должны уважать конфиденциальность», — подчеркнули в OpenAI.

В июле разработчики выпустили новый плагин для чат-бота, который может анализировать данные, создавать код на Python, строить графики и решать математические задачи. Нейросети удалось научно опровергнуть теорию «плоской Земли».

В августе OpenAI запустила ChatGPT Enterprise — более быструю, безопасную и мощную версию чат-бота для корпоративных клиентов.

Будь в курсе! Подписывайся на Криптовалюта.Tech в Telegram.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Кровавое путешествие, которое зарядит вас энергией: обзор Ninja Gaiden 4

Ninja Gaiden 4 настолько динамична и эффективна, что редакция gg не смогла пройти мимо. Благодаря безостановочному темпу, агрессивным боям и стильным комбо, эта игра...

SanDisk випускає 8‑терабайтну версію NVMe-накопичувача WD_Black SN8100 з підтримкою PCIe 5.0 x4

Лінійка твердотілих накопичувачів WD_Black SN8100 від компанії SanDisk найближчим часом поповниться топовою моделлю. У закордонних магазинах була помічена 8‑терабайтна версія, яку виробник обіцяв випустити...

Илон Маск пропампил цену токена Floki

Цена мемтокена Floki взлетела почти на 30%, достигнув локального пика в $0,00008799. Поводом для внимания трейдеров к токену стал пост основателя компании Tesla...

Polymarket готовится выпустить Pro версию и провести аирдроп

Платформа криптопрогнозов Polymarket готовится запустить новую версию Polymarket Pro, ориентированную на...