Видит, слышит и говорит: Вышло крупное обновление ChatGPT

Разработчики OpenAI выпустили глобальный апдейт для чат-бота ChatGPT, который научился «видеть, слышать и говорить». Обновление знаменует собой важный шаг в развитии искусственного интеллекта, который может воспринимать и обрабатывать информацию в нескольких форматах, а не только в текстовом.

«Мы начинаем внедрять голосовые и графические возможности в ChatGPT. Они предлагают новый, более интуитивно понятный тип интерфейса, позволяя вести разговор c нейросетью или показывать ей предмет беседы», — пояснили в OpenAI.

Беседы с ИИ

Обновленный чат-бот умеет слышать и распознавать речь пользователей. Любой запрос к ИИ можно сделать с помощью голоса, что уже больше напоминает виртуальных помощников вроде Siri от Apple.

Для начала работы с речевыми функциями необходимо включить их в настройках приложения. ChatGPT предлагает выбор из пяти различных голосов — «можжевельник», «бухта», «небо», «бриз» и «уголь». В их записи участвовали профессиональные актеры.

Для распознавания речи нейросеть использует систему с открытым исходным кодом Whisper.

«Новая технология, способная создавать реалистичные синтетические голоса всего за несколько секунд прослушивания реальной речи, открывает двери для многих творческих приложений, ориентированных на доступность», — отметили в OpenAI.

Новой функцией уже пользуется стриминговый сервис Spotify для перевода подкастов на другие языки, сохраняя оригинальный голос ведущего.

Покажи и расскажи

Пользователи также могут присылать ChatGPT различные изображения в дополнение к обычным запросам. Функция Vision или GPT-V помогает нейросети давать более точные ответы.

В качестве примера разработчики привели ситуацию, когда необходимо что-то починить. Область поломки можно обвести инструментами для рисования для облегчения задачи чат-боту.

Анализ изображений обеспечивается мультимодальными GPT-3.5 и GPT-4. Эти модели применяют свои навыки языкового мышления к широкому спектру вложений: от скриншотов и диаграмм до обычных фотографий.

«Vision призвана помогать вам в повседневной жизни. Лучше всего нейросеть делает это, когда видит то же, что и вы. Подход основан непосредственно на нашей работе с Be My Eyes, бесплатным мобильным приложением для слепых и слабовидящих людей, чтобы понять рамки использования и ограничения», — объяснили представитель компании.

Новые возможности — новые риски

Основная цель OpenAI — создание безопасного и полезного общего искусственного интеллекта (AGI). Однако вопрос защиты пользователей стал более актуальным с появлением новых функций.

По мнению разработчиков, возможность преобразования голоса открывает новые возможности для мошенников. Например, преступники могут создавать дипфеки, имитирующие известных личностей.

Визуальные модели также создают проблемы: от неправильной интерпретации изображений до оскорбительных суждений о людях на фото. Перед запуском утилиты OpenAI протестировала ее на «красной команде» на предмет экстремизма и неточных научных высказываний.

«Мы также приняли технические меры, чтобы значительно ограничить способность нейросети анализировать и делать прямые заявления о людях, поскольку ChatGPT не всегда точен, и эти системы должны уважать конфиденциальность», — подчеркнули в OpenAI.

В июле разработчики выпустили новый плагин для чат-бота, который может анализировать данные, создавать код на Python, строить графики и решать математические задачи. Нейросети удалось научно опровергнуть теорию «плоской Земли».

В августе OpenAI запустила ChatGPT Enterprise — более быструю, безопасную и мощную версию чат-бота для корпоративных клиентов.

Будь в курсе! Подписывайся на Криптовалюта.Tech в Telegram.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Аналитики: Цена биткоина может подняться до $135 000

Эксперты Fairlead Strategies прогнозируют рост первой криптовалюты до $135 000, за которым последует коррекция. Об этом в интервью CNBC рассказала основательница компании Кэти...

Cyberpunk 2077 вийде на комп’ютерах Apple цього тижня

CD Projekt RED оголосила про плани випустити рольовий бойовик Cyberpunk 2077 на комп’ютерах Apple ще восени минулого року. Спочатку компанія вказувала як орієнтовні терміни...

Meta создаст дата-центр на 5 ГВт

Meta строит дата-центр Hyperion, который обеспечит новую ИИ-лабораторию компании мощностью 5 ГВт. Об этом сообщил CEO фирмы Марк Цукерберг. Корпорация...

John Wick Hex будет снята с продажи с 17 июля: когда лицензия важнее контента

John Wick Hex исчезает с цифровых витрин. Источник: Big Fan Games ...