Эксперты выявили склонность крупных ИИ-моделей к «вранью»

AI fake news фейки

ИИ-модели скорее солгут, нежели признаются в незнании чего-либо. Такое поведение становится все более очевидным по мере роста языковой модели, говорится в исследовании, опубликованном в Nature.

Искусственный интеллект склонен отвечать с уверенностью, даже если ответ фактически неверен, потому что его научили верить в эту информацию. Модели не осознают собственного невежества, отметили авторы.

Более крупные модели обычно демонстрируют улучшенную производительность в ходе выполнения сложных задач, но это не гарантирует постоянную точность, особенно при выполнении простых заданий.

Они заметно реже избегают сложных вопросов, стараясь их решать и иногда давая неверные ответы. На приведенном ниже графике видно, как модели выдают неправильные результаты (красный цвет) вместо того, чтобы уклониться от решения задачи (светло-голубой цвет).

Правильные ответы отображены темно-синим цветом. Данные: Nature.

Исследователи отметили, что данный феномен не связан со способностью крупных языковых моделей справляться с простыми задачами. Просто их тренируют лучше решать сложные проблемы. Нейросети, обученные на огромных, сложных массивах данных, более склонны упускать фундаментальные навыки.

Проблема усугубляется уверенностью ИИ. Пользователям зачастую сложно определить, когда он предоставляет точную информацию, а когда дезинформацию.

Эксперты также обнаружили, что в ходе улучшения производительности модели в одной области она может ухудшаться в другой.

«Процент избегающих ответов редко растет быстрее, чем процент неправильных. Вывод очевиден: ошибки по-прежнему встречаются чаще. Это представляет собой инволюцию надежности», — пишут они.

Исследователи подчеркнули минусы современных методов обучения искусственного интеллекта. Настройка с подкреплением и человеческой обратной связью усугубляет проблему, поскольку модель не старается избежать задачи, с которой она не справится.

Напомним, в сентябре OpenAI представила новую большую языковую модель o1, обученную методом с подкреплением для выполнения сложных рассуждений.

Предыдущая статья

Виталик Бутерин: Нужны метрики на определение соответствия ценностям Ethereum

Следующая статья

Google Wallet теперь автоматически импортирует железнодорожные билеты из Gmail

0 0 голоса

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

Эксперты выявили склонность крупных ИИ-моделей к «вранью»

Другие новости

Актуально

Японські геймери відмовляються від купівлі AMD Radeon RX 9000 після підвищення цін

Сознание — атавизм

ASUS выпустила компактную низкопрофильную клавиатуру ProArt KD300 в лаконичном алюминиевом корпусе

Netflix представил тизер фильма «Острые козырьки: Бессмертный» — события разворачиваются в Бирмингеме 1940 года

Рыночная капитализация Samsung Electronics приблизилась к $900 млрд после заключения контракта с Tesla

Гра в жанрі жахів Cthulhu: The Cosmic Abyss скоро отримає демоверсію

В России в соцсетях массово предлагают нелегальные криптозаймы

Последние новости

Подписчики Xbox Game Pass получили временный бесплатный доступ ко всему контенту Battlefield 6

РФ может пойти по модели криптобанков Беларуси

Razer випускає флагманську ігрову клавіатуру Huntsman Signature Edition за $500

Сознание — атавизм

Бутерин раскритиковал автономный ИИ и раскрыл детали масштабных обновлений Ethereum