DeepMind создала ИИ-модель для фактчекинга

Чат-боты с искусственным интеллектом

DeepMind представила ИИ-модель SAFE, проверяющую факты в ответах LLM лучше людей.

У всех больших языковых моделей есть одна общая проблема — достоверность сгенерированной информации. Чат-боты подвержены галлюцинациям, которые мешают им верно отвечать на вопросы. Из-за этого каждый результат необходимо проверять вручную, что значительно увеличивает время решения задачи.

Исследователи из DeepMind создали ИИ-модель, автоматически указывающую на неточности. Система получила название Search-Augmented Factuality Evaluator (SAFE) — «Оценщик фактов с расширенным поиском».

Разработчики создали LLM, которая сперва разделяет утверждения или факты в ответе чат-ботов. Затем она используют Google Search для поиска сайтов, верифицирующих утверждения, и производит сравнение.

По словам исследователей, использование ИИ-модели обойдется в 20 раз дешевле, чем проверка фактов людьми. Поскольку объем генерируемой чат-ботами информации стремительно растет, наличие дешевого способа верификации будет востребовано.

Для обучения команда использовала нейросеть для проверки 16 000 фактов, содержащихся в ответах 13 основных языковых моделей из четырех семейств (Gemini, GPT, Claude и PaLM-2). Они сравнили результаты с заключениями живых фактчекеров и обнаружили, что SAFE совпадает с ними в 72% случаев.

При проверке разногласий между ИИ-моделью и людьми SAFE оказался прав в 76% случаев.

On a quick read I can’t figure out much about the human subjects, but it looks like superhuman means better than an underpaid crowd worker, rather a true human fact checker? That makes the characterization misleading. (Like saying that 1985 chess software was superhuman).…

— Gary Marcus (@GaryMarcus) March 28, 2024

По словам профессора Гэри Маркуса, не совсем корректно утверждать, что ИИ-модель справляется с задачей на «сверхчеловеческом уровне», поскольку неизвестен уровень квалификации людей, которые принимали участие в эксперименте.

Команда DeepMind разместила код SAFE на GitHub.

Напомним, в сентябре 2023 года соучредитель компании Мустафа Сулейман назвал интерактивных ботов, которые могут выполнять задачи за человека, следующим этапом развития ИИ.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Сложность биткоин-майнинга ожидает рекордный рост

Вечером 19 февраля состоится очередной перерасчет сложности майнинга биткоина. За последние...

Японські геймери відмовляються від купівлі AMD Radeon RX 9000 після підвищення цін

Останні місяці спостерігається поступове зростання цін на відеокарти. Дефіцит пам’яті змусив AMD і NVIDIA скорегувати вартість своїх продуктів та змінити обсяги виробництва, тому доступність...

Разработчики Ethereum поделились планами на 2026 год

Организация Ethereum Foundation (EF), стоящая за разработкой и запуском блокчейна «эфира», представила обновленную дорожную карту развития сети на 2026 год. После двух крупных...

Aorus RTX 5060 Ti AI Box: що всередині нової зовнішньої відеокарти Gigabyte

Gigabyte Technology нещодавно налагодила постачання зовнішньої відеокарти на базі GeForce RTX 5060 Ti, чий формальний анонс відбувся ще у вересні 2025-го. Пристрій отримав назву...