DeepMind создала ИИ-модель для фактчекинга

Чат-боты с искусственным интеллектом

DeepMind представила ИИ-модель SAFE, проверяющую факты в ответах LLM лучше людей.

У всех больших языковых моделей есть одна общая проблема — достоверность сгенерированной информации. Чат-боты подвержены галлюцинациям, которые мешают им верно отвечать на вопросы. Из-за этого каждый результат необходимо проверять вручную, что значительно увеличивает время решения задачи.

Исследователи из DeepMind создали ИИ-модель, автоматически указывающую на неточности. Система получила название Search-Augmented Factuality Evaluator (SAFE) — «Оценщик фактов с расширенным поиском».

Разработчики создали LLM, которая сперва разделяет утверждения или факты в ответе чат-ботов. Затем она используют Google Search для поиска сайтов, верифицирующих утверждения, и производит сравнение.

По словам исследователей, использование ИИ-модели обойдется в 20 раз дешевле, чем проверка фактов людьми. Поскольку объем генерируемой чат-ботами информации стремительно растет, наличие дешевого способа верификации будет востребовано.

Для обучения команда использовала нейросеть для проверки 16 000 фактов, содержащихся в ответах 13 основных языковых моделей из четырех семейств (Gemini, GPT, Claude и PaLM-2). Они сравнили результаты с заключениями живых фактчекеров и обнаружили, что SAFE совпадает с ними в 72% случаев.

При проверке разногласий между ИИ-моделью и людьми SAFE оказался прав в 76% случаев.

On a quick read I can’t figure out much about the human subjects, but it looks like superhuman means better than an underpaid crowd worker, rather a true human fact checker? That makes the characterization misleading. (Like saying that 1985 chess software was superhuman).…

— Gary Marcus (@GaryMarcus) March 28, 2024

По словам профессора Гэри Маркуса, не совсем корректно утверждать, что ИИ-модель справляется с задачей на «сверхчеловеческом уровне», поскольку неизвестен уровень квалификации людей, которые принимали участие в эксперименте.

Команда DeepMind разместила код SAFE на GitHub.

Напомним, в сентябре 2023 года соучредитель компании Мустафа Сулейман назвал интерактивных ботов, которые могут выполнять задачи за человека, следующим этапом развития ИИ.

Предыдущая статья

Контракт на $4.9 млн: Австралия покупает у AIM Defense лазерные системы Fractl:2, они могут прожигать сталь и уничтожать дроны

Следующая статья

Глава Bitwise: Индустрия не готова к одобрению спотовых Ethereum-ETF

0 0 голоса

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

DeepMind создала ИИ-модель для фактчекинга

Другие новости

Актуально

Pump.fun меняет модель вознаграждений

Dyson представила устройство для влажной уборки пола PencilWash

Тисячі керівників визнали, що ШІ не вплинув на продуктивність праці

В марте из PS Plus удалят семь игр, включая TMNT: Shredder’s Revenge

Кевин О’Лири рассказал, почему крупные игроки боятся биткоина

Garmin намекает на большой релиз в 2026 году: аналитики ожидают появления новых премиальных часов серии Fenix

У альткоинов больше не осталось покупателей

Последние новости

Сложность биткоин-майнинга ожидает рекордный рост

Японські геймери відмовляються від купівлі AMD Radeon RX 9000 після підвищення цін

Toyota Yaris может получить полностью электрическую версию к 2027 году

Разработчики Ethereum поделились планами на 2026 год

Aorus RTX 5060 Ti AI Box: що всередині нової зовнішньої відеокарти Gigabyte