DeepMind создала ИИ-модель для фактчекинга

Чат-боты с искусственным интеллектом

DeepMind представила ИИ-модель SAFE, проверяющую факты в ответах LLM лучше людей.

У всех больших языковых моделей есть одна общая проблема — достоверность сгенерированной информации. Чат-боты подвержены галлюцинациям, которые мешают им верно отвечать на вопросы. Из-за этого каждый результат необходимо проверять вручную, что значительно увеличивает время решения задачи.

Исследователи из DeepMind создали ИИ-модель, автоматически указывающую на неточности. Система получила название Search-Augmented Factuality Evaluator (SAFE) — «Оценщик фактов с расширенным поиском».

Разработчики создали LLM, которая сперва разделяет утверждения или факты в ответе чат-ботов. Затем она используют Google Search для поиска сайтов, верифицирующих утверждения, и производит сравнение.

По словам исследователей, использование ИИ-модели обойдется в 20 раз дешевле, чем проверка фактов людьми. Поскольку объем генерируемой чат-ботами информации стремительно растет, наличие дешевого способа верификации будет востребовано.

Для обучения команда использовала нейросеть для проверки 16 000 фактов, содержащихся в ответах 13 основных языковых моделей из четырех семейств (Gemini, GPT, Claude и PaLM-2). Они сравнили результаты с заключениями живых фактчекеров и обнаружили, что SAFE совпадает с ними в 72% случаев.

При проверке разногласий между ИИ-моделью и людьми SAFE оказался прав в 76% случаев.

On a quick read I can’t figure out much about the human subjects, but it looks like superhuman means better than an underpaid crowd worker, rather a true human fact checker? That makes the characterization misleading. (Like saying that 1985 chess software was superhuman).…

— Gary Marcus (@GaryMarcus) March 28, 2024

По словам профессора Гэри Маркуса, не совсем корректно утверждать, что ИИ-модель справляется с задачей на «сверхчеловеческом уровне», поскольку неизвестен уровень квалификации людей, которые принимали участие в эксперименте.

Команда DeepMind разместила код SAFE на GitHub.

Напомним, в сентябре 2023 года соучредитель компании Мустафа Сулейман назвал интерактивных ботов, которые могут выполнять задачи за человека, следующим этапом развития ИИ.

Предыдущая статья

Контракт на $4.9 млн: Австралия покупает у AIM Defense лазерные системы Fractl:2, они могут прожигать сталь и уничтожать дроны

Следующая статья

Глава Bitwise: Индустрия не готова к одобрению спотовых Ethereum-ETF

0 0 голоса

Рейтинг статьи

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

DeepMind создала ИИ-модель для фактчекинга

Другие новости

Актуально

Remnant II вскоре получит третье большое дополнение The Dark Horizon

OpenAI запустила прототип поисковика SearchGPT

Обзоры процессоров AMD Ryzen 9000 выйдут за день до старта продаж

CEO CryptoQuant: Сейчас биткоин находится в стадии накопления

Продано более трех миллионов копий Armored Core VI Fires of Rubicon

Процессор AMD Ryzen 5 9600X протестирован в Cinebench R23

Sony откладывает выпуск объектива 85mm f/1.4 GM II до августа

Последние новости

Meizu выпустит свой электромобиль DreamCar MX: Новый конкурент на рынке EV

Remnant II вскоре получит третье большое дополнение The Dark Horizon

Демоверсия мрачной экшен-RPG Deathbound теперь доступна и на PS5 — релиз игры состоится уже в начале августа

Раскрыты характеристики GeForce RTX 3050 A Laptop: 1792 ядра CUDA и 64-битная шина памяти

Дороже Pixel Buds Pro: инсайдер рассказал сколько будут стоить Google Pixel Buds Pro 2