DeepMind создала ИИ-модель для фактчекинга

Чат-боты с искусственным интеллектом

DeepMind представила ИИ-модель SAFE, проверяющую факты в ответах LLM лучше людей.

У всех больших языковых моделей есть одна общая проблема — достоверность сгенерированной информации. Чат-боты подвержены галлюцинациям, которые мешают им верно отвечать на вопросы. Из-за этого каждый результат необходимо проверять вручную, что значительно увеличивает время решения задачи.

Исследователи из DeepMind создали ИИ-модель, автоматически указывающую на неточности. Система получила название Search-Augmented Factuality Evaluator (SAFE) — «Оценщик фактов с расширенным поиском».

Разработчики создали LLM, которая сперва разделяет утверждения или факты в ответе чат-ботов. Затем она используют Google Search для поиска сайтов, верифицирующих утверждения, и производит сравнение.

По словам исследователей, использование ИИ-модели обойдется в 20 раз дешевле, чем проверка фактов людьми. Поскольку объем генерируемой чат-ботами информации стремительно растет, наличие дешевого способа верификации будет востребовано.

Для обучения команда использовала нейросеть для проверки 16 000 фактов, содержащихся в ответах 13 основных языковых моделей из четырех семейств (Gemini, GPT, Claude и PaLM-2). Они сравнили результаты с заключениями живых фактчекеров и обнаружили, что SAFE совпадает с ними в 72% случаев.

При проверке разногласий между ИИ-моделью и людьми SAFE оказался прав в 76% случаев.

On a quick read I can’t figure out much about the human subjects, but it looks like superhuman means better than an underpaid crowd worker, rather a true human fact checker? That makes the characterization misleading. (Like saying that 1985 chess software was superhuman).…

— Gary Marcus (@GaryMarcus) March 28, 2024

По словам профессора Гэри Маркуса, не совсем корректно утверждать, что ИИ-модель справляется с задачей на «сверхчеловеческом уровне», поскольку неизвестен уровень квалификации людей, которые принимали участие в эксперименте.

Команда DeepMind разместила код SAFE на GitHub.

Напомним, в сентябре 2023 года соучредитель компании Мустафа Сулейман назвал интерактивных ботов, которые могут выполнять задачи за человека, следующим этапом развития ИИ.

Предыдущая статья

Контракт на $4.9 млн: Австралия покупает у AIM Defense лазерные системы Fractl:2, они могут прожигать сталь и уничтожать дроны

Следующая статья

Глава Bitwise: Индустрия не готова к одобрению спотовых Ethereum-ETF

0 0 голоса

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

DeepMind создала ИИ-модель для фактчекинга

Другие новости

Актуально

Хорошая новость: PlayStation 5 не подорожает. Плохая новость: стоимость подписки PS Plus может вырасти

Xiaomi выводит на глобальный рынок флагманский телевизор QLED TV X Pro 75 (2026)

Aorus RTX 5060 Ti AI Box: що всередині нової зовнішньої відеокарти Gigabyte

ИИ рассчитал цену XRP на 1 марта 2026 года

NVIDIA планує здивувати світ на конференції GTC 2026

God of War: Sons of Sparta стала самой низкооцененной игрой серии, но все ли так плохо?

Spotify интегрировал SeatGeek для продажи концертных билетов в приложении

Последние новости

Сыновья Трампа: Биткоин — альтернатива доллару

NZXT випустила корпус H2 Flow для плат Mini-ITX та блок живлення C850 SFX

Meta прекратит работу отдельного сайта Messenger в апреле 2026 года

Сложность биткоин-майнинга ожидает рекордный рост

Японські геймери відмовляються від купівлі AMD Radeon RX 9000 після підвищення цін