Исследователи Anthropic допустили саботаж ИИ против человечества

ИИ угрожает человечеству AI

Искусственный интеллект может однажды саботировать человечество, но пока все в порядке. Об этом сообщили эксперты ИИ-стартапа Anthropic в новом исследовании.

New Anthropic research: Sabotage evaluations for frontier models
How well could AI models mislead us, or secretly sabotage tasks, if they were trying to?
Read our paper and blog post here: https://t.co/nQrvnhrBEv pic.twitter.com/GWrIr3wQVH

— Anthropic (@AnthropicAI) October 18, 2024

Специалисты исследовали четыре различных вектора угроз со стороны искусственного интеллекта и определили, что «минимальные меры смягчения последствий» были достаточными для текущих моделей.

«Достаточно способные модели могут подорвать человеческий надзор и принятие решений в важных контекстах. Например, в контексте разработки ИИ модели могут тайно саботировать усилия по оценке собственных опасных возможностей, мониторингу их поведения или принятию решений об их развертывании», — говорится в документе.

Однако хорошая новость в том, что исследователи Anthropic видят возможности смягчения таких рисков, по крайней мере на текущий момент.

«Хотя наши демонстрации показали, что в современных моделях, возможно, есть низкоуровневые признаки способности к саботажу, мы считаем, что минимальные меры по смягчению последствий достаточны для устранения рисков. Тем не менее по мере улучшения возможностей ИИ, вероятно, будут необходимы более реалистичные и жесткие меры по снижению рисков», — говорится в отчете.

Ранее эксперты взломали ИИ-роботов и заставили их выполнять запрещенные протоколами безопасности и этическими нормами действия. Например, детонировать бомбы.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

AMD подготовила набор драйверов для Unknown 9: Awakening и Call of Duty: Black Ops 6

На официальном сайте AMD доступен свежий графический драйвер. Выпуск AMD Software: Adrenalin Edition 24.10.1 был подготовлен специально для приключенческого экшена Unknown 9: Awakening, чей...

Японская компания Prodrone предоставит Украине технологию создания дронов, которые обнаруживают мины

Одной из многих задач, которые предстоит решать Украине — разминирование огромных территорий....

AMD начала рассылать приглашения на презентацию Ryzen 9000X3D

Официальный анонс процессоров AMD Ryzen 9000X3D уже не за горами. Китайское подразделение чипмейкера уже разослало СМИ и блогерам приглашение на закрытую презентацию новых CPU,...