В ИИ-бенчмарке OpenAI для проверки блокчейнов обнаружили ошибки

AI-agents ИИ агенты 3

Компания по кибербезопасности OpenZeppelin провела аудит нового ИИ-бенчмарка EVMbench от OpenAI. Эксперты выявили методологические ошибки и «загрязнение» данных.

https://t.co/yW00RmRBZQ

— OpenZeppelin (@OpenZeppelin) March 2, 2026

Разработчик ChatGPT запустил EVMbench в середине февраля в партнерстве с инвестфондом Paradigm для оценки способности ИИ-агентов находить, исправлять и эксплуатировать уязвимости в смарт-контрактах.

Специалисты OpenZeppelin приветствовали инициативу, но решили проверить разработку по тем же стандартам, что и защищаемые протоколы (включая Aave, Lido и Uniswap).

Ключевые недостатки

Главная проблема связана с «загрязнением» тренировочных данных. EVMbench построен на подборке из 120 уязвимостей, выявленных в ходе аудитов 2024-2025 годов.

Однако ведущие модели, проходившие тестирование, имеют срез знаний до августа 2025 года. Модели могли «вспоминать» сведения об этих уязвимостях из обучающих данных. Даже при отключенном интернете это ставит под сомнение чистоту эксперимента: неизвестно, способен ли ИИ выявлять действительно новые угрозы.

В OpenZeppelin также указали на фактические ошибки в наборе данных EVMbench. Как минимум четыре уязвимости из категории «высокого риска» оказались неработоспособными. При этом ИИ-агенты получали правильные баллы за якобы верное обнаружение этих проблем.

«Это не субъективные разногласия по поводу серьезности; это случаи, когда описанная атака просто не срабатывает», — подчеркнули эксперты.

Специалисты подтвердили, что искусственный интеллект сыграет ключевую роль в будущем безопасности блокчейнов. Однако они предупредили: спешка с внедрением не должна идти в ущерб качеству данных и тестов.

«Вопрос не в том, изменит ли ИИ безопасность смарт-контрактов — он ее изменит. Вопрос в том, будут ли бенчмарки и данные, на которых мы строим эти инструменты, соответствовать тем же стандартам, что и контракты, которые они призваны защищать», — подытожили в OpenZeppelin.

Напомним, в ноябре эксперты Microsoft представили среду для тестирования ИИ-агентов и выявили уязвимости, присущие современным цифровым помощникам.

https://forklog.com/glavnoe-za-mesyats-beznadezhnyj-fevral-strahi-investorov-i-luchshie-longi

Предыдущая статья

Nacon Connect переносится, но не отменяется

Следующая статья

Автоматизовані боти допомагають скуповувати пам’ять на тлі дефіциту, спричиненого ШІ

0 0 голоса

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

В ИИ-бенчмарке OpenAI для проверки блокчейнов обнаружили ошибки

Ключевые недостатки

Другие новости

Актуально

Сделка с XBOX полностью окупила разработку STALKER 2: еще до релиза украинский шутер стал коммерчески успешным

Телевизоры LG OLED evo 2026 года получат новый режим изображения Creator Original: как он повлияет на просмотр контента

Привычный дизайн, яркий дисплей и улучшенный мониторинг здоровья: Samsung представила смарт-часы Galaxy Watch 9

Власники GeForce RTX 50 зіткнулися зі збоями Battlefield 6 на морських мапах

Нет денег на iPhone или Mac? — Apple даст их в лизинг: Марк Гурман сообщил о скором запуске платформы Apple Upgrade

Доповнення Songs of the Past для The Witcher 3 буде представлено на виставці Gamescom 2026

Широкоформатная база: Samsung представила Galaxy Z Fold 8 — переосмысленный складной смартфон в новом форм-факторе

Последние новости

Привычный дизайн, яркий дисплей и улучшенный мониторинг здоровья: Samsung представила смарт-часы Galaxy Watch 9

Глибокий аналіз чипа Kirin 9030 засвідчив значний прогрес китайського напівпровідникового виробника SMIC, але є нюанси

Игры с оригинальной Xbox теперь будут доступны на PC — благодаря расширенной обратной совместимости

Власники GeForce RTX 50 зіткнулися зі збоями Battlefield 6 на морських мапах

Широкоформатная база: Samsung представила Galaxy Z Fold 8 — переосмысленный складной смартфон в новом форм-факторе