Google запустила платформу для тестирования ИИ в шахматах

AI fake news фейки

Корпорация Google запустила платформу Game Arena, на которой ИИ-модели и агенты могут соревноваться друг с другом в стратегических играх вроде шахмат.

Today we announced the @Kaggle Game Arena, a new benchmarking platform where AI models and agents can compete head-to-head in strategic games, starting with chess ♟️.
Why games, you ask? 🤔 Games are perfect for AI evaluation because they help us understand how models tackle… pic.twitter.com/XoZAk6hAou

— Google AI (@GoogleAI) August 4, 2025

«Игры идеально подходят для оценки искусственного интеллекта, потому что они помогают нам понять, как модели справляются со сложными задачами рассуждения. Многие игры являются аналогом реальных навыков и позволяют проверить способности нейросети в таких областях, как стратегическое планирование, адаптация и память», — говорится в анонсе.

В честь открытия Game Arena компания проведет турнир по шахматам с участием ИИ. Он пройдет в период с 5 по 7 августа и будет транслироваться онлайн. ChatGPT, Gemini, Claude, Grok, Deepseek и Kimi примут участие в мероприятии.

Первые шахматные матчи пройдут между:

o4 mini и DeepSeek-R1;
Gemini 2.5 Pro и Claude Opus 4;
Kimi K2 Instruct и o3;
Grok 4 и Gemini 2.5 Flash.

Каждый раунд включает серию из четырех матчей. Победители проходят в одиночный отборочный тур. Две лучшие модели встретятся в финальной игре.

Зрители смогут увидеть, как модели обосновывают каждый свой шаг. Такая прозрачность важна для понимания того, действительно ли ИИ думают над проблемами или просто имитируют мыслительную деятельность, считают в Google.

«Мы с нетерпением ждем прогресса, который будет достигнут благодаря этому бенчмарку. Мы добавим все больше игр и задач на Game Arena и ожидаем быстрого улучшения», — написал соучредитель и CEO Google DeepMind Демис Хассабис.

Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду, чтобы не проиграть Stockfish в шахматы.

Позже известный шахматист Леви Розман собрал семь популярных чат-ботов для участия в шахматном турнире. Несмотря на мастерство в ведении диалога, программировании и математике, шахматная доска оказалась для нейросетей необычайно сложной.

Предыдущая статья

Capital B привлекла $13,3 млн через конвертируемые облигации

Следующая статья

ASUS підготувала до релізу Radeon RX 9060 лінійки Dual

0 0 голоса

Рейтинг статьи

0 комментариев

Старые

Новые Популярные

Межтекстовые Отзывы

Посмотреть все комментарии

Google запустила платформу для тестирования ИИ в шахматах

Другие новости

Актуально

Capital B привлекла $13,3 млн через конвертируемые облигации

Нейросеть Grok определила цену биткоина

Hyperliquid выплатила трейдерам почти $2 млн

Роберт Кийосаки готов удвоить свою позицию по биткоину

В августе Samsung прекращает поддержку трех моделей среднего бюджета

Mafia: The Old Country не утомит геймеров — разработчики обещают десять часов захватывающего сюжета

Вийшов драйвер AMD Software: Adrenalin Edition 25.8.1 WHQL з підтримкою Radeon RX 9060 та нових ігор

Последние новости

В августе Samsung прекращает поддержку трех моделей среднего бюджета

SEC и CFTC обновляют правила для криптовалют

Процесори AMD AM6 успадкують сумісність із випущеними раніше системами охолодження

СМИ: раскритикованный сериал The Witcher обошелся Netflix в $600 миллионов и сумма продолжает расти

Почему с ростом биткоина еще не покончено