Nvidia Vera Rubin и Groq: когда мало просто быть лидером, можно купить скорость

Серверная стойка Nvidia Vera Rubin с процессорами Groq Серверная стойка Nvidia Vera Rubin с процессорами Groq. Источник: Nvidia

Дженсен Хуанг (Jensen Huang) снова доказал, что лучший способ победить конкурента — это выписать ему чек на такую сумму, от которой никто не откажется. Новая платформа Vera Rubin теперь не просто очередной ускоритель вычислений, а настоящий гибрид высоких технологий, где под одним капотом сошлись разработки Nvidia, Intel и Groq. Последний союз обошелся «зеленым» в 20 млрд долларов (860 млрд грн), что позволило получить не только лицензии, но и ключевых специалистов вместе с основателем Groq.

Архитектурный микс: SRAM против HBM4

Основой нового подхода стал чип Groq 3 LPU (Language Processing Unit). Это узкоспециализированный языковой процессор, который не стремится быть мастером на все руки, а делает одно дело — вывод (inference) — с пугающей скоростью. Устройство содержит 98 млрд транзисторов, но имеет лишь 500 МБ памяти SRAM. На первый взгляд, это кажется шуткой на фоне гигабайтов в современных видеокартах, но дьявол кроется в деталях, а точнее — в пропускной способности.

Макет чипа платформы Nvidia Vera Rubin
Архитектура платформы Vera Rubin. Фото: Nvidia

Согласно официальным данным, пропускная способность SRAM в Groq 3 достигает 150 ТБ/с. Для сравнения: 288 ГБ современной памяти HBM4 в графических процессорах Rubin могут выдать лишь 22 ТБ/с. Это создает колоссальный разрыв в скорости обработки данных, что критично для крупных языковых моделей, где задержка на каждом токене определяет общую производительность системы.

Масштабирование до уровня стоек

Nvidia не ограничилась одиночными чипами. В рамках платформы создана отдельная стойка Groq 3 LPX, которая объединяет 256 процессоров. В такой конфигурации система предлагает 128 ГБ памяти SRAM с суммарной пропускной способностью 40 ПБ/с. Это решение позиционируется как мощный сопроцессор для GPU Rubin, который берет на себя декодирование на каждом уровне модели искусственного интеллекта.

Слайд презентации Nvidia GTC 2026 Groq 3 LPX
Презентация стойки Groq 3 LPX на GTC 2026. Фото: Nvidia

Кроме языковых ускорителей, платформа включает 88-ядерный серверный процессор Vera и GPU-систему Rubin NVL72. Если Rubin традиционно фокусируется на обучении моделей, то связка с Groq LPX поднимает общую мощность вывода ИИ до впечатляющих 315 PFLOPS. Это позволяет обрабатывать запросы в реальном времени с такой скоростью, которая раньше казалась недостижимой даже для кластеров предыдущего поколения.

Такое движение Nvidia фактически закрывает вопрос конкуренции в сегменте специализированных LPU, просто поглотив наиболее перспективную технологию. Пока корпоративный сектор готовится к массовым закупкам, геймерам тоже стоит держать руку на пульсе, ведь Nvidia GTC 2026 готовит сюрприз, где ИИ-технологии могут наконец принести реальную пользу не только дата-центрам, но и домашним ПК.

Подписывайтесь на новости AIcybernews.com в Twitter и Facebook

Другие новости

0 0 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии

Актуально

Последние новости

Intel випустила мобільний процесор Core i7-13645HX. Це представник сімейства Raptor Lake

Корпорація Intel продовжує розширювати модельний ряд процесорів для ноутбуків. Днями вона представила оновлені чипи Core Ultra 200HX, розраховані на використання в ігрових пристроях, а...