NVIDIA представляет Rubin: шесть новых чипов для следующего поколения суперкомпьютера ИИ

Кратко

Nvidia представила платформу Rubin на CES 2026, объединив шесть новых чипов в единый суперкомпьютер для ИИ, обеспечивающий в 5 раз больше вычислительных ресурсов для обучения по сравнению с серией Blackwell.

NVIDIA Unveils Rubin: Six New Chips Power Next-Gen AI Supercomputer

Технологическая компания NVIDIA представила платформу Rubin на CES 2026, создав единый суперкомпьютер для ИИ, основанный на шести новых чипах, которые вместе обеспечивают в пять раз больше вычислительных мощностей для обучения, чем серия Blackwell. Платформа предназначена для установления нового стандарта в построении, развертывании и обеспечении безопасности крупномасштабных систем ИИ при минимизации затрат, что способствует более широкому внедрению технологий ИИ.

Платформа Rubin достигает своей производительности за счет тесного совместного проектирования шести компонентов: процессора NVIDIA Vera CPU, графического процессора NVIDIA Rubin GPU, коммутатора NVIDIA NVLink 6 Switch, суперNIC NVIDIA ConnectX-9, DPU NVIDIA BlueField-4 и Ethernet-коммутатора NVIDIA Spectrum-6. Такой интегрированный подход сокращает время обучения и снижает стоимость обработки токенов.

Rubin вводит пять ключевых инноваций, включая межсоединения следующего поколения NVLink, движок Transformer Engine, конфиденциальные вычисления, движок RAS и процессор NVIDIA Vera CPU. Эти достижения позволяют реализовать агентный ИИ, расширенное логическое мышление и inference моделей с миксом экспертов (MoE) на стоимости до десяти раз ниже за токен по сравнению с платформой Blackwell. Система может обучать модели MoE с в четыре раза меньшим количеством GPU, что дополнительно ускоряет внедрение ИИ.

Ожидается, что платформу развернут ведущие лаборатории ИИ, облачные провайдеры, производители аппаратного обеспечения и стартапы, включая Amazon Web Services (AWS), Anthropic, Black Forest Labs, Cisco, Cohere, CoreWeave, Cursor, Dell Technologies, Google, Harvey, HPE, Lambda, Lenovo, Meta, Microsoft, Mistral AI, Nebius, Nscale, OpenAI, OpenEvidence, Oracle Cloud Infrastructure (OCI), Perplexity, Runway, Supermicro, Thinking Machines Lab и xAI.

Представление хранилища и программно-определяемой инфраструктуры для фабрик ИИ

NVIDIA Rubin представляет собой хранилище данных, ориентированное на ИИ, и безопасную, программно-определяемую инфраструктуру, предназначенную для эффективной поддержки крупномасштабных нагрузок ИИ. Платформа NVIDIA Inference Context Memory Storage, основанная на BlueField-4, позволяет быстро обмениваться и повторно использовать кеш-данные ключ-значение, повышая пропускную способность и энергоэффективность для многоходовых агентных приложений ИИ. BlueField-4 также включает расширенную архитектуру доверенных ресурсов (ASTRA), обеспечивающую единый доверенный контрольный пункт для безопасного предоставления ресурсов и изоляции в средах с голым металлом и мультиарендных средах ИИ.

Платформа предлагается в нескольких конфигурациях, включая Vera Rubin NVL72, которая объединяет 72 Rubin GPU, 36 Vera CPU, NVLink 6, ConnectX-9 SuperNIC и BlueField-4 DPU, а также HGX Rubin NVL8, связывающую восемь Rubin GPU для поддержки генеративных платформ на базе x86. NVIDIA DGX SuperPOD служит эталонной архитектурой для масштабного развертывания систем Rubin, объединяя вычисления, сеть и программное обеспечение управления.

Следующее поколение сетевых решений и хранилищ обеспечивается платформами Spectrum-6 и Spectrum-X Ethernet, оснащенными интегрированными оптиками, оптимизированными для ИИ сетями и высокоскоростной коммуникацией SerDes 200G. Эти инновации обеспечивают повышенную надежность, энергоэффективность и масштабируемость, позволяя фабрикам ИИ на базе Rubin работать на нескольких площадках как единая среда и поддерживая будущие инфраструктуры с миллионами GPU.

NVIDIA Rubin в полном производстве, готов к развертыванию в облаке и лабораториях ИИ

Новая платформа вышла на полное производство, и системы на базе Rubin ожидается начать поставлять через партнеров во второй половине 2026 года. Крупные облачные провайдеры, такие как AWS, Google Cloud, Microsoft и OCI, а также партнеры NVIDIA Cloud, такие как CoreWeave, Lambda, Nebius и Nscale, уже первыми начнут развертывать инстансы с Rubin. Microsoft планирует интегрировать системы NVIDIA Vera Rubin NVL72 в новые дата-центры ИИ следующего поколения, включая будущие площадки Fairwater AI, создавая основу для передовых нагрузок обучения и inference в корпоративных, исследовательских и потребительских приложениях.

CoreWeave включит системы Rubin в свою облачную платформу ИИ, поддерживая различные архитектуры и обеспечивая оптимизированную производительность для обучения, inference и агентных нагрузок ИИ. Cisco, Dell, HPE, Lenovo и Supermicro также планируют предлагать серверы на базе продуктов Rubin. Ведущие лаборатории ИИ, такие как Anthropic, Cohere, OpenAI, Meta и другие, используют Rubin для обучения более крупных и мощных моделей, а также для поддержки систем с длинным контекстом и мультимодальных систем с меньшей задержкой и затратами по сравнению с предыдущими поколениями GPU.

Партнеры по инфраструктуре и хранилищам, такие как IBM, NetApp, Nutanix, Pure Storage, SUSE и VAST Data, сотрудничают с NVIDIA по разработке платформ следующего поколения Rubin. Rubin представляет собой третье поколение архитектуры NVIDIA на уровне стойки, поддерживаемое более чем 80 партнерами экосистемы MGX. Red Hat объявила о расширенном сотрудничестве для предоставления полного стека ИИ, оптимизированного для Rubin, с использованием своего гибридного облачного портфеля, включающего Red Hat Enterprise Linux, OpenShift и Red Hat AI, широко используемых в компаниях из списка Fortune Global 500.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить