Rubin Ultra от NVIDIA: первый чип для GPU с 1 ТБ памяти

Опубликовал Шадрін Андрій

NVIDIA в понедельник продемонстрировала новое поколение платформы для дата-центров — tray-решение для GPU Rubin Ultra. Чип использует 4 вычислительных чиплета и оснащен 1 ТБ памяти HBM4E. Это делает его первым в отрасли AI-ускорителем с терабайтом памяти.

Релиз чипа запланирован на 2027 год. Платформа базируется на новой rack-scale архитектуре Kyber, которая объединяет 144 GPU-пакета, значительно повышая производительность по сравнению с текущими системами NVL72. Судя по демонстрации, пакет Rubin Ultra из четырех чиплетов использует новую технологию упаковки, однако точная реализация GPU неизвестна, поскольку теплораспределитель закрывает кристалл. Также нет подтверждения, завершена ли стадия tape-out.

Привлекает внимание относительно небольшой размер пакета, что может свидетельствовать об использовании стековой архитектуры, хотя это лишь предположение. Tray Rubin Ultra почти полностью лишен кабелей, что упрощает сборку серверов. В то же время это может означать, что NVIDIA будет продавать готовые tray-модули, уменьшая роль партнеров до составления rack-систем, а не разработки собственных материнских плат и серверных платформ.

Фото: NVIDIA

Вместе с Rubin Ultra компания внедряет новый тип стоек Kyber, которые используют вертикальное размещение tray вместо горизонтального, а также жидкостное охлаждение по умолчанию. Такая конфигурация позволяет разместить 144 GPU-пакета в одной стойке. Системы Kyber NVL144 на базе Rubin Ultra обеспечат как минимум вчетверо более высокую производительность по сравнению с Oberon NVL72, поскольку удваивается как количество GPU-чиплетов в пакете, так и общее количество пакетов. Кроме того, стойка Kyber от NVIDIA обновит коммутатор NVLink с шестого поколения до седьмого поколения, который сохранит скорость 3600 ГБ/с, но позволит увеличить количество GPU.

Также NVIDIA планирует представить свой Ethernet-процессор CX9-1600G для ускорения масштабируемых (scale-out) коммуникаций. Дополнительно, в дорожной карте NVIDIA говорится о значительном масштабирование вычислительных кластеров на базе Rubin Ultra. В частности, система уровня NVL576 может объединять до 576 GPU и более 12 000 CPU ядер, формируя единый кластер с суммарной производительностью до 15 экзафлопс (FP4) и пропускной способностью межсоединений на уровне до 1,5 ПБ/с. Это фактически ориентир на построение полноценных AI-фабрик, способных обрабатывать гигантские модели и multi-agent системы в пределах одного дата-центра.

Фото: NVIDIA

Отдельно NVIDIA делает ставку на связь GPU с новыми CPU Vera: речь идет об Arm-процессорах с 88 ядрами и пропускной способностью NVLink-C2C до 1,8 ТБ/с, что критично для уменьшения задержек в задачах ИИ. В предыдущем поколении Rubin также заявлена пропускная способность памяти до 22 ТБ/с и производительность около 50 PFLOPS (FP4) на чип, что дает представление о базе, от которой будет масштабироваться Ultra-версия с четырьмя кристаллами и HBM4e.

На фоне объявлений о чипе СЕО NVIDIA Дженсен Хуанг также заявил, что совокупный портфель заказов на платформы Blackwell и Vera Rubin к концу 2027 года достигнет $1 трлн долларов — вдвое больше прошлогоднего прогноза в $500 млрд. За последние 11 кварталов подряд NVIDIA фиксирует рост выручки более 55% год к году; в текущем квартале ожидается скачок на 77% — до примерно $78 млрд долларов.

Источник: Toms Hardware

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.