Rubin Ultra від NVIDIA: перший чіп для GPU з 1 ТБ пам'яті — Photo: NVIDIA

NVIDIA у понеділок продемонструвала нове покоління платформи для дата-центрів — tray-рішення для GPU Rubin Ultra. Чіп використовує 4 обчислювальні чіплети та оснащений 1 ТБ пам’яті HBM4E. Це робить його першим у галузі AI-прискорювачем із терабайтом пам’яті.

Реліз чіпа запланований на 2027 рік. Платформа базується на новій rack-scale архітектурі Kyber, яка об’єднує 144 GPU-пакети, значно підвищуючи продуктивність порівняно з поточними системами NVL72. Судячи з демонстрації, пакет Rubin Ultra з чотирьох чіплетів використовує нову технологію упаковки, однак точна реалізація GPU невідома, оскільки теплорозподільник закриває кристал. Також немає підтвердження, чи завершено стадію tape-out.

Привертає увагу відносно невеликий розмір пакета, що може свідчити про використання стекової архітектури, хоча це лише припущення. Tray Rubin Ultra майже повністю позбавлений кабелів, що спрощує складання серверів. Водночас це може означати, що NVIDIA продаватиме готові tray-модулі, зменшуючи роль партнерів до складання rack-систем, а не розробки власних материнських плат і серверних платформ.

Разом із Rubin Ultra компанія впроваджує новий тип стійок Kyber, які використовують вертикальне розміщення tray замість горизонтального, а також рідинне охолодження за замовчуванням. Така конфігурація дозволяє розмістити 144 GPU-пакети в одній стійці. Системи Kyber NVL144 на базі Rubin Ultra забезпечать щонайменше вчетверо вищу продуктивність порівняно з Oberon NVL72, оскільки подвоюється як кількість GPU-чіплетів у пакеті, так і загальна кількість пакетів. Крім того, стійка Kyber від NVIDIA оновить комутатор NVLink із шостого покоління до сьомого покоління, який збереже швидкість 3600 ГБ/с, але дозволить збільшити кількість GPU.

Також NVIDIA планує представити свій Ethernet-процесор CX9-1600G для прискорення масштабованих (scale-out) комунікацій. Додатково, у дорожній карті NVIDIA йдеться про значне масштабування обчислювальних кластерів на базі Rubin Ultra. Зокрема, система рівня NVL576 може об’єднувати до 576 GPU та понад 12 000 CPU ядер, формуючи єдиний кластер із сумарною продуктивністю до 15 екзафлопс (FP4) і пропускною здатністю міжз’єднань на рівні до 1,5 ПБ/с. Це фактично орієнтир на побудову повноцінних AI-фабрик, здатних обробляти гігантські моделі та multi-agent системи в межах одного дата-центру.

Окремо NVIDIA робить ставку на зв’язок GPU з новими CPU Vera: йдеться про Arm-процесори з 88 ядрами та пропускною здатністю NVLink-C2C до 1,8 ТБ/с, що критично для зменшення затримок у задачах ШІ. У попередньому поколінні Rubin також заявлена пропускна здатність пам’яті до 22 ТБ/с і продуктивність близько 50 PFLOPS (FP4) на чіп, що дає уявлення про базу, від якої масштабуватиметься Ultra-версія з чотирма кристалами і HBM4e.

На тлі оголошень про чіп СЕО NVIDIA Дженсен Хуанг також заявив, що сукупний портфель замовлень на платформи Blackwell і Vera Rubin до кінця 2027 року сягне $1 трлн доларів — удвічі більше за торішній прогноз у $500 млрд. За останні 11 кварталів поспіль NVIDIA фіксує зростання виручки понад 55% рік до року; у поточному кварталі очікується стрибок на 77% — до приблизно $78 млрд доларів.