banner
Новина публікується у партнерстві з?
logo

На конференції Google Cloud Next ’26 у Лас-Вегасі компанія підтвердила: у другій половині 2026 року Google Cloud стане першим хмарним провайдером, що запропонують клієнтам доступ до NVIDIA Vera Rubin NVL72 — стійкового ШІ-суперкомп’ютера нового покоління.

Системи будуть інтегровані в архітектуру AI Hypercomputer і доступні через нову лінійку інстансів A4 Ultra. Попередній доступ відкривається у регіонах us-central1 та europe-west4 з другого кварталу 2026 року.

Vera Rubin NVL72 — флагманська конфігурація нової платформи NVIDIA Rubin, офіційно представленої на CES 2026 у Лас-Вегасі. Стійка об’єднує 72 GPU Rubin і 36 процесорів Vera CPU, пов’язаних між собою міжз’єднанням NVLink 6 шостого покоління із загальною пропускною здатністю 260 ТБ/с — за твердженням NVIDIA, це більше, ніж сукупна пропускна здатність усього публічного інтернету. Кожен GPU Rubin побудований на 336 мільярдах транзисторів і забезпечує до 50 петафлопів інференсу у форматі NVFP4 — у п’ять разів більше, ніж Blackwell. Загальний обсяг пам’яті HBM4 у стійці — 20,7 ТБ.

Ключова перевага нової платформи — різке зниження вартості інференсу. NVIDIA заявляє про 10-кратне зниження вартості токена порівняно з Blackwell і вчетверо меншу кількість GPU для тренування моделей типу Mixture-of-Experts тієї самої потужності. Крім того, стійка повністю безвентиляторна, безкабельна і охолоджується виключно рідиною — час складання скоротився з двох годин у Blackwell до п’яти хвилин. Уже у першому кварталі 2026 року NVIDIA підтвердила, що Vera Rubin перебуває у повному виробництві.

“Ми позиціонуємо цей крок як стратегічний відхід від виключної ставки на власні TPU: платформа AI Hypercomputer тепер пропонує гетерогенну інфраструктуру — TPU 8-го покоління для JAX-нативних навантажень і Vera Rubin NVL72 для великомасштабного тренування в екосистемі CUDA”, — пише Google.

Доступ до Vera Rubin у другій половині 2026 року також планують AWS, Microsoft Azure та Oracle Cloud, однак Google стала першим із великих провайдерів, хто офіційно підтвердив інтеграцію платформи у власну ШІ-архітектуру — AI Hypercomputer.

Як ми писали раніше, Google вже анонсувала восьме покоління власних TPU — два окремі чіпи TPU 8t і TPU 8i, що забезпечують до 80% кращу продуктивність на долар у сфері інференсу порівняно з попереднім поколінням. Поява Vera Rubin NVL72 в портфоліо Google Cloud означає, що компанія більше не змушує клієнтів обирати між власною і NVIDIA-архітектурою — обидві будуть доступні в межах єдиної платформи.

Android із Chrome є найшвидшою мобільною платформою для перегляду вебу, – бенчмарки Google

Джерело: Google Cloud

Новина публікується у партнерстві з?
logo

Google Cloud Next визначає, як працюватиме бізнес уже завтра

Cloudfresh 🌥️ — глобальний Google Cloud Premier Partner.

Понад 2 500 клієнтів. Більш ніж 70 країн. Cloudfresh 🌥️ допомагають не просто стежити за оновленнями, а впроваджувати їх — від консалтингу та налаштування інфраструктури до безпеки, роботи з даними та ШІ.

У ці хвилини, команда бере участь у Google Cloud Next і вже готова адаптувати інновації під ваші задачі.

Оцінити, що актуально для вас →
#GenerateTheReal✨

Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: