На конференції Google Cloud Next ’26 у Лас-Вегасі компанія підтвердила: у другій половині 2026 року Google Cloud стане першим хмарним провайдером, що запропонують клієнтам доступ до NVIDIA Vera Rubin NVL72 — стійкового ШІ-суперкомп’ютера нового покоління.
Системи будуть інтегровані в архітектуру AI Hypercomputer і доступні через нову лінійку інстансів A4 Ultra. Попередній доступ відкривається у регіонах us-central1 та europe-west4 з другого кварталу 2026 року.
Vera Rubin NVL72 — флагманська конфігурація нової платформи NVIDIA Rubin, офіційно представленої на CES 2026 у Лас-Вегасі. Стійка об’єднує 72 GPU Rubin і 36 процесорів Vera CPU, пов’язаних між собою міжз’єднанням NVLink 6 шостого покоління із загальною пропускною здатністю 260 ТБ/с — за твердженням NVIDIA, це більше, ніж сукупна пропускна здатність усього публічного інтернету. Кожен GPU Rubin побудований на 336 мільярдах транзисторів і забезпечує до 50 петафлопів інференсу у форматі NVFP4 — у п’ять разів більше, ніж Blackwell. Загальний обсяг пам’яті HBM4 у стійці — 20,7 ТБ.
Ключова перевага нової платформи — різке зниження вартості інференсу. NVIDIA заявляє про 10-кратне зниження вартості токена порівняно з Blackwell і вчетверо меншу кількість GPU для тренування моделей типу Mixture-of-Experts тієї самої потужності. Крім того, стійка повністю безвентиляторна, безкабельна і охолоджується виключно рідиною — час складання скоротився з двох годин у Blackwell до п’яти хвилин. Уже у першому кварталі 2026 року NVIDIA підтвердила, що Vera Rubin перебуває у повному виробництві.
“Ми позиціонуємо цей крок як стратегічний відхід від виключної ставки на власні TPU: платформа AI Hypercomputer тепер пропонує гетерогенну інфраструктуру — TPU 8-го покоління для JAX-нативних навантажень і Vera Rubin NVL72 для великомасштабного тренування в екосистемі CUDA”, — пише Google.
Доступ до Vera Rubin у другій половині 2026 року також планують AWS, Microsoft Azure та Oracle Cloud, однак Google стала першим із великих провайдерів, хто офіційно підтвердив інтеграцію платформи у власну ШІ-архітектуру — AI Hypercomputer.
Як ми писали раніше, Google вже анонсувала восьме покоління власних TPU — два окремі чіпи TPU 8t і TPU 8i, що забезпечують до 80% кращу продуктивність на долар у сфері інференсу порівняно з попереднім поколінням. Поява Vera Rubin NVL72 в портфоліо Google Cloud означає, що компанія більше не змушує клієнтів обирати між власною і NVIDIA-архітектурою — обидві будуть доступні в межах єдиної платформи.
Android із Chrome є найшвидшою мобільною платформою для перегляду вебу, – бенчмарки Google
Джерело: Google Cloud
Google Cloud Next визначає, як працюватиме бізнес уже завтра
Cloudfresh 🌥️ — глобальний Google Cloud Premier Partner.
Понад 2 500 клієнтів. Більш ніж 70 країн. Cloudfresh 🌥️ допомагають не просто стежити за оновленнями, а впроваджувати їх — від консалтингу та налаштування інфраструктури до безпеки, роботи з даними та ШІ.
У ці хвилини, команда бере участь у Google Cloud Next і вже готова адаптувати інновації під ваші задачі.
Оцінити, що актуально для вас →
#GenerateTheReal✨




Повідомити про помилку
Текст, який буде надіслано нашим редакторам: