Bolt Graphics заявила про завершення тестування власного GPU Zeus, який, за словами компанії, у 5 разів продуктивніший у трасуванні шляху за NVIDIA RTX 5090.
Продуктивність та характеристики
Bolt Graphics анонсувала чип Zeus минулого року. Компанія підтвердила, що тестовий чип для GPU був виготовлений TSMC за 12-нм техпроцесом FFC. Очікується, що GPU Zeus забезпечуватиме у 6 разів вищу продуктивність у складних обчисленнях.
Виробник обрав дизайн GPU з метою роботи не тільки з іграми, а й застосунками для високопродуктивних обчислень, зокрема на базі ШІ. Bolt Graphics прагнула створити не надто дорогий продукт, який не споживатиме багато енергії та не займатиме надто багато місця у серверній комплектації.
“Платформа Zeus інтегрує спеціальну архітектуру графічного процесора з повним стеком програмного забезпечення для створення уніфікованої системи, призначеної для роботи на багатьох обчислювальних ринках. Платформа використовує відомі напівпровідникові процеси, причому тестовий чип успішно розроблений TSMC за 12 FFC. Масштабована архітектура Zeus також підтримує розширені вузли, включаючи 5 нм”, — зазначають в Bolt Graphics.
Конфігурації та порівняння з NVIDIA RTX 5090
На момент релізу Zeus буде випущений у двох формфакторах — карти PCIe та серверні конфігурації 2U. Модель з одним чипом під назвою “Bolt Zeus 1c26” отримає характеристики:
- Однослотовий PCIe, повнорозмірний формфактор
- 5/10/20 TFLOPs (FP64/FP32/FP16)
- 307,2/614,4 TFLOPs (INT16/INT8)
- 128 Мб вбудованого кешу
- 32 ГБ пам’яті LPDDR5X
- До 160 ГБ зі швидкістю 363 ГБ/с
- 2 слоти для модулів пам’яті DDR5 SO-DIMM
- 77 гігапроменів (Path Tracing)
- 2 потоки 8K60
- TBP 120 Вт

Двочипові конфігурації отримають 64 ГБ та 128 ГБ LPDDR5X та низку наступних характеристик:
- Двослотовий PCIe та повнорозмірний формфактор
- 10/20/40 TFLOPs (FP64/FP32/FP16)
- 614,4/1228,8 TFLOPs (INT16/INT8)
- 256 Мб вбудованого кешу
- До 320-384 ГБ зі швидкістю 725 ГБ/с
- 4 слоти DDR5 SO-DIMM
- 154 гігапромені
- 4 потоки 8K60
- TBP 250 Вт
| Особливості | Bolt Zeus 1c26-032 | Bolt Zeus 2c26-064 | Bolt Zeus 2c26-128 |
| Формфактор | Однослотовий PCIe, повнорозмірний | Двослотовий PCIe, повнорозмірний | Двослотовий PCIe, повнорозмірний |
| TBP | 120 Вт | 250 Вт | 250 Вт |
| Векторні TFLOPS FP64 / FP32 / FP16 | 5 / 10 / 20 | 5 / 10 / 20 | — |
| Матричні TFLOPS INT16 / INT8 | 307.2 / 614.4 | 307.2 / 614.4 | — |
| Кеш | 128 Мб | 256 Мб | 256 Мб |
| Пам’ять | До 160 ГБ з 363 ГБ/c 32 ГБ LPDDR5X 2x DDR5 SO-DIMM | До 320 ГБ з 725 ГБ/с 64 ГБ LPDDR5X 4x DDR5 SO-DIMM | До 384 ГБ з 725 ГБ/с 128 ГБ LPDDR5X 4x DDR5 SO-DIMM |
| Трасування | 77 гігапроменів | 154 гігапроменя | — |
| Кодування й декодування відео (AV1, H.264/265) | 2 потоки 8K60 | 4 потоки 8K60 | 4 потоки 8K60 |
| Введення/виведення | 400 GbE (QSFP-DD) й GbE (RJ-45 BMC) 2x PCIe 5.0 x16 DisplayPort 2.1a та HDMI 2.1b | 400 GbE (QSFP-DD) й GbE (RJ-45 BMC) 2x PCIe 5.0 x16 DisplayPort 2.1a та HDMI 2.1b | 400 GbE (QSFP-DD) й GbE (RJ-45 BMC) 2x PCIe 5.0 x16 |
Сервер Bolt Zeus 2U додатково збільшує продуктивність завдяки вбудованому кешу обсягом до 2 ГБ, обсягу пам’яті 9,2 ТБ зі швидкістю 5,8 ТБ/с, пам’яті LPDDR5X на 1 ТБ, модулям DDR5 DIMM обсягом 32 ГБ з можливістю трасування до 1228 гігапроменів.
У оновлених даних Bolt Graphics щодо продуктивності зазначається п’ятикратне збільшення продуктивності трасування порівняно з RTX 5090. При цьому порівнюється двочипова конфігурація Zeus 2c26 потужністю 250 Вт з відеокартою RTX 5090 потужністю 575 Вт. Показники високопродуктивних обчислень (HPC) демонструють шестикратне збільшення, а продуктивність електромагнітного моделювання збільшена в 300 разів, хоча порівнюється 4c26-256 Zeus з чотирма обчислювальними чиплетами з однією відеокартою RTX 5090.

Головними перевагами Zeus залишаються використання пам’яті LPDDR5X та DDR5 замість дорожчої GDDR DRAM. Конфігурація Zeus Rack передбачає у 19 разів більший обсяг пам’яті ніж в NVIDIA RTX PRO Blackwell Rack. Вартість TCO при цьому нижча у 17 разів порівняно з NVIDIA для високопродуктивних обчислень та трасування променів.
Нюанси
Початковий тестовий чип побудований на 12-нм техпроцесі TSMC 12FFC, що суперечить попереднім заявам Bolt Graphics у рамках CES про розробку на базі 5-нм техпроцесу. У компанії запевняють, що архітектура масштабована під сучасніші техпроцеси. Технічно застарілий техпроцес накладає обмеження на щільність транзисторів та ефективність. Це ускладнює безпосереднє порівняння з сучасними топовими GPU.
Архітектура Zeus відрізняється від традиційних GPU AMD та NVIDIA. Замість звичайних конвеєрів на основі шейдерів, інтегровані ядра RISC-V спільно з користувацькими прискорювачами, розробленими спеціально для трасування. Використана Bolt метрика гігапромені не є загальноприйнятим мережевим стандартом, а порівняльні дані надані самою компанією за відсутності незалежного тестування.
За наявними даними, GPU забезпечує близько 5 TFLOPS продуктивності в FP64, значно перевершуючи споживчі графічні процесори, однак пропускна здатність FP32 обмежується близько 10 TFLOPS, тоді як RTX 5090 забезпечує 105 TFLOPS. При тому, що сучасні ігри значно більше покладаються на FP32-продуктивність. Це вказує, що архітектура більше оптимізована під наукові обчислення та моделювання, а не під ігри або загальну графіку.
Продуктивність ШІ також має бути обмеженою, оскільки сучасні задачі машинного навчання значною мірою залежать від операцій з тензорами FP32 , FP16 та нижче. Конфігурація пам’яті Zeus також використовує LPDDR5X з можливістю розширення до DDR5 SODIMM обсягом до 160 ГБ, однак з пропускною здатністю 363 ГБ/с. Такі відеокарти як RTX 5090 використовують GDDR7 зі значно вищою пропускною здатністю, що критично для ігор та задач для ШІ.
Компанія Bolt Graphics планує розпочати масове виробництво графічного процесора Zeus у четвертому кварталі 2027 року. На даному етапі архітектура, мабуть, є експериментальним і вузькоспеціалізованим обчислювальним рішенням, а не прямим конкурентом високопродуктивним ігровим графічним процесорам.
Раніше ми писали, що компанія Bolt Graphics оприлюднила технічні характеристики власних відеокарт серії Zeus. NVIDIA продемонструвала нове покоління платформи для датацентрів — tray-рішення для GPU Rubin Ultra.
Джерело: Wccftech; The Guru3d



Повідомити про помилку
Текст, який буде надіслано нашим редакторам: