На собственном мероприятии в рамках проходящей сейчас выставки SIGGRAPH 2018 компания NVIDIA сделала долгожданный анонс — официально представила первый графический процессор на архитектуре нового поколения Turing. Отличительной особенностью GPU нового поколения является специализированный вычислительный блок RT Core для поддержки трассировки лучей, комплексной технологии, которая обеспечивает разработчикам контента рендеринг кинематографического качества в реальном времени. Как обычно, внедрение новой архитектуры начинается с профессионального сегмента.
Калифорнийский чипмейкер называет новый графический ускоритель Quadro RTX поколения Turing первым GPU с поддержкой трассировки лучей и дабы отдельно подчеркнуть значимость нововведения сравнивает его с введением ядер CUDA в 2006 году.
Повторимся, линейка ускорителей Quadro RTX – это профессиональные ускорители (для рабочих станций, серверов и так далее), а не игровые. Флагманский графический ускоритель Quadro RTX 8000 будет стоить $10 000 после поступления в продажу в конце этого года.
Основой Quadro RTX 8000 служит GPU с 4608 ядрами CUDA, 48 ГБ новой видеопамяти GDDR6 и 576 блоками Tensor Cores. Последние, напомним, предназначены для вычислений, связанных с нейросетями, машинным и глубинным обучением.
Что же касается производительности, то она достигает 16 TFLOPS при вычислениях с одинарной точностью (FP32), а в расчетах половинной точности – 32 TFLOPS. Отдельно указывается оценка производительности блоков в операциях машинного и глубокого обучения – 500 TOPs (триллион тензорных операций в секунду). Ну вычислительная трассировочная мощь равна 10 GigaRays/sec (гигалучей/сек).
Кроме флагманской RTX 8000 были представлены еще две модели RTX 6000 и 5000, которые являются урезанными вариантами флагмана.
Ускорители Quadro RTX можно будет объединять, используя мостик NVLink. Кроме того, они поддерживают новый стандарт VirtualLink, который служит для подключения гарнитур VR к ПК и другим устройствам с использованием одного разъема USB Type-C.
Теперь осталось дождаться анонса игровых адаптеров поколения Turing и оценить на практике, что даст блок RT Core и долгожданная трассировка лучей в играх. Напомним, премьера новой флагманской игровой видеокарты NVIDIA ожидается через неделю на выставке Gamescom 2018.
Ниже в таблице вы найдете остальные характеристики ускорителя Quadro RTX 8000 (те, что известны), а также сможете сравнить их с параметрами предшественников NVIDIA Quadro.
Видеокарта | NVIDIA RTX 8000 | NVIDIA GV100 | NVIDIA P6000 | NVIDIA M6000 |
Графическая архитектура | Turing | Volta | Pascal | Maxwell 2 |
GPU | Н/Д | GV100 | GP102 | GM200 |
Техпроцесс | ? | TSMC 12nm FFN | TSMC 16nm | TSMC 28nm |
Площадь кристалла GPU, мм2 | 754 | 815 | 471 | 601 |
Количество транзисторов, млрд шт | 18,6 | 21,1 | 11,8 | 8 |
Общее количество ядер CUDA, шт | 4608 | 5120 | 3840 | 3072 |
Число ядер Tensor Cores, шт | 576 | 640 | — | — |
Число блоков растровых операций (ROP) | 96? | 128 | 96 | 96 |
Частота GPU в режиме Boost, МГц | ~1730? | ~1450 | ~1560 | ~1140 |
Видеопамять тип/объем, ГБ | GDDR6 /48 | HBM2/32 | GDDR5X /24 | GDDR524 |
Пропускная способность одного контакта памяти, Гбит/с | 14 | 1,7 | 9 | 6,6 |
Ширина шины обмена с памятью, разрядов | 384 | 4096 | 384 | 384 |
Поддержка ECC | ? | полная | частичная | частичная |
Производительность при вычислениях с половинной точностью (FP16), TFLOPS | 32? | 29,6? | Н/Д | Н/Д |
Производительность при вычислениях с одинарной точностью (FP32), TFLOPS | 16 | 14,8 | 12 | 7 |
Производительность при вычислениях с двойной точностью (FP64), TFLOPS | ? | 7,4 | 0,38 | 0,22 |
Производительность блока ядер Tenzor | 500T «TOPs» (INT4) | 118.5 TFLOPS (FP16) | Н/Д | Н/Д |
Пиковая потребляемая мощность TDP, Вт | ? | 250 | 250 | 250 |
Дата выхода | 4 кв 2018 года | Март 2018 года | Октябрь 2016 года | Март 2016 года |
Еще одна таблица со сравнением разных типов памяти в GPU NVIDIA:
Видеокарта | NVIDIA Quadro RTX 8000 (GDDR6) | NVIDIA Quadro RTX 5000 (GDDR6) | NVIDIA Titan V (HBM2) | NVIDIA Titan Xp | NVIDIA GeForce GTX 1080 Ti | NVIDIA GeForce GTX 1080 |
Общий объем памяти, ГБ | 48 | 16 | 12 | 12 | 11 | 8 |
Пропускная способность одного контакта памяти, Гбит/с | 14 | 1,7 | 11,4 | 11 | ||
Объем одной микросхемы памяти, ГБ | 2 | 4 | 1 | |||
Количество микросхем памяти на плате, шт | 24 | 8 | 3 | 12 | 11 | 8 |
Разрядность шины обмена с памятью, бит | 384 | 256 | 3092 | 384 | 352 | 256 |
Полоса пропускания видеопамяти, Гбайт/с | 672 | 448 | 652,8 | 547,7 | 484 | 352 |
Напряжение памяти, В | 1,35 | 1,2? | 1,35 |
Источник: anandtech