На собственном мероприятии в рамках проходящей сейчас выставки SIGGRAPH 2018 компания NVIDIA сделала долгожданный анонс — официально представила первый графический процессор на архитектуре нового поколения Turing. Отличительной особенностью GPU нового поколения является специализированный вычислительный блок RT Core для поддержки трассировки лучей, комплексной технологии, которая обеспечивает разработчикам контента рендеринг кинематографического качества в реальном времени. Как обычно, внедрение новой архитектуры начинается с профессионального сегмента.

Калифорнийский чипмейкер называет новый графический ускоритель Quadro RTX поколения Turing первым GPU с поддержкой трассировки лучей и дабы отдельно подчеркнуть значимость нововведения сравнивает его с введением ядер CUDA в 2006 году.

Повторимся, линейка ускорителей Quadro RTX – это профессиональные ускорители (для рабочих станций, серверов и так далее), а не игровые. Флагманский графический ускоритель Quadro RTX 8000 будет стоить $10 000 после поступления в продажу в конце этого года.

Основой Quadro RTX 8000 служит GPU с 4608 ядрами CUDA, 48 ГБ новой видеопамяти GDDR6 и 576 блоками Tensor Cores. Последние, напомним, предназначены для вычислений, связанных с нейросетями, машинным и глубинным обучением.

Что же касается производительности, то она достигает 16 TFLOPS при вычислениях с одинарной точностью (FP32), а в расчетах половинной точности – 32 TFLOPS. Отдельно указывается оценка производительности блоков в операциях машинного и глубокого обучения – 500 TOPs (триллион тензорных операций в секунду). Ну вычислительная трассировочная мощь равна 10 GigaRays/sec (гигалучей/сек).

Кроме флагманской RTX 8000 были представлены еще две модели RTX 6000 и 5000, которые являются урезанными вариантами флагмана.

Ускорители Quadro RTX можно будет объединять, используя мостик NVLink. Кроме того, они поддерживают новый стандарт VirtualLink, который служит для подключения гарнитур VR к ПК и другим устройствам с использованием одного разъема USB Type-C.

Теперь осталось дождаться анонса игровых адаптеров поколения Turing и оценить на практике, что даст блок RT Core и долгожданная трассировка лучей в играх. Напомним, премьера новой флагманской игровой видеокарты NVIDIA ожидается через неделю на выставке Gamescom 2018.

Ниже в таблице вы найдете остальные характеристики ускорителя Quadro RTX 8000 (те, что известны), а также сможете сравнить их с параметрами предшественников NVIDIA Quadro.

Видеокарта	NVIDIA RTX 8000	NVIDIA GV100	NVIDIA P6000	NVIDIA M6000
Графическая архитектура	Turing	Volta	Pascal	Maxwell 2
GPU	Н/Д	GV100	GP102	GM200
Техпроцесс	?	TSMC 12nm FFN	TSMC 16nm	TSMC 28nm
Площадь кристалла GPU, мм²	754	815	471	601
Количество транзисторов, млрд шт	18,6	21,1	11,8	8
Общее количество ядер CUDA, шт	4608	5120	3840	3072
Число ядер Tensor Cores, шт	576	640	—	—
Число блоков растровых операций (ROP)	96?	128	96	96
Частота GPU в режиме Boost, МГц	~1730?	~1450	~1560	~1140
Видеопамять тип/объем, ГБ	GDDR6 /48	HBM2/32	GDDR5X /24	GDDR524
Пропускная способность одного контакта памяти, Гбит/с	14	1,7	9	6,6
Ширина шины обмена с памятью, разрядов	384	4096	384	384
Поддержка ECC	?	полная	частичная	частичная
Производительность при вычислениях с половинной точностью (FP16), TFLOPS	32?	29,6?	Н/Д	Н/Д
Производительность при вычислениях с одинарной точностью (FP32), TFLOPS	16	14,8	12	7
Производительность при вычислениях с двойной точностью (FP64), TFLOPS	?	7,4	0,38	0,22
Производительность блока ядер Tenzor	500T «TOPs» (INT4)	118.5 TFLOPS (FP16)	Н/Д	Н/Д
Пиковая потребляемая мощность TDP, Вт	?	250	250	250
Дата выхода	4 кв 2018 года	Март 2018 года	Октябрь 2016 года	Март 2016 года

Еще одна таблица со сравнением разных типов памяти в GPU NVIDIA:

Видеокарта	NVIDIA Quadro RTX 8000 (GDDR6)	NVIDIA Quadro RTX 5000 (GDDR6)	NVIDIA Titan V (HBM2)	NVIDIA Titan Xp	NVIDIA GeForce GTX 1080 Ti	NVIDIA GeForce GTX 1080
Общий объем памяти, ГБ	48	16	12	12	11	8
Пропускная способность одного контакта памяти, Гбит/с	14		1,7	11,4	11
Объем одной микросхемы памяти, ГБ	2		4	1
Количество микросхем памяти на плате, шт	24	8	3	12	11	8
Разрядность шины обмена с памятью, бит	384	256	3092	384	352	256
Полоса пропускания видеопамяти, Гбайт/с	672	448	652,8	547,7	484	352
Напряжение памяти, В	1,35		1,2?	1,35