Новости
NVIDIA представила GPU нового поколения Turing со специализированным блоком трассировки лучей RT Core (пока только в профессиональных ускорителях Quadro)

NVIDIA представила GPU нового поколения Turing со специализированным блоком трассировки лучей RT Core (пока только в профессиональных ускорителях Quadro)

NVIDIA представила GPU нового поколения Turing со специализированным блоком трассировки лучей RT Core (пока только в профессиональных ускорителях Quadro)


На собственном мероприятии в рамках проходящей сейчас выставки SIGGRAPH 2018 компания NVIDIA сделала долгожданный анонс — официально представила первый графический процессор на архитектуре нового поколения Turing. Отличительной особенностью GPU нового поколения является специализированный вычислительный блок RT Core для поддержки трассировки лучей, комплексной технологии, которая обеспечивает разработчикам контента рендеринг кинематографического качества в реальном времени. Как обычно, внедрение новой архитектуры начинается с профессионального сегмента.

NVIDIA представила GPU нового поколения Turing со специализированным блоком трассировки лучей RT Core (пока только в профессиональных ускорителях Quadro)

Калифорнийский чипмейкер называет новый графический ускоритель Quadro RTX поколения Turing первым GPU с поддержкой трассировки лучей и дабы отдельно подчеркнуть значимость нововведения сравнивает его с введением ядер CUDA в 2006 году.

NVIDIA представила GPU нового поколения Turing со специализированным блоком трассировки лучей RT Core (пока только в профессиональных ускорителях Quadro)

Повторимся, линейка ускорителей Quadro RTX – это профессиональные ускорители (для рабочих станций, серверов и так далее), а не игровые. Флагманский графический ускоритель Quadro RTX 8000 будет стоить $10 000 после поступления в продажу в конце этого года.

Основой Quadro RTX 8000 служит GPU с 4608 ядрами CUDA, 48 ГБ новой видеопамяти GDDR6 и 576 блоками Tensor Cores. Последние, напомним, предназначены для вычислений, связанных с нейросетями, машинным и глубинным обучением.

Что же касается производительности, то она достигает 16 TFLOPS при вычислениях с одинарной точностью (FP32), а в расчетах половинной точности – 32 TFLOPS. Отдельно указывается оценка производительности блоков в операциях машинного и глубокого обучения – 500 TOPs (триллион тензорных операций в секунду). Ну вычислительная трассировочная мощь равна 10 GigaRays/sec (гигалучей/сек).

Кроме флагманской RTX 8000 были представлены еще две модели RTX 6000 и 5000, которые являются урезанными вариантами флагмана.

Ускорители Quadro RTX можно будет объединять, используя мостик NVLink. Кроме того, они поддерживают новый стандарт VirtualLink, который служит для подключения гарнитур VR к ПК и другим устройствам с использованием одного разъема USB Type-C.

Теперь осталось дождаться анонса игровых адаптеров поколения Turing и оценить на практике, что даст блок RT Core и долгожданная трассировка лучей в играх. Напомним, премьера новой флагманской игровой видеокарты NVIDIA ожидается через неделю на выставке Gamescom 2018.

Ниже в таблице вы найдете остальные характеристики ускорителя Quadro RTX 8000 (те, что известны), а также сможете сравнить их с параметрами предшественников NVIDIA Quadro.

Видеокарта NVIDIA RTX 8000 NVIDIA GV100 NVIDIA P6000 NVIDIA M6000
Графическая архитектура Turing Volta Pascal Maxwell 2
GPU Н/Д GV100 GP102 GM200
Техпроцесс ? TSMC 12nm FFN TSMC 16nm TSMC 28nm
Площадь кристалла GPU, мм2 754 815 471 601
Количество транзисторов, млрд шт 18,6 21,1 11,8 8
Общее количество ядер CUDA, шт 4608 5120 3840 3072
Число ядер Tensor Cores, шт 576 640
Число блоков растровых операций (ROP) 96? 128 96 96
Частота GPU в режиме Boost, МГц ~1730? ~1450 ~1560 ~1140
Видеопамять тип/объем, ГБ GDDR6 /48 HBM2/32 GDDR5X /24 GDDR524
Пропускная способность одного контакта памяти, Гбит/с 14 1,7 9 6,6
Ширина шины обмена с памятью, разрядов 384 4096 384 384
Поддержка ECC ? полная частичная частичная
Производительность при вычислениях с половинной точностью (FP16), TFLOPS 32? 29,6? Н/Д Н/Д
Производительность при вычислениях с одинарной точностью (FP32), TFLOPS 16 14,8 12 7
Производительность при вычислениях с двойной точностью (FP64), TFLOPS ? 7,4 0,38 0,22
Производительность блока ядер Tenzor

500T «TOPs»

(INT4)

118.5 TFLOPS (FP16) Н/Д Н/Д
Пиковая потребляемая мощность TDP, Вт ? 250 250 250
Дата выхода 4 кв 2018 года Март 2018 года Октябрь 2016 года Март 2016 года

 

Еще одна таблица со сравнением разных типов памяти в GPU NVIDIA:

 

Видеокарта

NVIDIA Quadro RTX 8000

(GDDR6)

NVIDIA Quadro RTX 5000

(GDDR6)

NVIDIA Titan V

(HBM2)

NVIDIA Titan Xp NVIDIA GeForce GTX 1080 Ti NVIDIA GeForce GTX 1080
Общий объем памяти, ГБ 48 16 12 12 11 8
Пропускная способность одного контакта памяти, Гбит/с 14 1,7 11,4 11
Объем одной микросхемы памяти, ГБ 2 4 1
Количество микросхем памяти на плате, шт 24 8 3 12 11 8
Разрядность шины обмена с памятью, бит 384 256 3092 384 352 256
Полоса пропускания видеопамяти, Гбайт/с 672 448 652,8 547,7 484 352
Напряжение памяти, В 1,35 1,2? 1,35

Источник: anandtech


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: