Новости
Раскрыты особенности архитектуры и характеристики первых GPU NVIDIA Turing
7

Раскрыты особенности архитектуры и характеристики первых GPU NVIDIA Turing

Раскрыты особенности архитектуры и характеристики первых GPU NVIDIA Turing

Недавно NVIDIA анонсировала видеокарты на базе новой графической архитектуры Turing, но делиться подробными сведениями об особенностях GPU на базе этой архитектуры компания не торопится. Тем не менее, ресурс Videocardz смог раздобыть эту информацию и поделился ею с общественностью.

В рамках архитектуры Turing в графический процессор добавлен новый исполнительный блок INT32 он позволяет видеочипу параллельно обрабатывать вычисления с плавающей и фиксированной запятой. Теоретически, это должно обеспечить прирост производительности в операциях с плавающей запятой до 36%. Параллельное выполнение стало возможным благодаря новой унифицированной архитектуре для совместного кэширования памяти L1 и текстур. NVIDIA утверждает, что архитектура ядер INT32/FP32 и другие изменения в новом поточном мультипроцессоре обеспечивают «50%-ное улучшение производительности для каждого CUDA ядра».

Вместе с тем, улучшены механизмы для использования и обработки теней. Это обеспечит разработчикам больший уровень контроля за обработкой теней, обеспечить прирост скорости обработки и высвободить ресурсы.

Архитектура Turing внедряет новые методы сжатия без потерь. NVIDIA утверждает, что благодаря улучшению алгоритмов сжатия удалось достичь «50%-го увеличения эффективной пропускной способности на Turing по сравнению с Pascal».

Новый видео движок поддерживает спецификацию DisplayPort 1.4a (8K при частоте 60 Гц). Видеокарты на базе архитектуры Turing способны выводить изображение на два монитора с разрешением 8K при частоте 60 Hz (через DisplayPort илиUSB-C). Также движок получил улучшенный кодировщик NVENC (способен кодировать поток H.265 с характеристиками 8K/30 FPS) и новый декодер NVDEC с поддержкой HEVC YUV444 10/12b HDR, H.264 8K и VP9 10/12 HDR.

Графический процессор TU102 получил поддержку двух соединений NVLINK x8. В GPU TU104 доступно одно такое соединение, а в TU106 и вовсе нет поддержки NVLINK. При этом в архитектуре Turing нет поддержки 3-way и 4-way SLI.

Новые графические процессоры NVIDIA Turing используют кластерную структуру. Каждый кластер GPC (Graphics Processing Cluster) содержит по 8 (TU104) или 12 (TU102 и TU106) потоковых мультипроцессоров SM. Помимо традиционных ядер CUDA каждый блок SM включает восемь ядер Tensor (для задачач машинного обучения) и одно ядро RT (для задач трассировки лучей).

Видеокарта NVIDIA GeForce RTX 2070 пока что единственная среди новинок, полностью использующая возможности графического чипа. Она основана не на урезанной версии GPU TU104, как предполагалось ранее, а на полноценной версии TU106. При этом видеочип TU106, фактически, представляет собой половину от TU102. Согласно внутренней системы наименований NVIDIA, TU106 должен быть графическим процессором среднего уровня. Площадь его кристалла на 131 мм2 больше, чем у GP104 (Pascal). Так что в этом отношении его можно считать GPU высокого уровня.

Ознакомиться с основными характеристиками новых графических процессоров NVIDIA на базе архитектуры Turing можно в следующей таблице.

Источник: Videocardz


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: