Вчера вечером стартовала не только конференция Microsoft Build 2017, но еще и ежегодное мероприятие NVIDIA GTC 2017, посвященное передовым графическим решениям. В рамках главного доклада бессменный глава NVIDIA Дженсен Хуанг поведал много чего интересно о новых продуктах компании, но гвоздем программы, конечно же, стал анонс GPU GV100 – монструозного флагманского GPU архитектуры нового поколения Volta.

Сначала этот GPU ляжет в основу профессионального ускорителя Tesla V100 (о нем ниже), но затем (где-то через год), если NVIDIA поступит так же, как с GPU GP100 поколения Pascal, он должен стать доступным в составе обычных потребительских видеокарт – будущих моделях GeForce 2000 серии. Если компания не внесет никаких изменений в принцип наименования видеокарт, то вполне можно ожидать графический процессор такой же конфигурации в будущей флагманской видеокарте нового поколения GTX 2080 Ti.

Прежде чем перейти к техническим подробностям стоит вспомнить, что GV100 – не первый продукт на архитектуре Volta. Осенью прошлого года компания представила SoC Xavier с GPU поколения Volta, хотя она выйдет на рынок только в 2018 году.

Итак, начнем. Это чип настоящий монстр: он содержит 21,1 млрд транзисторов против 15,3 млрд транзисторов у GP100 архитектуры Pascal, имеет площадь 815 мм² против 610 мм² у GP100 и должен выпускаться на мощностях TSMC по 12-нанометровому техпроцессу FF (следующий шаг технологических норм после 16-нанометрового техпроцесса FF, используемого для Pascal). Похоже, GV100 – это самый крупный GPU за всю историю. Это столь существенный скачок, что пока мы можем только гадать, как пойдет производство этого монструозного чипа (процент выхода годной продукции, объемы), особенно с учетом новейшего 12-нанометрового техпроцесса.

Пожалуй, наиболее интересными с игровой точки зрения являются впечатляющие 5376 (!) ядер CUDA, которые включает этот GPU. Эти 5376 CUDA разнесены по блокам Volta Streaming Multiprocessor Unit. Каждый блок SM содержит 64 ядра CUDA. Всего таких блоков у GPU 84 (84 x 64 = 5 376). Общее количество текстурных блоков равно 336.

Другая интересная особенность GPU GV100 – это дополнительные вычислительные блоки Tensor Cores, которые предназначены для вычислений, связанных с нейросетями, машинным и глубоким обучением. Их тут установлено 672 штук. Как утверждается, благодаря объединению ядер CUDA и нового ядра Volta Tensor в унифицированной архитектуре, один сервер на базе GPU Tesla V100 сможет заменить сотни центральных процессоров в высокопроизводительных вычислениях, обеспечив производительность в задачах глубокого обучения на уровне 120 TFLOPS.

GPU GV100 будет использоваться совместно с памятью HBM2, как и предшественник. Но это обновленная память с повышенной пропускной способностью – 900 ГБ/с против 720 ГБ/с у предшественника. А вот объем памяти уменьшили вдвое – с 32 до 16 ГБ (видимо, посчитали, что с такой пропускной способностью будет достаточно и меньшего объема).

Кроме самого GPU, компания также представила ускоритель Tesla V100 на его основе. Правда, у этого адаптера количество активных ядер CUDA урезано до 5120 штук, а число ядер Tensor Cores сокращено до 640. Но даже так прирост в числе ядер составляет 42% по сравнению с P100. Ускоритель Tesla V100 способен предложить производительность 15 TFLOPS при вычислениях с одинарной точностью (FP32) и 7,5 TFLOPS – с двойной точностью (FP64). Максимальная частота GPU в данном случае указана равной 1455 МГц. Показатель TDP этой карты составляет 300 Вт. Пока что известно лишь о варианте Tesla V100 в виде модуля, оснащенном интерфейсом NVLink второго поколения с пропускной способностью 300 ГБ/с. Но наверняка в будущем выйдет модификация в виде стандартной платы расширения с интерфейсом PCIe.

Источник: Nvidia, techpowerup,WCCF Tech