Компания NVIDIA официально анонсировала систему DGX A100, которую недавно «приготовил» Дженсен Хуанг, попутно назвав её самой крупной графической картой. Фактически устройство получило сразу восемь графических ускорителей Tesla A100 на базе NVIDIA GA100 — это первый GPU на базе новой архитектуры Ampere.

Совокупная производительность NVIDIA DGX A100 достигает 5 петафлопс. По данным производителя, каждый ускоритель Tesla A100 способен обеспечить 20-кратный прирост пиковой производительности (в отдельных случаях) по сравнению с предыдущими решениями на базе архитектуры Volta. Более того, если системы предыдущего поколения были ориентированы исключительно на задачи искусственного интеллекта, то DGX A100 также могут использоваться в масштабируемых приложениях, таких как анализ данных и оценка интерференций. Технология Multi-instance GPU (MIG) позволяет разделить A100 на максимум семь отдельных виртуальных GPU для выполнения задач разной степени сложности.

Графический процессор NVIDIA GA100 является крупнейшим в мире GPU на текущий момент, изготовленным по нормам 7-нанометрового технологического процесса. Он содержит 54 млрд транзисторов. По этому показателю новинка более чем в 2 раза превосходит графический процессор Volta GV100, где было 21 млрд транзисторов. Площадь кристалла составляет 826 мм2. GPU Ampere GA100 разделён на 108 потоковых мультипроцессоров, включает 6912 ядер CUDA и 432 тензорных ядра. Частота достигает 1410 МГц. Устройство включает тензорные ядра третьего поколения с поддержкой TF32 (одиночная точность) и FP64 (двойная точность), которые позволяют обеспечить ускорение ИИ-вычислений до 20 и 2,5 раз, соответственно. Графический ускоритель Tesla A100 включает 40 ГБ памяти HBM2 с шиной доступа 5120 бит. Показатель TDP устройства составляет 400 Вт.

Помимо графических ускорителей система DGX A100 также включает 320 ГБ памяти типа HBM2 и высокоскоростные интерконнекты NVIDIA Mellanox HDR с пропускной способностью 200 Гбит/с. Система включает 6 коммутаторов интерфейса NVIDIA NVLink третьего поколения с удвоенной скоростью соединения между GPU. В совокупности они обеспечивают двухсторонний обмен данными с сервером со скоростью 4,8 ТБ/с, а скорость обмена данными между GPU составляет 600 ГБ/с. В устройстве реализована технология MIG, которая позволяет ускорить процессы, запустив решение небольших задач в параллели за счёт разделения DGX A100 на отдельные виртуальные графические процессоры – до 56 в системе. Отдельно упоминается технология Structural sparsity, которая позволяет удваивать производительность, используя разреженность данных в задачах ИИ.

Как отмечает производитель, в случае NVIDIA DGX A100 речь идёт не о бумажном анонсе. Поставки систем уже начались, и первый заказ отправился в Аргоннскую национальную лабораторию Министерства энергетики США, где вычислительная мощь кластера используется для борьбы с коронавирусной инфекцией COVID-19. Также начаты поставки и другим партнёрам, которые вскоре начнут использовать новые системы в своей инфраструктуре. Например, Университет Флориды станет первым высшим учебным заведением в США, который получит системы DGX A100, чтобы внедрить возможности ИИ в свой учебный процесс. Первыми пользователями систем DGX A100 также стали Центр биомедицинского ИИ в Гамбурге, Университет Чулалонгкорна в Таиланде, Немецкий исследовательский центр ИИ, разработчик решений и услуг на базе ИИ Element AI из Монреаля, сиднейская медицинская компания Harrison.ai, компания Artificial Intelligence Office (ОАЭ), ведущая вьетнамская исследовательская лаборатория VinAI Research. При этом цена каждого блока NVIDIA DGX A100 составляет внушительные $200 тыс.

NVIDIA также представила суперкомпьютер в виде кластера DGX SuperPOD, созданный из 140 систем DGX A100. Он способен обеспечить производительность 700 петафлопс в задачах ИИ. Этот суперкомпьютер будет использоваться компанией для внутренних исследований в таких областях, как диалоговый ИИ, геномика и автономное вождение. Отдельно отмечается, что используемая архитектура позволила NVIDIA построить систему всего за месяц. Раньше для таких проектов потребовалось бы значительно больше времени.

Чтобы помочь клиентам быстрее создавать собственные дата-центры на базе графических процессоров A100, NVIDIA также представила референсную архитектуру DGX SuperPOD, в которой описываются принципы проектирования, используемые при создании супервычислительных кластеров на базе DGX A100.

Источник: videocardz 1, 2