Новости
NVIDIA анонсировала ускоритель A100 PCIe с GPU на базе архитектуры Ampere

NVIDIA анонсировала ускоритель A100 PCIe с GPU на базе архитектуры Ampere

NVIDIA анонсировала ускоритель A100 PCIe с GPU на базе архитектуры Ampere


Компания NVIDIA заявила о доступности нового акселератора A100, использующего графический процессор на базе архитектуры Ampere и интерфейс подключения PCI Express 4.0. Новинка во многих характеристиках схожа с моделью A100 SXM. Такая плата предназначена для обучения систем искусственного интеллекта и соответствующих вычислений. Также она может использоваться в качестве вычислителя для масштабных научных приложений и крупных центров обработки данных.

NVIDIA анонсировала ускоритель A100 PCIe с GPU на базе архитектуры Ampere

Ускоритель A100 PCIe включает графический процессор GA100, который изготовлен по нормам 7-нанометрового технологического процесса и содержит 54 млрд транзисторов. В GPU доступно 6912 потоковых процессоров и 432 тензорных ядра. Однако использование ядер трассировки лучей не предусмотрено, так как они не задействуются в целевых приложениях. Как и SXM-версия, устройство памятью HBM2e объёмом 40 ГБ. Подробные технические характеристики и уровни производительности для различных типов вычислений представлены в следующей таблице.

МодельA100 PCIeA100 SXMTesla V100sTesla V100Tesla P100
GPU7-нм GA1007-нм GA10012-нм GV10012-нм GV10016-нм GP100
Площадь кристалла826 мм2826 мм2815 мм2815 мм2610 мм2
Транзисторы54 млрд54 млрд21,1 млрд21,1 млрд15,3 млрд
SM-блоки108108808056
CUDA ядра69126912512051203840
Тензорные ядра432432640640NA
FP16 вычисления78 терафлопс78 терафлопс32,8 терафлопс31,4 терафлопс21,2 терафлопс
FP32 вычисления19,5 терафлопс19,5 терафлопс16,4 терафлопс15,7 терафлопс10,6 терафлопс
FP64 вычисления9,7 терафлопс9,7 терафлопс8,2 терафлопс7,8 терафлопс5,3 терафлопс
Boost-частота~1410 МГц~1410 МГц~1601 МГц~1533 МГц~1480 МГц
Пропускная способность памяти1555 ГБ/с1555 ГБ/с1134 ГБ/с900 ГБ/с721 ГБ/с
Частота памяти2430 МГц2430 МГц2214 МГц1760 МГц1408 МГц
Память40 ГБ HBM2e40 ГБ HBM2e32 ГБ HBM216 ГБ / 32 ГБ HBM216 ГБ HBM2
Шина доступа памяти5120 бит5120 бит4096 бит4096 бит4096 бит
TDP250 Вт400 Вт250 Вт300 Вт300 Вт
Форм-факторPCIe 4.0SXM4PCIe 3.0SXM2 / PCIe 3.0SXM

Показатель рассеиваемой мощности ускорителя A100 PCIe заявлен на уровне 250 Вт, хотя фактические значения могут быть ниже. Для сравнения, SXM-версия обладает показателем TDP на уровне 400 Вт при такой же пиковой производительности. Однако при постоянной нагрузке новинке будет демонстрировать на 10-50% меньшую производительность по сравнению с версией SXM.

Ускорители NVIDIA A100 PCIe и A100 SXM уже предлагаются поставщиками серверных систем в составе своих решений.

Источник: videocardz


Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: