Компания NVIDIA заявила о доступности нового акселератора A100, использующего графический процессор на базе архитектуры Ampere и интерфейс подключения PCI Express 4.0. Новинка во многих характеристиках схожа с моделью A100 SXM. Такая плата предназначена для обучения систем искусственного интеллекта и соответствующих вычислений. Также она может использоваться в качестве вычислителя для масштабных научных приложений и крупных центров обработки данных.
Ускоритель A100 PCIe включает графический процессор GA100, который изготовлен по нормам 7-нанометрового технологического процесса и содержит 54 млрд транзисторов. В GPU доступно 6912 потоковых процессоров и 432 тензорных ядра. Однако использование ядер трассировки лучей не предусмотрено, так как они не задействуются в целевых приложениях. Как и SXM-версия, устройство памятью HBM2e объёмом 40 ГБ. Подробные технические характеристики и уровни производительности для различных типов вычислений представлены в следующей таблице.
Модель | A100 PCIe | A100 SXM | Tesla V100s | Tesla V100 | Tesla P100 |
---|---|---|---|---|---|
GPU | 7-нм GA100 | 7-нм GA100 | 12-нм GV100 | 12-нм GV100 | 16-нм GP100 |
Площадь кристалла | 826 мм2 | 826 мм2 | 815 мм2 | 815 мм2 | 610 мм2 |
Транзисторы | 54 млрд | 54 млрд | 21,1 млрд | 21,1 млрд | 15,3 млрд |
SM-блоки | 108 | 108 | 80 | 80 | 56 |
CUDA ядра | 6912 | 6912 | 5120 | 5120 | 3840 |
Тензорные ядра | 432 | 432 | 640 | 640 | NA |
FP16 вычисления | 78 терафлопс | 78 терафлопс | 32,8 терафлопс | 31,4 терафлопс | 21,2 терафлопс |
FP32 вычисления | 19,5 терафлопс | 19,5 терафлопс | 16,4 терафлопс | 15,7 терафлопс | 10,6 терафлопс |
FP64 вычисления | 9,7 терафлопс | 9,7 терафлопс | 8,2 терафлопс | 7,8 терафлопс | 5,3 терафлопс |
Boost-частота | ~1410 МГц | ~1410 МГц | ~1601 МГц | ~1533 МГц | ~1480 МГц |
Пропускная способность памяти | 1555 ГБ/с | 1555 ГБ/с | 1134 ГБ/с | 900 ГБ/с | 721 ГБ/с |
Частота памяти | 2430 МГц | 2430 МГц | 2214 МГц | 1760 МГц | 1408 МГц |
Память | 40 ГБ HBM2e | 40 ГБ HBM2e | 32 ГБ HBM2 | 16 ГБ / 32 ГБ HBM2 | 16 ГБ HBM2 |
Шина доступа памяти | 5120 бит | 5120 бит | 4096 бит | 4096 бит | 4096 бит |
TDP | 250 Вт | 400 Вт | 250 Вт | 300 Вт | 300 Вт |
Форм-фактор | PCIe 4.0 | SXM4 | PCIe 3.0 | SXM2 / PCIe 3.0 | SXM |
Показатель рассеиваемой мощности ускорителя A100 PCIe заявлен на уровне 250 Вт, хотя фактические значения могут быть ниже. Для сравнения, SXM-версия обладает показателем TDP на уровне 400 Вт при такой же пиковой производительности. Однако при постоянной нагрузке новинке будет демонстрировать на 10-50% меньшую производительность по сравнению с версией SXM.
Ускорители NVIDIA A100 PCIe и A100 SXM уже предлагаются поставщиками серверных систем в составе своих решений.
Источник: videocardz
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: