Новости Новости 23.06.2020 в 17:46 comment

NVIDIA анонсировала ускоритель A100 PCIe с GPU на базе архитектуры Ampere

author avatar
https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg *** https://itc.ua/wp-content/uploads/2022/04/ad81c83e9fbf757ce8a90d0eb41dee5b-96x96.jpeg

Вадим Карпусь

Автор новостей

Компания NVIDIA заявила о доступности нового акселератора A100, использующего графический процессор на базе архитектуры Ampere и интерфейс подключения PCI Express 4.0. Новинка во многих характеристиках схожа с моделью A100 SXM. Такая плата предназначена для обучения систем искусственного интеллекта и соответствующих вычислений. Также она может использоваться в качестве вычислителя для масштабных научных приложений и крупных центров обработки данных.

NVIDIA анонсировала ускоритель A100 PCIe с GPU на базе архитектуры Ampere

Ускоритель A100 PCIe включает графический процессор GA100, который изготовлен по нормам 7-нанометрового технологического процесса и содержит 54 млрд транзисторов. В GPU доступно 6912 потоковых процессоров и 432 тензорных ядра. Однако использование ядер трассировки лучей не предусмотрено, так как они не задействуются в целевых приложениях. Как и SXM-версия, устройство памятью HBM2e объёмом 40 ГБ. Подробные технические характеристики и уровни производительности для различных типов вычислений представлены в следующей таблице.

Модель A100 PCIe A100 SXM Tesla V100s Tesla V100 Tesla P100
GPU 7-нм GA100 7-нм GA100 12-нм GV100 12-нм GV100 16-нм GP100
Площадь кристалла 826 мм2 826 мм2 815 мм2 815 мм2 610 мм2
Транзисторы 54 млрд 54 млрд 21,1 млрд 21,1 млрд 15,3 млрд
SM-блоки 108 108 80 80 56
CUDA ядра 6912 6912 5120 5120 3840
Тензорные ядра 432 432 640 640 NA
FP16 вычисления 78 терафлопс 78 терафлопс 32,8 терафлопс 31,4 терафлопс 21,2 терафлопс
FP32 вычисления 19,5 терафлопс 19,5 терафлопс 16,4 терафлопс 15,7 терафлопс 10,6 терафлопс
FP64 вычисления 9,7 терафлопс 9,7 терафлопс 8,2 терафлопс 7,8 терафлопс 5,3 терафлопс
Boost-частота ~1410 МГц ~1410 МГц ~1601 МГц ~1533 МГц ~1480 МГц
Пропускная способность памяти 1555 ГБ/с 1555 ГБ/с 1134 ГБ/с 900 ГБ/с 721 ГБ/с
Частота памяти 2430 МГц 2430 МГц 2214 МГц 1760 МГц 1408 МГц
Память 40 ГБ HBM2e 40 ГБ HBM2e 32 ГБ HBM2 16 ГБ / 32 ГБ HBM2 16 ГБ HBM2
Шина доступа памяти 5120 бит 5120 бит 4096 бит 4096 бит 4096 бит
TDP 250 Вт 400 Вт 250 Вт 300 Вт 300 Вт
Форм-фактор PCIe 4.0 SXM4 PCIe 3.0 SXM2 / PCIe 3.0 SXM

Показатель рассеиваемой мощности ускорителя A100 PCIe заявлен на уровне 250 Вт, хотя фактические значения могут быть ниже. Для сравнения, SXM-версия обладает показателем TDP на уровне 400 Вт при такой же пиковой производительности. Однако при постоянной нагрузке новинке будет демонстрировать на 10-50% меньшую производительность по сравнению с версией SXM.

Ускорители NVIDIA A100 PCIe и A100 SXM уже предлагаются поставщиками серверных систем в составе своих решений.

Источник: videocardz

Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: