Microsoft официально представила новый собственный ИИ-ускоритель Azure Maia 200. Это серверный чип второго поколения из линейки Maia, разработанный специально для инференса моделей искусственного интеллекта. Компания позиционирует его как самую эффективную систему инференса, которую она когда-либо разворачивала, и заявляет о 30% более высокой производительности на каждый потраченный доллар по сравнению с Maia 100.





Ускоритель Maia 200 изготавливают по нормам 3-нм техпроцесса TSMC, он содержит 140 млрд транзисторов. По заявлениям Microsoft, чип обеспечивает до 10 петафлопс производительности в вычислениях FP4, что втрое превышает показатели конкурирующего Amazon Trainium3. Устройство несет на борту 216 ГБ памяти HBM3e с пропускной способностью 7 ТБ/с, а также 272 МБ встроенной памяти SRAM.

Отдельное внимание Microsoft уделила архитектуре памяти. Встроенную SRAM разделили на Cluster-level SRAM (CSRAM) и Tile-level SRAM (TSRAM), что позволяет эффективнее распределять нагрузку между HBM и локальной памятью. Такой подход ориентирован на стабильную и энергоэффективную работу под нагрузками FP4 и FP8, которые критически важны для современных моделей инференса.

Несмотря на то, что TDP Maia 200 на 50% выше, чем у Maia 100, компания утверждает, что общая энергоэффективность возросла. Для сравнения, Nvidia Blackwell B300 Ultra работает с TDP около 1400 Вт, тогда как Maia 200 — на уровне 750 Вт. При этом предшественник Maia 100, рассчитанный на 700 Вт, фактически работал на уровне около 500 Вт.





Непосредственное сравнение с Nvidia некорректно: Maia 200 не продается сторонним клиентам, а программная экосистема Nvidia значительно более зрелая. В то же время по показателю энергоэффективности решение Microsoft выглядит убедительно — особенно на фоне растущей критики влияния ИИ на окружающую среду и чрезмерного потребления электроэнергии.

Ускорители Maia 200 уже работают в дата-центре Azure US Central. В ближайшее время Microsoft планирует развернуть чипы в US West 3 (Финикс, Аризона) и других регионах в рамках гибридной инфраструктуры, где Maia 200 будет работать вместе с другими ИИ-ускорителями.

Разработка чипа, который ранее имел кодовое название Braga, затянулась: его планировали запустить еще в 2025 году. По предварительным данным, следующее аппаратное решение Microsoft могут изготавливать уже на техпроцессе Intel 18A, от которого отказалась Nvidia.

Источник: tomshardware