Microsoft офіційно представила новий власний ШІ-прискорювач Azure Maia 200. Це серверний чип другого покоління з лінійки Maia, розроблений спеціально для інференсу моделей штучного інтелекту. Компанія позиціює його як найефективнішу систему інференсу, яку вона коли-небудь розгортала, і заявляє про 30% вищу продуктивність на кожен витрачений долар порівняно з Maia 100.
Прискорювач Maia 200 виготовляють за нормами 3-нм техпроцесу TSMC, і він містить 140 млрд транзисторів. За заявами Microsoft, чип забезпечує до 10 петафлопс продуктивності в обчисленнях FP4, що втричі перевищує показники конкурентного Amazon Trainium3. Пристрій несе на борту 216 ГБ пам’яті HBM3e з пропускною здатністю 7 ТБ/с, а також 272 МБ вбудованої пам’яті SRAM.
Окрему увагу Microsoft приділила архітектурі пам’яті. Вбудовану SRAM розділили на Cluster-level SRAM (CSRAM) і Tile-level SRAM (TSRAM), що дозволяє ефективніше розподіляти навантаження між HBM і локальною пам’яттю. Такий підхід орієнтований на стабільну та енергоефективну роботу під навантаженнями FP4 і FP8, які критично важливі для сучасних моделей інференсу.
Попри те, що TDP Maia 200 на 50% вищий, ніж у Maia 100, компанія стверджує, що загальна енергоефективність зросла. Для порівняння, Nvidia Blackwell B300 Ultra працює з TDP близько 1400 Вт, тоді як Maia 200 — на рівні 750 Вт. При цьому попередник Maia 100, розрахований на 700 Вт, фактично працював на рівні близько 500 Вт.
Безпосереднє порівняння з Nvidia некоректне: Maia 200 не продається стороннім клієнтам, а програмна екосистема Nvidia значно зріліша. Водночас за показником енергоефективності рішення Microsoft виглядає переконливо — особливо на тлі зростаючої критики впливу ШІ на довкілля та надмірного споживання електроенергії.
Прискорювачі Maia 200 уже працюють в датацентрі Azure US Central. Найближчим часом Microsoft планує розгорнути чипи в US West 3 (Фінікс, Аризона) та інших регіонах у межах гібридної інфраструктури, де Maia 200 працюватиме разом з іншими ШІ-прискорювачами.
Розробка чипа, який раніше мав кодову назву Braga, затягнулася: його планували запустити ще у 2025 році. За попередніми даними, наступне апаратне рішення Microsoft можуть виготовляти вже на техпроцесі Intel 18A, від якого відмовилася Nvidia.
Джерело: tomshardware


Повідомити про помилку
Текст, який буде надіслано нашим редакторам: