Компанія Microsoft анонсувала запуск Maia 200, нового спеціалізованого апаратного прискорювача, створеного для високоефективної інференції великих мовних моделей (LLM) у хмарних сервісах. Maia 200 є ключовим елементом стратегії Microsoft щодо підвищення продуктивності та ефективності обчислень штучного інтелекту в дата‑центрах Azure.
Повідомляє видання GALERA.NEWS, посилаючись на Microsoft.
Архітектура та технічні характеристики
Maia 200 розроблена на основі 3‑нанометрового техпроцесу TSMC та містить понад 140 мільярдів транзисторів. Чип оптимізовано під сучасні формати обчислень низької точності (FP8, FP4), що забезпечує високу швидкодію при одночасному зменшенні енергоспоживання.
Прискорювач оснащено 216 ГБ пам’яті HBM3e з пропускною здатністю 7 ТБ/с, а також 272 МБ SRAM для швидкого доступу до даних. Така конфігурація дозволяє обробляти великі моделі штучного інтелекту з високою продуктивністю та мінімальною затримкою.
Ефективність та конкурентні переваги
Згідно з даними Microsoft, Maia 200 забезпечує приблизно 30 % покращене співвідношення продуктивності до вартості порівняно з попередніми рішеннями компанії. Чип перевищує продуктивність аналогічних рішень на ринку у форматах FP4 та FP8, що дозволяє Microsoft конкурувати з продуктами Amazon (Trainium) та Google (TPU).
Застосування
Maia 200 вже використовується у деяких дата‑центрах Microsoft Azure та інтегрована у сервіси, що потребують високопродуктивної інференції моделей, такі як GPT‑5.2, Microsoft Foundry та Microsoft 365 Copilot.
Підтримка розробників
Для спрощення адаптації моделей до нової архітектури Microsoft надає SDK із підтримкою PyTorch, оптимізованими компіляторами та бібліотеками, що забезпечує розробникам ефективний та гнучкий інструментарій для роботи з Maia 200.