Microsoft je nedavno predstavio Maia 200, svoj najnoviji AI akcelerator koji je usmeren na poboljšanje efikasnosti u obradi složenih AI modela. Ovaj uređaj se ističe po svojoj sposobnosti da efikasno upravlja memorijskim propusnim opsegom i obezbeđuje visoke performanse u stvarnim radnim uslovima, čime se direktno takmiči sa NVIDIA-om.
Maia 200 je razvijen pomoću naprednog 3-nanometarskog procesa i pruža preko 10 petaFLOPS u 4-bitnoj preciznosti i više od 5 petaFLOPS u 8-bitnoj preciznosti. Ovaj akcelerator dolazi sa 216GB HBM3e memorije, koja može da prenosi podatke brzinom od 7TB u sekundi, omogućavajući nesmetano funkcionisanje velikih AI modela.
Trenutno se Maia 200 koristi u odabranim Azure data centrima u SAD-u, gde podržava razvoj Microsoftovih AI usluga, uključujući Microsoft Superintelligence i Copilot.
Sistem, a ne samo čip
Maia 200 nije samo još jedan čip; on je deo sveobuhvatne arhitekture koja se može skalirati od jednog čvora do klastera sa do 6.144 akceleratora. Ova arhitektura koristi standardni Ethernet, što smanjuje troškove i povećava pouzdanost.
Microsoft tvrdi da je Maia 200 optimizovan za generisanje tokena i rad sa velikim modelima, što su ključni zadaci kada model postane aktivan. Njegova kombinacija FP4/FP8 tensor jezgara i velike memorijske kapacitete omogućava održavanje visoke responzivnosti čak i pod velikim opterećenjem.
Ovaj uređaj stvara direktnu konkurenciju drugim akceleratorima kao što su Amazonov Trainium i Googleov TPU, pružajući tri puta veće performanse u FP4 režimu i bolju FP8 performansu.
Zašto je Microsoftov integrisani model bitan
Maia 200 je usmeren prema cloud provajderima i velikim preduzećima koja se bave obradom AI modela. Microsoft će omogućiti podršku za razne enterprise radne opterećenja na Azure-u, čime se smanjuju troškovi izvođenja AI operacija.
Osim toga, integracija Maia 200 sa Microsoftovim ekosistemom, uključujući Azure AI i Microsoft 365, pruža prirodnu prednost korisnicima koji već koriste ove servise. Ovaj pristup se uklapa u sve veću industrijsku tendenciju ka razvoju prilagođenog hardvera koji radi usko sa softverom.
U svetlu sve veće potražnje za AI rešenjima, Maia 200 predstavlja Microsoftov korak ka smanjenju zavisnosti od trećih proizvođača hardvera poput NVIDIA-e, što može doneti značajne prednosti u pogledu troškova i performansi.
Za sve one koji razmišljaju o naprednim AI rešenjima na Azure platformi, Maia 200 obećava brže performanse, bolju efikasnost troškova i čvrstu integraciju sa cloud servisima.
