https://www.ictbusiness.info

Link: https://www.ictbusiness.info / poslovna-rjesenja / microsoft-predstavlja-novi-ai-cip-maia-200

Microsoft predstavlja novi AI čip Maia 200

Microsoft je predstavio drugu generaciju vlastitog AI čipa s ciljem povećanja učinkovitosti svojih usluga. Maia 200 je novi visokoučinkoviti akcelerator za AI inferenciju koji je Microsoft razvio interno.

Tvrtka navodi da je novi čip izrađen u TSMC-ovom 3-nanometarskom proizvodnom procesu. Dizajniran je kako bi značajno poboljšao troškovnu učinkovitost i brzinu generiranja AI tokena. Čip uključuje FP8 i FP4 tensor jezgre, 216 GB HBM3e memorije s propusnošću od 7 Tb/s te 272 MB ugrađene SRAM memorije, što ga čini najbržim i energetski najučinkovitijim Microsoftovim silicijem do danas. Svaki Maia 200 čip sadrži više od 140 milijardi tranzistora te isporučuje više od 10 petaflopsa pri 4-bitnoj preciznosti i oko 5 petaflopsa pri 8-bitnoj preciznosti.

„Ovo čini Maiu 200 najperformantnijim first-party silicijem bilo kojeg hyperscalera, s tri puta većim FP4 performansama od treće generacije Amazonova Trainiuma te FP8 performansama koje nadmašuju sedmu generaciju Googleova TPU-a“, izjavio je Scott Guthrie, izvršni potpredsjednik Microsofta za cloud i umjetnu inteligenciju. Guthrie je dodao da se razvojni programeri, akademska zajednica, AI laboratoriji i sudionici open-source AI projekata mogu prijaviti za pristup razvojnom softverskom paketu u preview fazi. Novi čip već je implementiran u Microsoftovom središnjem podatkovnom centru u američkoj saveznoj državi Iowi, dok je dodatno uvođenje planirano u podatkovnom centru u blizini Phoenixa u Arizoni.

Guthrie je objasnio da će Microsoftov tim za superinteligenciju koristiti Maiu 200 za generiranje sintetičkih podataka i učenje potkrepljivanjem kako bi unaprijedio sljedeću generaciju internih modela. Čipovi će se koristiti i za pokretanje Microsoftova Copilot asistenta za poslovne korisnike te AI modela poput OpenAI-jevog GPT-5.2. „Maia 200 je ujedno i najučinkovitiji sustav za inferenciju koji je Microsoft ikada implementirao, s 30 posto boljim omjerom performansi po dolaru u odnosu na najnoviju generaciju hardvera u našem postojećem portfelju“, zaključio je Guthrie.

Razvoj vlastitih AI akceleratora postaje strateški ključan za velike pružatelje usluga u oblaku koji nastoje smanjiti ovisnost o vanjskim dobavljačima i optimizirati troškove. Inferencijski čipovi poput Maie 200 posebno su važni jer upravo inferencija čini najveći dio operativnih opterećenja u komercijalnoj primjeni umjetne inteligencije.

Prijelaz na 3-nanometarski proces omogućuje veću gustoću tranzistora i bolju energetsku učinkovitost, što je presudno za skaliranje AI usluga. Velike količine HBM memorije s visokom propusnošću ključne su za rad s velikim jezičnim modelima i smanjenje latencije. FP4 i FP8 preciznosti odražavaju industrijski trend prema nižoj numeričkoj preciznosti uz zadržavanje kvalitete modela. Integracija ovakvog silicija izravno u podatkovne centre omogućuje bolju kontrolu performansi i pouzdanosti.

Istodobno, razvoj vlastitog hardvera daje Microsoftu veću fleksibilnost u optimizaciji softverskih okvira i AI platformi. Očekuje se da će ovakvi čipovi igrati ključnu ulogu u daljnjem razvoju poslovnih AI asistenta i automatiziranih usluga. Konkurencija među hyperscalerima dodatno se pojačava kako AI postaje temeljna infrastruktura digitalne ekonomije. Dugoročno, vlastiti AI akceleratori mogli bi postati jednako važni za tržišnu diferencijaciju kao i same AI aplikacije.