CLOUD RAČUNALSTVO

Meta potpisuje višegodišnji posao s AWS-om i planira koristiti desetke milijuna Graviton5 jezgri za agentni AI

Dogovor Mete i AWS-a, prema kojem bi Meta tijekom više godina koristila desetke milijuna Graviton5 jezgri za agentne AI radne zadatke, pokazuje da se tržište umjetne inteligencije ne vrti samo oko GPU-ova. Paralelno s utrkom za akceleratorima raste i važnost optimiziranog procesorskog sloja, osobito za inference, orkestraciju agenata i radne zadatke koji traže drukčiji omjer cijene i performansi.

Meta potpisuje višegodišnji posao s AWS-om i planira koristiti desetke milijuna Graviton5 jezgri za agentni AI

Meta je s AWS-om potpisala višegodišnji posao vrijedan više milijardi dolara i planira koristiti desetke milijuna Graviton5 procesorskih jezgri za agentni AI. AWS je pritom naveo da je Meta jedan od njegovih najvećih korisnika Gravitona. Dogovor je važan jer pokazuje da strategija umjetne inteligencije više ne ovisi samo o vrhunskim GPU-ovima. Veliki igrači sve više slažu višeslojnu infrastrukturu u kojoj ARM procesori, akceleratori, mrežni sloj i specijalizirani softver rade zajedno na optimizaciji troška i potrošnje. Time se dodatno potvrđuje da je AI infrastruktura ušla u kapitalno najzahtjevniju fazu dosad, u kojoj se projekti ne mjere samo veličinom investicije nego i sposobnošću da se fizički prostor, energija, oprema i korisnička potražnja spoje u održiv poslovni model.

AWS posljednjih mjeseci snažno gura vlastite procesorske i akceleratorske platforme, a izjava da su mu pojedini kupci željeli kupiti praktično sav raspoloživi Graviton kapacitet ove godine pokazuje koliko je potražnja postala agresivna. Nakon godina u kojima se digitalna ekonomija često promatrala gotovo isključivo kroz softver i platforme, umjetna inteligencija je vratila u središte priče sve ono što je fizičko: zemljište, transformatore, rashladne sustave, optičke veze, građevinske rokove i kvalitetu financijske konstrukcije. Upravo na tim točkama danas se odlučuje tko može brzo odgovoriti na eksplozivan rast potražnje.

Za developere, investitore i velike tehnološke kupce to znači da se tržište podatkovnih centara mijenja iz temelja. Novi kapacitet više nije tek dodatni kvadratni metar u server sali, nego strateška imovina koja može odrediti brzinu razvoja proizvoda i mogućnost zaključivanja višegodišnjih ugovora s korisnicima. Zato se u istoj priči susreću telekom operateri, energetske tvrtke, fondovi, cloud provideri i proizvođači opreme.

U praksi raste i važnost termalnog dizajna, gustoće rackova i sposobnosti da se složena oprema dovede u pogon bez dugih kašnjenja. GPU klasteri, inference sustavi i sve veći podatkovni workloadovi povećavaju potrošnju i zahtjeve hlađenja do razina koje klasični dizajni sve teže podnose bez većeg troška. Zbog toga i naizgled tehničke odluke sve češće određuju ekonomiku cijelog projekta.

Za europske poduzetnike i integratore to znači da će tržište AI infrastrukture biti još složenije za planiranje. Odluke o arhitekturi više se neće svoditi na izbor jednog tipa akceleratora, nego na kombinaciju procesora, mreže, memorije i cijene inferencea. Za europske zemlje i regionalna tržišta ova dinamika posebno je osjetljiva. Kontinent želi zadržati digitalnu suverenost i ubrzati AI usluge, ali pritom se suočava s dugim dozvolama, ograničenom mrežom i rastućim pritiskom lokalnih zajednica. Hrvatska i susjedna tržišta na to ne mogu gledati kao na udaljenu temu, jer će o regionalnoj povezanosti i dostupnosti kapaciteta ovisiti cijena i brzina budućih AI implementacija.

Za korporativne kupce i javne institucije to znači da se odluke o digitalnoj transformaciji sve češće moraju usklađivati s realnošću infrastrukturnog tržišta. Nije dovoljno predvidjeti funkcionalnost koju će AI ili cloud donijeti poslovanju; potrebno je razumjeti i gdje će se workload izvoditi, koliki će biti trošak po jedinici rada, kako će se rješavati kontinuitet poslovanja i postoji li dovoljno kapaciteta za skaliranje bez dugih čekanja. U eri ograničenih megavata i akceleratora infrastruktura ponovno postaje usko grlo strategije.

I poslovna strana priče postaje sve tvrdokornija. Ulagači traže jasnije ugovore o potražnji, operateri žele bolju monetizaciju mreže i lokacija, a korisnici traže pouzdanost i predvidivost troška. To znači da će uspjeti oni projekti koji mogu spojiti tehničku izvedivost s dugoročnom komercijalnom logikom, a ne samo oni koji mogu proizvesti najatraktivniji naslov.

Ako se potvrdi da agentni sustavi mogu velik dio posla odraditi na učinkovitijim procesorskim platformama, to će promijeniti ekonomiku AI usluga. U tom slučaju pobjednici neće biti samo oni s najjačim modelom, nego oni koji mogu najbolje uskladiti arhitekturu i poslovni trošak. Podatkovni centri, cloud i energetski projekti tako postaju ogledalo šireg pomaka u industriji: digitalni rast ponovno ovisi o tome tko može graditi, napajati i hladiti brže i pametnije od konkurencije.

Upravo zato će sljedećih 12 mjeseci biti presudno za raspored snaga. Lokacije i tvrtke koje danas uspiju ubrzati dozvole, zaključiti energiju i osigurati financiranje vjerojatno će uhvatiti glavninu novog vala potražnje. Oni koji ostanu zarobljeni u sporim procedurama ili nejasnim tržišnim modelima riskiraju da ih kupci zaobiđu i kapacitet potraže ondje gdje se može dobiti brže i sigurnije.

Sve to dodatno podiže važnost planiranja i koordinacije između tehnološke i energetske politike. Ondje gdje se ta dva svijeta ne usklade, digitalni rast usporava bez obzira na razinu interesa tržišta. Zato se infrastruktura za umjetnu inteligenciju sve češće tretira kao pitanje nacionalne i regionalne konkurentnosti, a ne samo kao komercijalna investicija privatnog sektora.