OPTIMIZACIJA ENTERPRISE INFRASTRUKTURE

Skok troškova javnog oblaka potiče val on-premise repatrijacije podataka i AI modela

Prema najnovijem IDC Cloud Pulse izvještaju, zabilježen je neočekivan trend povratka dijela kritičnih radnih opterećenja iz javnog oblaka u lokalne podatkovne centre (on-premise). Glavni pokretači ove repatrijacije su nekontrolirani troškovi infrastrukture potrebne za treniranje i izvođenje složenih AI modela, kao i sve stroži zahtvi za suverenošću podataka. Organizacije shvaćaju da strategija „sve u oblak“ više nije ekonomski održiva za intenzivne računalne operacije.

Skok troškova javnog oblaka potiče val on-premise repatrijacije podataka i AI modela
Depositphotos / Ilustracija

Javni oblak dugi niz godina slovio je kao neprikosnoveni standard za digitalnu transformaciju, no ulazak u eru masovne primjene umjetne inteligencije iznio je na vidjelo skrivene financijske i operativne nedostatke ovog modela. IDC-evo istraživanje provedeno na uzorku od preko 1.500 velikih europskih i svjetskih kompanija pokazuje da je 38% ispitanika u proteklih 12 mjeseci preselilo barem dio svojih AI radnih opterećenja iz javnih cloud platformi (poput AWS-a, Azurea ili Google Clouda) natrag na vlastitu infrastrukturu ili u specijalizirane lokalne kolokacijske podatkovne centre.

Glavni uzrok ovog preokreta leži u matematici troškova neprekidnog izvođenja inferencije (inference) i finog podešavanja (fine-tuning) velikih jezičnih modela. Dok je razvojni i testni dio projekta idealno provoditi u oblaku zbog fleksibilnosti i brzog pristupa resursima, kontinuirana produkcija podrazumijeva masovni prijenos podataka (data egress) i stalno zakupljivanje skupih GPU instanci. Ti troškovi u javnom oblaku rastu linearno s količinom upita, stvarajući goleme proračunske pritiske na CIO-ove koji se suočavaju s upravom zahtijevajući mjerljiv povrat investicije.

Osim financijskog aspekta, ključni faktor je intelektualno vlasništvo i sigurnost. Kada tvrtka koristi javni oblak za obradu svojih najtajnijih poslovnih podataka kroz AI modele, postoji stalni rizik od curenja informacija ili promjene uvjeta pružanja usluga od strane hyperscalera. On-premise infrastruktura omogućuje apsolutnu kontrolu nad podacima, eliminira mrežnu latenciju i pruža jamstvo da korporativni podaci neće biti iskorišteni za treniranje javno dostupnih modela trećih strana.