https://www.ictbusiness.info

Link: https://www.ictbusiness.info / vijesti / openai-vlastitim-cipom-ucvrscuje-kontrolu-nad-troskom

OpenAI vlastitim čipom učvršćuje kontrolu nad troškom

OpenAI-jev prilagođeni čip razvijen s Broadcomom usmjeren je na inference, odnosno na svakodnevno izvršavanje AI modela za korisničke upite i aplikacije. Upravo taj dio AI infrastrukture postaje najveći troškovni izazov jer se ne radi o jednokratnom treningu, nego o stalnom pogonu koji mora biti brz, pouzdan i financijski održiv. Izrada vlastitog čipa omogućuje optimizaciju za specifične modele i interne potrebe, ali istodobno uvodi rizike proizvodnje, dobave memorije, integracije sustava i ovisnosti o TSMC-ovu proizvodnom kapacitetu. Urednički najzanimljiviji dio nije sama objava, nego pomak koji otkriva u načinu na koji se ICT budžeti i tehnički prioriteti sele prema kapacitetu, pouzdanosti i mjerljivoj poslovnoj vrijednosti.

Ovaj potez ne treba čitati kao trenutačnu zamjenu za Nvidiju, nego kao pokušaj smanjenja strateške ranjivosti. OpenAI, Google, Amazon, Meta i drugi veliki kupci AI računalstva već godinama razvijaju ili naručuju vlastite čipove kako bi dio opterećenja prebacili na optimizirane platforme. Kada se broj korisničkih interakcija mjeri u milijardama, i mala razlika u cijeni po upitu može promijeniti ekonomiku cijele usluge. Zato custom silicij postaje jednako poslovna odluka koliko i tehnološki projekt. Takav razvoj mijenja i odnos između dobavljača i korisnika. Sve je manje prostora za široke tehnološke tvrdnje, dok se veća težina stavlja na integraciju, sigurnosne kontrole, dostupnost kadrova i jasne pokazatelje povrata ulaganja.

Dobavljači hardvera pritom moraju balansirati između dva ritma. Cloud platforme traže brze cikluse optimizacije za AI workload, dok enterprise kupci žele stabilnost, dug životni ciklus i podršku koja se ne mijenja svakih nekoliko mjeseci. Upravo ta razlika određuje tko može prodati laboratorijski napredak kao proizvodnu infrastrukturu.

Za europsko tržište ova vijest dodatno naglašava problem tehnološke suverenosti. Europa može razvijati modele, regulativu i lokalne cloud usluge, ali ako najvažniji infrastrukturni slojevi ostanu koncentrirani kod nekoliko američkih i azijskih kompanija, prostor za samostalnu industrijsku politiku bit će ograničen. Regionalni korisnici OpenAI-jevih usluga neće birati čip na kojem se izvodi njihov upit, no cijena, latencija, dostupnost i lokacija obrade podataka ovisit će upravo o tim arhitekturnim odlukama. Za manje tržište posebno je važno hoće li se nova ponuda isporučivati kroz lokalne partnere, regionalne cloud lokacije, operatorske platforme ili globalne ugovore u kojima domaći korisnici imaju ograničen prostor za pregovore.

Na strani kupaca to stvara drugačiju dinamiku pregovora. Tehnološki odjeli više ne mogu sami gurati projekte ako financije ne vide jasan odnos između ulaganja i rezultata, a poslovne jedinice sve češće traže da se učinak mjeri kroz brzinu isporuke, kvalitetu usluge ili smanjenje rizika.

Za CIO-eve i voditelje infrastrukture najvažnije pitanje postaje dostupnost kapaciteta u trenutku kada projekt treba prijeći u produkciju. Ako se GPU, HBM, SSD ili mrežni kapacitet rezerviraju prekasno, poslovni plan umjetne inteligencije može zapeti na opskrbnom lancu, a ne na modelu ili aplikaciji.

Dobavljački ekosustav također se mijenja. Partneri koji su prije prodavali implementaciju sada moraju preuzeti dio odgovornosti za upravljanje, sigurnost, optimizaciju troška i kontinuiranu nadogradnju. To povećava vrijednost specijaliziranih integratora, ali i podiže očekivanja prema njihovim kapacitetima.

Custom AI čipovi pritom ne znače kraj općih GPU klastera. Tržište će se vjerojatno razvijati u slojevima: najzahtjevniji trening i dalje će tražiti najjače akceleratore, masovna inferencija selit će se na optimizirane čipove, a dio zadataka spuštat će se na edge, PC-je i nosive uređaje. OpenAI-jev potez govori da su najveći igrači ušli u fazu u kojoj se AI proizvod više ne može odvojiti od infrastrukture. Model, aplikacija, čip, podatkovni centar i ugovor o energiji postaju jedan lanac, a konkurencija se sve više vodi oko toga tko taj lanac može kontrolirati uz najmanje troška i najviše pouzdanosti. Zato ova tema vrijedi više od kratke dnevne objave. U njoj se vidi kako se idući val ICT potrošnje oblikuje oko kapaciteta, sigurnosti, automatizacije i energetske održivosti, uz sve manje prostora za neprovjerene tehnološke tvrdnje.