Brzina lansiranja dostigla razinu koja onemogućuje dugoročno planiranje enterprise implementacija
Depositphotos
U travnju i svibnju 2026. tempo lansiranja AI modela dostigao je razinu koja nema presedana u povijesti softverske industrije. OpenAI je 23. travnja lansirao GPT-5.5, svega šest tjedana nakon GPT-5.4. Anthropic je u prvih 50 dana 2026. isporučio četiri major Claude ažuriranja. Google je Gemini 3.1 Ultra s kontekstnim prozorom od 2 milijuna tokena pustio u preview u travnju, a Gemini 2.0 modeli idu u end-of-life 1. lipnja. xAI-ev Grok 4.20 ostaje Musk-ov AI laboratorijski flagship lansiran 31. ožujka. Mistral 3 i DeepSeek V4 paralelno napreduju u open-source i open-weight segmentu.
GPT-5.5 pozicioniran je kao "najpametniji i najintuitivniji" OpenAI model dosad, s posebnim naglaskom na agentno kodiranje, computer use (autonomno upravljanje grafičkim sučeljima), knowledge work i rane faze znanstvenog istraživanja. Dostupan je od 24. travnja putem API-ja uz napomenu da zahtijeva "drukčije zaštitne mjere" od consumer ChatGPT što znači stroži enterprise onboarding. Antropic potvrđuje dolazak Claude Opus 4.7 uskoro, a interni model Claude Mythos koji navodno pronalazi tisuće software ranjivosti brzinom neuposredivom s ljudskim sigurnosnim istraživačima ostaje u ograničenom testiranju s više od 40 organizacija-partnera.
Što ova brzina znači za enterprise kupce? Gartner procjenjuje da 40 posto enterprise aplikacija treba ugraditi agentni AI do kraja 2026., uz polazišnu točku od manje od 5 posto u 2024. Paralelno, Gartnerova paralelna prognoza da 40 posto agentic AI inicijativa može biti napušteno do 2027. zbog nejasnog ROI-a, rastućih troškova ili nedovoljnog risk managementa otkriva sistemsku tenziju. Organizacije koje se odluče za specifičnu verziju modela danas riskiraju da ta verzija postane legacy za 8-10 tjedana. Preporučena strategija je korištenje "stable aliases" ili default model endpointa umjesto hardkodiranih verzija u production kodu što zahtijeva arhitekturnu zrelost koja većini enterprise timova još nedostaje.
Posebno je značajan ulazak Google Gemini 3.1 Ultra-a s 2 milijuna tokena kontekstnog prozora. Za usporedbu: GPT-4 je startao s 8.000 tokena 2023. Dva milijuna tokena znači da model može simultano procesirati cijele poslovne repozitorije, godišnje izvještaje, transkripte sudskih postupaka ili tehničku dokumentaciju kao jedan kontekstualni blok bez chunking strategija. Ovo nije samo tehnička nadogradnja; to mijenja tip poslovnih problema koji su uopće rješivi s AI-jem.
Posljednjih godina Mooreov zakon, koji je više od pet desetljeća usmjeravao industriju poluvodiča, suočio se s ozbiljnim fizičkim ograničenjima i sve slabijim ekonomskim povratima. Globalna industrija sve je više ograničena usporavanjem geometrijskog skaliranja tranzistora i slabljenjem koristi u trošku po tranzistoru.
Ubrzana gradnja podatkovnih centara prilagođenih za smještaj najmodernijih AI akceleratora dovela je do radikalne promjene u dizajnu infrastrukture u posljednjih 48 sati. Vodeći inženjerski konzorciji i operateri podatkovnih centara objavili su nove smjernice prema kojima tradicionalni sustavi hlađenja zrakom više ne mogu zadovoljiti toplinske zahtjeve novih procesorskih arhitektura.
CoreWeave je podigao donji prag procjene kapitalnih ulaganja za 2026. na 31 milijardu dolara. Kompanija je objavila prihod iznad očekivanja, ali je signalizirala snažan rast troškova i pritisak skupljih komponenti. Tržište je reagiralo padom dionice nakon objave kratkoročnog izgleda slabijeg od očekivanog. Zato je ovdje važnije ono što vijest signalizira tržištu nego sam kratkoročni naslov.