GLASOVNI AI

OpenAI je s tri nova audio modela dodatno pomaknuo granicu prema agentima koji slušaju, prevode i djeluju u stvarnom vremenu

14.05.2026.

Veličina fontaPrint

Novi modeli nisu samo kozmetička nadogradnja transkripcije, nego korak prema sustavima koji usred razgovora mogu zadržati kontekst, zvati alate i izvoditi radnje. Time se glas vraća u središte enterprise AI strategije, ali sada kao operativni interfejs, a ne samo kao dodatak chatbotu. Usluge korisničke podrške, prodaja, nekretnine i telekom već pokazuju gdje bi se ta promjena najbrže mogla monetizirati.

OpenAI je s tri nova audio modela dodatno pomaknuo granicu prema agentima koji slušaju, prevode i djeluju u stvarnom vremenu

OpenAI je predstavio modele GPT-Realtime-2, GPT-Realtime-Translate i GPT-Realtime-Whisper. Modeli su namijenjeni duljim glasovnim interakcijama, pozivanju alata, prijevodu više od 70 jezika i izradi transkripata u stvarnom vremenu. Među ranim korisnicima istaknuti su Zillow, Priceline i Deutsche Telekom. Upravo zato ova objava otvara mnogo širu priču od same početne informacije.

Najvažnije u ovoj priči nije samo pojedinačna brojka ili naziv tvrtke, nego činjenica da se cijeli sektor nalazi u fazi u kojoj mali operativni detalj može imati goleme tržišne posljedice. Rashladni kapacitet, jedna komponenta, jedna ranjivost ili jedan regulatorni članak danas puno lakše postaju točka loma zato što su sustavi gušće povezani nego prije i zato što je margina za pogrešku manja. Analitičke kuće već neko vrijeme upozoravaju da se industrija nalazi u prijelazu iz faze pilotiranja u fazu teške izvedbe. U prvoj etapi bilo je dovoljno pokazati da tehnologija radi; u drugoj se traže energija, sigurnost, kapacitet, integracija i rezultat koji se može mjeriti kroz prihod, trošak ili operativnu brzinu.

Umjetna inteligencija više se ne promatra kao izolirani softverski sloj. Sve češće je riječ o spoju modela, podataka, orkestracije, sigurnosti, identiteta i fizičke računalne infrastrukture. Upravo zato tržište iz dana u dan snažnije nagrađuje one igrače koji ne nude samo model, nego cijeli operativni okvir u kojem se model može pretvoriti u mjerljivu poslovnu funkciju.

Upravo se tu vidi zašto tržište sve ozbiljnije govori o agentima, orkestraciji i AI-first organizaciji. Nije dovoljno da model generira odgovor; mora upravljati kontekstom, koristiti alate, poštovati pravila i raditi u ritmu stvarnih poslovnih procesa. Sve što to može ubrzati dobiva na vrijednosti, a sve što uvodi novi sloj nepredvidljivosti ulazi pod povećalo sigurnosti i upravljanja rizikom.

Audio sloj je posebno važan zato što glas pretvara generativni AI iz povremenog sučelja u stalnog operativnog suputnika. Kada model može slušati, prevoditi, razumjeti dulji kontekst i pozivati alate u realnom vremenu, raste i vjerojatnost da će se agentni AI preseliti iz demonstracija u kontaktne centre, putovanja, maloprodaju i terenski rad.
U AI segmentu tržište se ubrzano odvaja na one koji imaju vlastitu infrastrukturu, podatke i distribucijski kanal te na sve ostale koji to moraju kupovati od partnera. Ta razlika iz mjeseca u mjesec postaje važnija od pukog broja modela ili dojmljive demonstracije.

Organizacije zato više ne pitaju samo može li AI nešto napraviti, nego pod kojim uvjetima to može raditi pouzdano iz dana u dan. Usporedno s time raste potreba za procjenom stvarnog povrata, jer se eksperimentalna faza u mnogim segmentima približava granici iza koje uprava traži mjerljiv poslovni rezultat.

Upravo zato se i ova tema uklapa u širi pomak tehnološkog tržišta prema strožoj selekciji pobjednika. Nije više presudno tko najglasnije najavi novu mogućnost, nego tko je može povezati s infrastrukturom, sigurnošću, opskrbom, regulatornom prohodnošću i jasnim poslovnim učinkom. Kako se tržište zgušnjava, razlika između obećanja i održive isporuke postaje sve vidljivija, a to je u pravilu trenutak u kojem se dugoročni odnos snaga počinje lomiti puno brže nego što sugeriraju dnevni naslovi.

#audio #GPT5 #OpenAI #GPT-5

OpenAI je s tri nova audio modela dodatno pomaknuo granicu prema agentima koji slušaju, prevode i djeluju u stvarnom vremenu

SPONZORIRANO

NT konferencija: "Budućnost nije u umjetnoj inteligenciji koju kupujete, nego u ljudima koje zapošljavate"

Predstavljen program najvećeg Weekenda dosad: Mate Rimac, Jack Kreindler, Ulrik Haagerup i Emil Tedeschi stižu u Rovinj

Predstavljen natječaj za djecu i edukativna slikovnica Sretno more koju potpisuje Domagoj Jakopović Ribafish

Kibernetička sigurnost u eri AI-ja i naprednih prijetnji: 10. eSecurity konferencija stiže u Beograd

NIS2 je stigao. Koliko su zapravo sigurni kriptografski ključevi koji štite vaše poslovanje?

NAJNOVIJE

Fina dodijelila deset Zlatnih bilanci za rezultate ostvarene u 2025. godini

Visa i europske banke ulaze u novu fazu plaćanja putem AI agenata

EU počela naplaćivati novu e-trgovinsku carinu za male pakete

Drugi kvartal donio pad vrijednosti ugovornih poslova u odnosu na isto razdoblje 2025. godine

Najnoviji Honor Magic V6 osvojio dvije prestižne nagrade na MWC-u u Šangaju i ušao u povijest GLOMO-a

NAJČITANIJE

Predstavljen natječaj za djecu i edukativna slikovnica Sretno more koju potpisuje Domagoj Jakopović Ribafish

Razlika između najavljenih i stvarno građenih kapaciteta hladi AI euforiju

Tržište poštanskih usluga u prvom tromjesečju 2026.: više paketa i veći prihodi, nastavljen pad broja pisama

CARNET provodi analizu neovlaštene objave podataka povezanih s korisnicima iz školskog sustava

Predstavljen program najvećeg Weekenda dosad: Mate Rimac, Jack Kreindler, Ulrik Haagerup i Emil Tedeschi stižu u Rovinj

Prijavi se na newsletter

PONUDA POSLOVA U ICT SEKTORU

Prati nas i na Facebooku

OpenAI je s tri nova audio modela dodatno pomaknuo granicu prema agentima koji slušaju, prevode i djeluju u stvarnom vremenu

Više vijesti iz kategorije

SPONZORIRANO

NAJNOVIJE

NAJČITANIJE

Prijavi se na newsletter

PONUDA POSLOVA U ICT SEKTORU

Prati nas i na Facebooku