VELIKO ISTRAŽIVANJE

Umjetna inteligencija nas još uvijek neće zamijeniti na poslu. Zato jer ne može...

08.05.2025.

Veličina fontaPrint

Nedavni eksperiment stručnjaka s američkog Sveučilišta Carnegie Mellon uključivao je upravljanje lažnom softverskom kompanijom koju su u potpunosti činili AI agenti, modeli umjetne inteligencije osmišljeni za samostalno obavljanje zadataka, a rezultati su bili urnebesno kaotični.

Umjetna inteligencija nas još uvijek neće zamijeniti na poslu. Zato jer ne može...

Ako ste se brinuli da će AI singularnost preuzeti sve poslove i ostaviti vas na ulici, sada možete odahnuti, jer umjetna inteligencija neće tako skoro ugroziti vašu karijeru. Ne zato što to ne želi nego zato što jednostavno ne može.

Simulacija, nazvana TheAgentCompany, bila je u potpunosti "zaposlena" umjetnim radnicima iz kompanija kao Google, OpenAI, Anthropic i Meta. Zauzimali su pozicije financijskih analitičara, softverskih inženjera i voditelja projekata, a surađivali su i sa simuliranim kolegama poput lažnog odjela za ljudske resurse i glavnog tehničkog direktora.

Kako bi vidjeli kako se modeli snalaze u realnim poslovnim uvjetima, stručnjaci su im davali zadatke temeljene na svakodnevnom radu stvarne softverske kompanije. Razni AI agenti morali su se snalaziti u direktorijima datoteka, virtualno obilaziti nove uredske prostore i pisati evaluacije učinka softverskih inženjera na temelju prikupljenih povratnih informacija. Rezultati su bili porazni.

Najbolji model bio je Anthropicov Claude 3.5 Sonnet, koji je uspio završiti 24 posto dodijeljenih zadataka. Autori studije istaknuli su da je čak i ovo skromno postignuće bilo izrazito skupo, s prosjekom od gotovo 30 koraka i troškom iznad šest dolara po zadatku.

Googleov Gemini 2.0 Flash, s druge strane, prosječno je trošio 40 koraka po dovršenom zadatku, ali je imao stopu uspješnosti od samo 11,4 posto, što je bio drugi najbolji rezultat među svim modelima. Najlošiji "zaposlenik" bio je Amazonov Nova Pro v1, koji je uspio završiti samo 1,7 posto zadataka, uz prosječno gotovo 20 koraka po zadatku.

Pritom, bilježi se, agenti pate od nedostatka zdravog razuma, slabih socijalnih vještina i lošeg razumijevanja načina snalaženja na internetu. Imali su problema i sa samoobmanom, stvarajući prečace koji su ih dovodili do potpune propasti zadatka. Primjerice, tijekom izvršavanja jednog zadatka agent nije mogao pronaći pravu osobu kojoj bi postavio pitanja na. Kao rješenje, odlučio je preimenovati drugog korisnika u ime željene osobe.

Iako AI agenti mogu uspješno izvršiti neke manje zadatke, rezultati ove i drugih studija jasno pokazuju da još uvijek nisu spremni za složenije poslove u kojima ljudi briljiraju. Velik razlog za to je činjenica da naša trenutna "umjetna inteligencija" zapravo još uvijek više nalikuje sofisticiranom obliku prediktivnog teksta na pametnom telefonu nego pravoj svjesnoj inteligenciji koja može rješavati probleme, učiti iz prošlih iskustava i primijeniti ta iskustva na nove situacije.

Drugim riječima, strojevi nam zasad neće uzeti posao, bez obzira na tvrdnje velikih tehnoloških kompanija.

#openai #Gemini #AIagent #Anthropic

Umjetna inteligencija nas još uvijek neće zamijeniti na poslu. Zato jer ne može...

SPONZORIRANO

Pet razloga zašto je Huawei Watch Fit 4 savršen pametni dodatak za ljeto

AI.Weekend opet okuplja regionalnu AI zajednicu u Rovinju: Ideje, inovacije i rasprave koje oblikuju današnjicu

Pretvorite fotografije s putovanja u umjetnička djela uz kameru HONOR 400 serije

Velika ronilačka akcija čišćenja: Iz rovinjskog podmorja izvučeno preko tone smeća

Samsung u suradnji s Jamiejem Oliverom kreira nove recepte za Bespoke AI kućanske uređaje

NAJNOVIJE

INFOGRAFIKA: Gdje žrtve prijevara trpe najveće gubitke

ENT potpredsjedniku Vlade i ministru obrane Anušiću prikazao najnovije tehnologije s fokusom na primjene u obrambenim i javnosigurnosnim sustavima

Vertiv otvorio novi akademski centar u Frankfurtu

GlobalLogic i Matera najavljuju globalno partnerstvo za ubrzanje modernizacije osnovnih bankarskih sustava

Samsung najavljuje predstavljanje najnovijih tehnoloških inovacija

NAJČITANIJE

Izvrsna kvaliteta usluga hrvatskih mobilnih mreža, najbolji HT, slijedi Telemach, a na trećem mjestu je A1

EIT Culture & Creativity ističe sve veći investicijski zamah u europskoj kreativnoj tehnologiji na konferenciji The Next Web

Span dobio zeleno svjetlo HANFA-e za izdavanje obveznica povezanih s održivošću vrijednih 25 milijuna eura

Samsung objasnio svoju Quantum Dot tehnologiju i što ona donosi tržištu

Honor spojio umjetnost i tehnologiju u Muzeju suvremene umjetnosti

Prijavi se na newsletter

PONUDA POSLOVA U ICT SEKTORU

Prati nas i na Facebooku

Umjetna inteligencija nas još uvijek neće zamijeniti na poslu. Zato jer ne može...

Više vijesti iz kategorije

SPONZORIRANO

NAJNOVIJE

NAJČITANIJE

Prijavi se na newsletter

PONUDA POSLOVA U ICT SEKTORU

Prati nas i na Facebooku