VELIKO ISTRAŽIVANJE

Umjetna inteligencija nas još uvijek neće zamijeniti na poslu. Zato jer ne može...

Nedavni eksperiment stručnjaka s američkog Sveučilišta Carnegie Mellon uključivao je upravljanje lažnom softverskom kompanijom koju su u potpunosti činili AI agenti, modeli umjetne inteligencije osmišljeni za samostalno obavljanje zadataka, a rezultati su bili urnebesno kaotični.

Umjetna inteligencija nas još uvijek neće zamijeniti na poslu. Zato jer ne može...
Depositphotos

Ako ste se brinuli da će AI singularnost preuzeti sve poslove i ostaviti vas na ulici, sada možete odahnuti, jer umjetna inteligencija neće tako skoro ugroziti vašu karijeru. Ne zato što to ne želi nego zato što jednostavno ne može.

Nedavni eksperiment stručnjaka s američkog Sveučilišta Carnegie Mellon uključivao je upravljanje lažnom softverskom kompanijom koju su u potpunosti činili AI agenti, modeli umjetne inteligencije osmišljeni za samostalno obavljanje zadataka, a rezultati su bili urnebesno kaotični.

Simulacija, nazvana TheAgentCompany, bila je u potpunosti "zaposlena" umjetnim radnicima iz kompanija kao Google, OpenAI, Anthropic i Meta. Zauzimali su pozicije financijskih analitičara, softverskih inženjera i voditelja projekata, a surađivali su i sa simuliranim kolegama poput lažnog odjela za ljudske resurse i glavnog tehničkog direktora.

Kako bi vidjeli kako se modeli snalaze u realnim poslovnim uvjetima, stručnjaci su im davali zadatke temeljene na svakodnevnom radu stvarne softverske kompanije. Razni AI agenti morali su se snalaziti u direktorijima datoteka, virtualno obilaziti nove uredske prostore i pisati evaluacije učinka softverskih inženjera na temelju prikupljenih povratnih informacija. Rezultati su bili porazni.

Najbolji model bio je Anthropicov Claude 3.5 Sonnet, koji je uspio završiti 24 posto dodijeljenih zadataka. Autori studije istaknuli su da je čak i ovo skromno postignuće bilo izrazito skupo, s prosjekom od gotovo 30 koraka i troškom iznad šest dolara po zadatku.

Googleov Gemini 2.0 Flash, s druge strane, prosječno je trošio 40 koraka po dovršenom zadatku, ali je imao stopu uspješnosti od samo 11,4 posto, što je bio drugi najbolji rezultat među svim modelima. Najlošiji "zaposlenik" bio je Amazonov Nova Pro v1, koji je uspio završiti samo 1,7 posto zadataka, uz prosječno gotovo 20 koraka po zadatku.

Pritom, bilježi se, agenti pate od nedostatka zdravog razuma, slabih socijalnih vještina i lošeg razumijevanja načina snalaženja na internetu. Imali su problema i sa samoobmanom, stvarajući prečace koji su ih dovodili do potpune propasti zadatka. Primjerice, tijekom izvršavanja jednog zadatka agent nije mogao pronaći pravu osobu kojoj bi postavio pitanja na. Kao rješenje, odlučio je preimenovati drugog korisnika u ime željene osobe.

Iako AI agenti mogu uspješno izvršiti neke manje zadatke, rezultati ove i drugih studija jasno pokazuju da još uvijek nisu spremni za složenije poslove u kojima ljudi briljiraju. Velik razlog za to je činjenica da naša trenutna "umjetna inteligencija" zapravo još uvijek više nalikuje sofisticiranom obliku prediktivnog teksta na pametnom telefonu nego pravoj svjesnoj inteligenciji koja može rješavati probleme, učiti iz prošlih iskustava i primijeniti ta iskustva na nove situacije.

Drugim riječima, strojevi nam zasad neće uzeti posao, bez obzira na tvrdnje velikih tehnoloških kompanija.