Što više težimo točnosti umjetne inteligencije, to veći postaje njezin ugljični otisak, neki upiti mogu proizvesti i do 50 puta više emisija ugljičnog dioksida nego drugi, otkriva novo istraživanje.
Modeli za zaključivanje, poput Claudea (Anthropic), o3 (OpenAI) i R1 (DeepSeek), specijalizirani su veliki jezični modeli (LLM-ovi) koji troše više vremena i računalne snage kako bi generirali točnije odgovore od svojih prethodnika.
No, unatoč impresivnim rezultatima, ovi modeli imaju ozbiljna ograničenja u rješavanju složenih problema. Sada je tim istraživača istaknuo još jednu prepreku za njihove performanse, njihov ogroman ugljični otisak. Svoja su otkrića objavili 19. lipnja u časopisu Frontiers in Communication.
"Utjecaj ispitivanja treniranih LLM-ova na okoliš snažno ovisi o njihovom pristupu zaključivanju, pri čemu eksplicitni procesi zaključivanja značajno povećavaju potrošnju energije i emisije CO₂. Otkrili smo da modeli s mogućnošću zaključivanja proizvode i do 50 puta više emisija CO₂ od modela koji daju sažete odgovore", rekao je glavni autor studije Maximilian Dauner, istraživač sa Sveučilišta primijenjenih znanosti u Münchenu.
Za odgovaranje na postavljene upite, LLM-ovi razbijaju jezik na tzv. tokene, dijelove riječi koji se pretvaraju u nizove brojeva prije nego što ih obradi neuronska mreža. Te mreže, trenirane na velikim skupovima podataka, koriste vjerojatnosti za generiranje odgovora.
Modeli za zaključivanje dodatno povećavaju točnost korištenjem tehnike chain-of-thought, gdje se složen problem razlaže na niz manjih, logički povezanih koraka, slično kao kod ljudskog razmišljanja.
Međutim, takvi modeli imaju značajno veću energetsku potrošnju od konvencionalnih LLM-ova, što može postati financijsko ograničenje za tvrtke i korisnike koji ih žele koristiti. Unatoč rastućem interesu za okolišni utjecaj AI tehnologija, malo je izravnih usporedbi među različitim modelima s obzirom na njihov ugljični otisak.
Kako bi ispitali emisije CO₂, istraživači su 14 različitih LLM-ova postavili tisuću pitanja iz različitih područja. Modeli su imali između sedam i 72 milijarde parametara.
Najtočniji model bio je Cogito, koji je točno odgovorio na 84,9 posto postavljenih pitanja. No, isti model proizveo je tri puta više CO₂ nego modeli iste veličine koji generiraju kraće odgovore.
No, problem nije samo u točnosti, već i u prirodi pitanja. Pitanja koja zahtijevaju dulje razmišljanje, poput onih iz algebre ili filozofije, uzrokovala su i do šest puta veće emisije nego jednostavni upiti koji traže izravne odgovore.
Računice istraživača također pokazuju da emisije ovise i o samom modelu. Na primjer, za odgovor na 60.000 pitanja, DeepSeekov R1 model s 70 milijardi parametara proizveo bi istu količinu CO₂ kao povratni let između New Yorka i Londona. S druge strane, Alibaba Cloudov Qwen 2.5 model sa sličnom točnošću učinio bi to s tri puta manjim emisijama.
Iako rezultati nisu apsolutni, emisije mogu varirati ovisno o hardveru i izvorima energije, autori ističu da bi ovo istraživanje trebalo potaknuti korisnike da razmisle prije korištenja AI tehnologije.