BAZEN PRESUŠUJE

Kompanije sve teže prikupljaju podatke za trening umjetne inteligencije

Kompanije sve teže prikupljaju podatke za trening umjetne inteligencije
Depositphotos

Podaci igraju bitnu, ako ne i glavnu ulogu, u ekonomiji koja se tiče umjetne inteligencije. Oni su vitalna snaga modela, kako u osnovnoj funkciji, tako i u kvaliteti. Naime, što je više prirodnih podataka koje AI sustav ima za trening, to postaje bolji.

Nažalost, za tvrtke koje se bave AI-om, ispostavlja se da su prirodni podaci ograničen resurs pa i ako taj izvor presuši, istraživači upozoravaju da bi to moglo dovesti do ozbiljnih posljedica.

Kao što Rita Matulionyte, profesorica prava informacijske tehnologije na sveučilištu Macquarie u Australiji, napominje u eseju za The Conversation, istraživači iz područja AI već skoro godinu dana upozoravaju na opasnost od smanjenja zaliha podataka. Jedno istraživanje prošle godine od strane istraživača u organizaciji za predviđanje AI Epoch AI procijenilo je da bi AI tvrtke mogle ostati bez visokokvalitetnih tekstualnih podataka za trening već do 2026., dok bi "bazeni" niskokvalitetnih tekstualnih i slikovnih podataka mogli presušiti bilo kada između 2030. i 2060.

To je delikatna situacija za tvrtke koje se bave AI-om, s obzirom na to koliko podataka AI sustavi trebaju za rad i poboljšanje. Naime, AI modeli su se značajno razvijali kako su razvojni programeri unosili sve više podataka. Ako opskrba podacima stagnira, možda će stagnirati i modeli, a time možda i cijela industrija.

Trenutačno najpraktičnije rješenje za ovaj nadolazeći problem može zapravo biti kroz partnerske odnose s podacima. Ukratko, tvrtka ili institucija s ogromnom i traženom zalihom visokokvalitetnih podataka sklapa dogovor s AI tvrtkom da im ustupi te podatke, vjerojatno u zamjenu za novac.

S obzirom da većina AI skupova podataka koji se trenutačno koriste za treniranje AI sustava potječe iz podataka prikupljenih s interneta, a koji su izvorno stvoreni od strane svih nas online, partnerstva s podacima možda nisu najgori način. No, kako podaci postaju sve vrijedniji, sigurno će biti zanimljivo vidjeti koliko se AI tvrtki može stvarno natjecati za skupove podataka.

No, čak i tada, nema jamstva da bazeni podataka nikada neće presušiti. Koliko god internet izgledao beskrajan, malo toga je doista takvo...