POTRAGA ZA PODACIMA

Velike tehnološke kompanije koriste svaku mogućnost potrage za podacima

Velike tehnološke kompanije koriste svaku mogućnost potrage za podacima
Depositphotos

Sve je danas u podacima, a velike tehnološke kompanije koje se bave umjetnom inteligencijom vape za dobrim podacima. Tako je OpenAI-ja stvorio alat za prepoznavanje govora pod nazivom Whisper. Mogao bi transkribirati zvuk s YouTube videa, dajući novi razgovorni tekst koji bi napravio AI sustav pametniji. Kako tvrde dobo upućeni, iako to nije smio učiniti zbog Googleovih pravila OpenAI transkribirao je više od milijun sati YouTube videa.

Utrka za vodstvo u za mjesto na čelu AI rezultirala je lovom na digitalne podatke bez obzir na činjenicu da se time krše zakoni, korporativna pravila, moralna pravila i sve drugo što im se nađe na putu. Tako, prema procjenama analitičara, svi su u tome sudjelovali i OpenAi, Google i Meta.

Tako transkribirani tekstovi zatim suuneseni u sustav nazvan GPT-4, koji se naširoko smatra jednim od najmoćnijih svjetskih AI modela i bio je osnova najnovije verzije ChatGPT chatbota.

Meta je pak raspravljala, govore dostupni podaci, o kupnji jednog izdavača kako bi „hranila“ svoj AI novim podacima. I ovdje se spominje kako su koristili nelegalne izvore za učenje AI algoritama.

S druge strane, Google je transkribirao YouTube videozapise kako bi prikupio tekst za svoj AI modeli, tvrde dobro upućeni. Time su potencijalno prekršena autorska prava na videozapise, koja pripadaju njihovim kreatorima, smatraju pravni stručnjaci.