Novi algoritam za strojno učenje probija CAPTCHA tekstove lakše nego ikad

Novi algoritam za strojno učenje probija CAPTCHA tekstove lakše nego ikad
Antonio Jularić

Znanstvenici iz Velike Britanije i Kine razvili su novi algoritam strojnog učenja koji brzo i lako probija CAPTCHA sustav baziran na tekstu. Niti jedna metoda se nije pokazala toliko uspješnom kao njihova.

Koncept na kojem se temelji novi algoritam jest GAN (Generative Adversarial Network) i njegova je značajka to što može baratati s jako malo informacija, a donositi točan rezultat u konačnici. Inače uobičajeno algoritmi trebaju milijune podataka kako bi donijeli zaključke, ali GAN to može uz daleko manje informacija, što ga zapravo čini algoritmom budućnosti. Dokazalo se to i na CAPTCHA primjeru.

Samo testiranje provedeno je nakon prikupljanja 500 tekstualnih CAPTCHA sa svake od 11 CAPTCHA usluga pronađenih na 32 najposjećenije web stranice svijeta. Trebalo je dva sata da se prikupi sve što je potrebno i još dva sata da bi korisnik ispunio svaku od njih. Potom je GAN za potrebe treninga prikupio 200 tisuća CAPTCHA rješenja, a potom je "bačen u svijet" i testiran na drugim web stranicama.

Točnost je bila na sto posto kad se radi o CAPTCHA sustavu na stranicama kao Megaupload, Blizzard i Authorize.NET. Također, bila je iznimno visoka i na web stranicama kao Amazon, Digg, Slashdot, PayPal, Yahoo i QQ, što jasno daje do znanja koliko su daleko otišli u svom istraživanju stručnjaci iz Velike Britanije i Kine, odnosno, sa sveučilišta Lancaster, Northwest i Peking.

Sve ovo samo će samo ubrzati novi CAPTCHA sustav, najavljen 30. listopada ove godine od strane Googlea. U toj verziji nazvanoj reCAPTCHA v3 napokon korisnici neće imati one dosadne probleme, upisivanje neprepoznatljivih slova ili klikanje po kvadratićima fotografije s ciljem pronalaska onoga što piše da treba pronaći. Umjesto toga, umjetna inteligencija prepoznavat će upise i aktivnost koja slijedi nakon te administratorima davati rezultate na uvid, nakon čega će uslijediti reakcija...