Donald Trump započeo je mandat izjavom da Sjedinjene Američke Države moraju biti lider, ali je dobio upozorenje od tima stručnjaka za umjetnu inteligenciju iz Kine, koji su spremni pokazati da američka tehnološka nadmoć nije zajamčena.
Naime, DeepSeek, kineski startup koji je proizašao iz deset godina starog hedge fonda specijaliziranog za proračunate trgovine pomoću AI-ja i algoritama, šokirao je mnoge u američkoj industriji kompleksnošću i naprednim mogućnostima. U objavljenom radu, DeepSeek je predstavio novi vodeći AI model nazvan R1, koji demonstrira novu razinu "razmišljanja". Razlog zašto je ostavio tako snažan dojam na američke AI stručnjake je itekako značajan.
Što točno R1 radi? Postiže performanse usporedive s OpenAI o1 na zadacima iz matematike, kodiranja i razmišljanja. Istraživački rad navodi da je to moguće zahvaljujući "čistom reinforcement learningu", tehnici koju je Jim Fan, viši istraživač u Nvidiji, usporedio s tajnom koja je Google DeepMindov AlphaZero učinila majstorom igara poput Goa i šaha od nule, bez oponašanja poteza ljudskih velemajstora.
DeepSeek, osnovan 2023., naveo je u radu da je to učinio s ciljem istraživanja potencijala AI-ja za razvijanje sposobnosti razmišljanja bez nadziranih podataka. Ovo je uobičajena tehnika koju koriste istraživači umjetne inteligencije. Tvrtka je također istaknula da im je ranija verzija R1, nazvana R1-Zero, dala "aha trenutak" u kojem je AI naučio posvetiti više vremena razmišljanju o problemu kako bi ponovno procijenio svoj početni pristup.
Ovakva razina transparentnosti u razvoju AI-ja rijetko se viđa u radovima koje objavljuju tvrtke poput OpenAI-a kada izdaju modele slične sposobnosti. Sve ove karakteristike pokazuju da Kina može parirati nekim od najboljih AI modela u industriji i držati korak sa SAD-om.
Ujedno, DeepSeek je već pokazao stručnost u razmišljanju. U studenom je kompanija predstavila "R1-lite-preview" koji je prikazao njegov transparentan proces razmišljanja u stvarnom vremenu. U prosincu su lansirali model V3 kao novu, veću osnovu za buduće modele razmišljanja. Zato američki istraživači u najnovijem modelu R1 vide značajan napredak.
Model se može distilirati, što znači da manje, ali moćne verzije mogu raditi na hardveru koji je daleko manje intenzivan od računalne snage na serverima podatkovnih centara na kojima se mnoge tehnološke kompanije oslanjaju za svoje AI modele. Primjerice, verzija R1 modela s 671 milijardom parametara radi na dva Apple M2 Ultra čipa.
No, na kraju treba naglasiti da R1 ipak ima jedan ključni problem - cenzuru kineske Komunističke partije. Ako je tema potencijalno osjetljiva za nju, R1 će prestati raditi.