Stručnjaci za umjetnu inteligenciju sa Stanforda i Sveučilišta Washington uspjeli su istrenirati AI model za "rezoniranje" uz ukupne troškove manje od 50 dolara u cloudu, prema novom istraživačkom radu objavljenom krajem siječnja.
Model, poznat kao s1, postiže slične rezultate kao vrhunski modeli rezoniranja, poput OpenAI-jevog o1 i DeepSeekovog R1, na testovima koji mjere matematičke i programerske sposobnosti. Model s1 dostupan je na GitHubu, zajedno s podacima i kodom korištenim za njegovo treniranje.
Temelji se na malom, slobodno dostupnom AI modelu kineskog AI laboratorija Qwen, koji je u vlasništvu Alibabe. Kako bi trenirali s1, istraživači su stvorili skup od samo tisući pažljivo odabranih pitanja, uparili ih s odgovorima te uključili proces "razmišljanja" iza svakog odgovora iz modela Gemini 2.0 Flash Thinking Experimental.
Tim koji stoji iza s1 modela započeo je s osnovnim modelom dostupnim na tržištu, a zatim ga je doradio pomoću destilacije - procesa kojim se "rezonirajuće" sposobnosti izvlače iz drugog AI modela treniranjem na njegovim odgovorima.
Stručnjaci navode da je s1 destiliran iz jednog od Googleovih modela za rezoniranje, Gemini 2.0 Flash Thinking Experimental. Destilacija je ista metoda koju su istraživači s Berkeleyja koristili prošlog mjeseca kako bi stvorili AI model rezoniranja za otprilike 450 dolara.
Trening modela s1 trajao je manje od 30 minuta na 16 Nvidia H100 GPU-ova, a prema uključenima u trening, postigao je dobre rezultate na određenim AI testovima. Niklas Muennighoff sa Stanforda, koji je radio na projektu, rekao je da bi danas mogao unajmiti potrebne resurse za otprilike 20 dolara.
Za neke je uzbudljivo što nekoliko istraživača bez milijuna dolara iza sebe i dalje može inovirati u AI industriji. No, s1 otvara ozbiljna pitanja o komodifikaciji AI modela.
Očekivano, velike AI kompanije nisu zadovoljne. OpenAI je optužio DeepSeek za nepropisno prikupljanje podataka s njegovog API-ja radi destilacije modela. Za takav stav ih se proziva licemjernima jer su svoje modele "trenirali" kroz autorske radove i sadržaj, bez da su za to tražili dopuštenje.