SVE JEFTINIJE

Američki stručnjaci kreirali konkurenciju za OpenAI: Koštala je manje od 50 dolara

08.02.2025.

Veličina fontaPrint

Trening modela s1 trajao je manje od 30 minuta na 16 Nvidia H100 GPU-ova.

Američki stručnjaci kreirali konkurenciju za OpenAI: Koštala je manje od 50 dolara

Stručnjaci za umjetnu inteligenciju sa Stanforda i Sveučilišta Washington uspjeli su istrenirati AI model za "rezoniranje" uz ukupne troškove manje od 50 dolara u cloudu, prema novom istraživačkom radu objavljenom krajem siječnja.

Model, poznat kao s1, postiže slične rezultate kao vrhunski modeli rezoniranja, poput OpenAI-jevog o1 i DeepSeekovog R1, na testovima koji mjere matematičke i programerske sposobnosti. Model s1 dostupan je na GitHubu, zajedno s podacima i kodom korištenim za njegovo treniranje.

Temelji se na malom, slobodno dostupnom AI modelu kineskog AI laboratorija Qwen, koji je u vlasništvu Alibabe. Kako bi trenirali s1, istraživači su stvorili skup od samo tisući pažljivo odabranih pitanja, uparili ih s odgovorima te uključili proces "razmišljanja" iza svakog odgovora iz modela Gemini 2.0 Flash Thinking Experimental.

Tim koji stoji iza s1 modela započeo je s osnovnim modelom dostupnim na tržištu, a zatim ga je doradio pomoću destilacije - procesa kojim se "rezonirajuće" sposobnosti izvlače iz drugog AI modela treniranjem na njegovim odgovorima.

Stručnjaci navode da je s1 destiliran iz jednog od Googleovih modela za rezoniranje, Gemini 2.0 Flash Thinking Experimental. Destilacija je ista metoda koju su istraživači s Berkeleyja koristili prošlog mjeseca kako bi stvorili AI model rezoniranja za otprilike 450 dolara.

Trening modela s1 trajao je manje od 30 minuta na 16 Nvidia H100 GPU-ova, a prema uključenima u trening, postigao je dobre rezultate na određenim AI testovima. Niklas Muennighoff sa Stanforda, koji je radio na projektu, rekao je da bi danas mogao unajmiti potrebne resurse za otprilike 20 dolara.

Za neke je uzbudljivo što nekoliko istraživača bez milijuna dolara iza sebe i dalje može inovirati u AI industriji. No, s1 otvara ozbiljna pitanja o komodifikaciji AI modela.

Očekivano, velike AI kompanije nisu zadovoljne. OpenAI je optužio DeepSeek za nepropisno prikupljanje podataka s njegovog API-ja radi destilacije modela. Za takav stav ih se proziva licemjernima jer su svoje modele "trenirali" kroz autorske radove i sadržaj, bez da su za to tražili dopuštenje.

#umjetnainteligencija #ChatGPT #openai #models1

Američki stručnjaci kreirali konkurenciju za OpenAI: Koštala je manje od 50 dolara

SPONZORIRANO

Pametni sat kao saveznik zdravijih svakodnevnih odluka

Gdje danas zapravo počinje briga o zdravlju?

Kibernetička otpornost uz AI: Kako Prianto/QBS i OpenText grade platformu za CEE regiju

Dronovi nisu igračke, neovlašteno letenje iznad intervencija može ih ozbiljno ugroziti

Počinje nogometna groznica: Evo kako pratiti utakmice bez propuštenog detalja

NAJNOVIJE

Mollie pokreće poslovanje u Hrvatskoj

HAKOM ne prejudicira svoju ulogu u provedbi AI Acta, ali upozorava da Hrvatska mora jasno urediti nadležnosti, postupke i financiranje

Hrvatski startup uvodi prvog AI agenta za javnu nabavu

Lenovo predstavio novu generaciju tableta - Tab Plus Gen 2

ReversingLabs prepoznat u prvom Gartnerovom izvješću Magic Quadrant za sigurnost lanca nabave softvera

NAJČITANIJE

SpaceX prikupio 75 milijardi dolara u IPO-u

Implementacija Zero Trust arhitekture postaje zakonska obveza za kritičnu infrastrukturu unutar EU

Skok troškova javnog oblaka potiče val on-premise repatrijacije podataka i AI modela

Europski cloud pružatelji traže domaću infrastrukturu

Prijelaz na Agentic AI kad autonomni softverski agenti preuzimaju primat nad pasivnim kopilotima

Prijavi se na newsletter

PONUDA POSLOVA U ICT SEKTORU

Prati nas i na Facebooku

Američki stručnjaci kreirali konkurenciju za OpenAI: Koštala je manje od 50 dolara

Više vijesti iz kategorije

SPONZORIRANO

NAJNOVIJE

NAJČITANIJE

Prijavi se na newsletter

PONUDA POSLOVA U ICT SEKTORU

Prati nas i na Facebooku