OpenAI je predstavio o3-pro, AI model za koji tvrdi da je najnapredniji u njegovom portfelju. On je verzija modela o3, namijenjenog za rezoniranje.
Za razliku od konvencionalnih AI modela, modeli za rezoniranje rješavaju probleme korak po korak, što im omogućuje pouzdaniji rad u područjima poput fizike, matematike i programiranja.
O3-pro je dostupan korisnicima ChatGPT Pro i Team paketa od utorka, zamjenjujući dosadašnji model o1-pro. Korisnici Enterprise i Edu paketa dobit će pristup tjedan dana kasnije, navodi OpenAI. O3-pro je također od danas dostupan putem OpenAI-jeva developerskog API-ja.
Cijena modela u API-ju iznosi 20 američkih dolara po milijunu ulaznih tokena i 80 dolara po milijunu izlaznih tokena. Ulazni tokeni su oni koji se unose u model, dok su izlazni tokeni oni koje model generira na temelju ulaza. Milijun ulaznih tokena otprilike odgovara 750.000 riječi.
"U stručnim evaluacijama, recenzenti su dosljedno davali prednost modelu o3-pro u odnosu na o3 u svim testiranim kategorijama, osobito u ključnim područjima poput znanosti, obrazovanja, programiranja, poslovanja i pomoći pri pisanju. Recenzenti su također ocijenili o3-pro boljim u pogledu jasnoće, sveobuhvatnosti, praćenja uputa i točnosti", navode u OpenAI-ju.
Dodaju i da o3-pro ima pristup alatima koji mu omogućuju pretraživanje interneta, analizu datoteka, rezoniranje na temelju vizualnih podataka, korištenje Pythona, personalizaciju odgovora korištenjem memorije i još mnogo toga. Kao nedostatak, navodi se da o3-pro obično daje odgovore sporije nego o1-pro.
Model o3-pro ima i neka ograničenja. Privremeni razgovori s modelom unutar ChatGPT-a trenutačno su onemogućeni dok OpenAI ne riješi tehnički problem. O3-pro također ne može generirati slike. Canvas, OpenAI-jev alat za radne prostore pogonjen umjetnom inteligencijom, nije podržan u o3-pro modelu.
S druge strane, o3-pro postiže impresivne rezultate na poznatim AI testiranjima, prema internim ispitivanjima OpenAI-ja. Na testu AIME 2024, koji procjenjuje matematičke sposobnosti modela, o3-pro je ostvario bolje rezultate od najnaprednijeg Googleovog AI modela Gemini 2.5 Pro. Također, o3-pro je nadmašio Anthropicov Claude 4 Opus na GPQA Diamond testu koji provjerava znanje na doktorskoj razini iz znanosti.