CES 2026

NVIDIA pokreće novu generaciju umjetne inteligencije platformom Rubin

Platforma Rubin temelji se na ekstremnoj kodesign arhitekturi šest ključnih komponenti: NVIDIA Vera CPU-a, NVIDIA Rubin GPU-a, NVLink 6 preklopnika, ConnectX-9 SuperNIC-a, BlueField-4 DPU-a i Spectrum-6 Ethernet preklopnika. Ovakav integrirani pristup drastično smanjuje vrijeme treniranja modela i trošak inferencijskih tokena, čime se otvara put skalabilnijim i ekonomičnijim AI sustavima.

NVIDIA pokreće novu generaciju umjetne inteligencije platformom Rubin

NVIDIA je službeno pokrenula novu generaciju umjetne inteligencije predstavljanjem platforme Rubin, koja se sastoji od šest novih čipova dizajniranih kao temelj za jednu iznimno snažnu AI superračunalnu arhitekturu. NVIDIA Rubin postavlja novi standard za izgradnju, implementaciju i sigurnost najvećih i najsloženijih AI sustava uz znatno niže troškove, s ciljem ubrzavanja masovnog prihvaćanja umjetne inteligencije.

Platforma Rubin temelji se na ekstremnoj kodesign arhitekturi šest ključnih komponenti: NVIDIA Vera CPU-a, NVIDIA Rubin GPU-a, NVLink 6 preklopnika, ConnectX-9 SuperNIC-a, BlueField-4 DPU-a i Spectrum-6 Ethernet preklopnika. Ovakav integrirani pristup drastično smanjuje vrijeme treniranja modela i trošak inferencijskih tokena, čime se otvara put skalabilnijim i ekonomičnijim AI sustavima.

„Rubin dolazi u pravom trenutku, kada potražnja za računalnom snagom za treniranje i inferenciju umjetne inteligencije eksplozivno raste“, izjavio je Jensen Huang, osnivač i glavni izvršni direktor NVIDIA-e. „Uz naš godišnji ritam isporuke novih generacija AI superračunala i ekstremni kodesign šest novih čipova, Rubin predstavlja ogroman iskorak prema sljedećoj granici umjetne inteligencije.“

Platforma je nazvana po Veri Florence Cooper Rubin, pionirki američke astronomije čija su otkrića promijenila razumijevanje svemira. Rubin arhitektura obuhvaća rack-scale rješenje Vera Rubin NVL72 te sustav HGX Rubin NVL8, namijenjene različitim vrstama AI opterećenja.

NVIDIA ističe kako Rubin donosi pet ključnih inovacija koje omogućuju ubrzani razvoj agentne umjetne inteligencije, naprednog zaključivanja i masovne inferencije modela temeljenih na mixture-of-experts pristupu, i to uz višestruko niži trošak po tokenu u odnosu na prethodnu generaciju Blackwell. U praksi to znači da se složeni AI modeli mogu trenirati s osjetno manjim brojem GPU-ova, čime se dodatno smanjuju infrastrukturni zahtjevi.

Rubin platformu planira usvojiti velik broj vodećih AI laboratorija, pružatelja usluga u oblaku, proizvođača računalne opreme i startupova. Među njima su Amazon Web Services, Google, Microsoft, Oracle Cloud Infrastructure, Meta, OpenAI, Anthropic i xAI, kao i brojni drugi igrači iz područja umjetne inteligencije i podatkovnih centara.

Sam Altman iz OpenAI-ja istaknuo je kako se inteligencija izravno skalira s dostupnom računalnom snagom, dok je Dario Amodei iz Anthropica naglasio da učinkovitost Rubina omogućuje dulju memoriju, bolje zaključivanje i pouzdanije rezultate. Mark Zuckerberg iz Mete vidi Rubin kao ključan korak za isporuku najnaprednijih modela milijardama korisnika, dok Elon Musk Rubin opisuje kao „raketni motor za umjetnu inteligenciju“.

Rubin platforma projektirana je za zahtjeve višekorakog zaključivanja i dugih sekvenci tokena, karakterističnih za agentnu AI i multimodalne sustave. NVLink šeste generacije omogućuje iznimno brzu GPU-komunikaciju, dok Vera CPU donosi visoku energetsku učinkovitost i optimizaciju za zaključivanje. Rubin GPU uključuje treću generaciju Transformer Enginea s hardverski ubrzanom adaptivnom kompresijom, a nova generacija Confidential Computinga i RAS mehanizama osigurava sigurnost, otpornost i visoku dostupnost sustava.

Poseban naglasak stavljen je i na AI-native pohranu podataka. NVIDIA uvodi Inference Context Memory Storage Platform, novu klasu infrastrukture koja omogućuje dijeljenje i ponovnu uporabu kontekstualnih podataka inferencije u velikim razmjerima. Time se povećava odziv sustava i smanjuje potrošnja energije, što je ključno za agentne AI sustave s višestrukim korisnicima i sesijama.

Vera Rubin NVL72 objedinjuje GPU-ove, CPU-ove, NVLink, mrežne kartice i DPU-ove u jedinstveni, sigurni sustav, dok HGX Rubin NVL8 cilja generativnu umjetnu inteligenciju i HPC okruženja temeljena na x86 arhitekturi. NVIDIA DGX SuperPOD služi kao referentna arhitektura za implementaciju Rubin sustava u velikim razmjerima, uz integraciju mrežne infrastrukture i softvera za upravljanje.

Rubin je već u punoj proizvodnji, a prvi sustavi temeljeni na toj platformi očekuju se kod partnera u drugoj polovici 2026. godine. Među prvim pružateljima oblaka koji će implementirati Rubin nalaze se AWS, Google Cloud, Microsoft Azure i Oracle Cloud, dok će proizvođači poput Cisca, Della, HPE-a, Lenova i Supermica isporučivati širok raspon poslužiteljskih rješenja.

Rubin platforma predstavlja treću generaciju NVIDIA-ine rack-scale arhitekture i dodatno učvršćuje poziciju kompanije kao ključnog dobavljača infrastrukture za sljedeću fazu razvoja umjetne inteligencije, u kojoj su učinkovitost, sigurnost i skalabilnost presudni za prijelaz AI-ja iz eksperimentalne faze u temeljnu tehnologiju digitalnog društva.