Znanstvenici s IRB-a razvili novu metodu grupiranja podataka

Znanstvenici s IRB-a razvili novu metodu grupiranja podataka

Foto: Fotolia

Znanstvenici Laboratorija za reprezentacije znanja i strojno učenje Zavoda za elektroniku Instituta Ruđer Bošković, Maria Brbić i Ivica Kopriva, razvili su novu metodu za grupiranje podataka temeljenih na modelu linearnih potprostora kao generatora odgovarajućih funkcionalnih skupina.

Da je riječ o značajnim rezultatima potvrđuje i objava rada u jednom od najutjecajnijih znanstvenih časopisa u području računalnih znanosti i umjetne inteligencije 'IEEE Transactions on Cybernetics' koji se s obzirom na visoki faktor odjeka svrstava na treće mjesto u tom području. Jedan od temeljnih problema u računalnim znanostima unutar područja poznatog kao nenadzirano učenje jest grupiranje podataka. Naime, za razliku od nadziranog strojnog učenja, gdje su podaci dani u obliku ulazne i ciljne vrijednosti, a stroj uči funkciju koja ulaznim podacima pridružuje klasnu ili realnu vrijednost ciljanih podataka, u procesu nenadziranog strojnog učenja od algoritama se očekuje da podatke grupiraju u funkcionalne skupine koristeći isključivo informacije naučene iz samih podataka. ''Primjene koje smo ilustrirali u novom radu odnose se na prepoznavanje lica odnosno grupiranje slika lica u skupine koje odgovaraju osobama, zatim prepoznavanje govornika, odnosno grupiranje značajki govora u skupine koje odgovaraju osobama, te prepoznavanje rukom pisanih brojeva, odnosno grupiranje slika u skupine koje odgovaraju znamenkama od 0 do 9'', pojašnjava Ivica Kopriva. Razvijene metode grupiranja podataka kod navedenih primjera temelje se na modelu prema kojem su podaci unutar svake skupine generirani iz pripadajućeg linearnog potprostora. Temeljem tog modela razvijeni su algoritmi koji daju vrlo kompetitivne rezultate na grupiranju zahtjevnih skupova podataka.

''Ključan element u ovom pristupu je učenje matrice reprezentacije koja je rijetka i ima nizak rang. Umjesto konveksnih mjera ranga i rijetkosti koje se standardno koriste, u radu su predložene mjere koje bolje procjenjuju rang i rijetkost: (i) egzaktne mjere temeljene na L0 i Schatten-0 kvazi normama, te (ii) glatka surogat funkcija L0 i Schatten-0 kvazi normi. 'Novi algoritmi su značajno poboljšali točnost u usporedbi s postojećim metodama na svim testiranim primjenama'', rekla je Marija Brbić. Razvijena metoda je rezultat istraživanja doktorandice Brbić u okviru istraživačkog projekta Hrvatske zaklade za znanost.

Još iz kategorije

WMF dovodi 150 predavača i bit će prvi bez jednokratne plastike

WMF dovodi 150 predavača i bit će prvi bez jednokratne plastike

14.09.2019. komentiraj

Na 12. izdanju najvećeg komunikacijskog festivala u regiji koji se održava od 19. do 22.9. u Rovinju, po prvi puta će se koristiti posebno dizajnirane perive čaše kako bi se smanjilo korištenje i bacanje jednokratne plastike. Na čašama će uz logo festivala biti otisnuta i prigodna poruka kako korištenjem ove čaše čuvamo planetu. Nakon korištenja, posjetitelji će čašu moći ponijeti kući kao dodatni suvenir s najboljeg Weekenda u godini.

Riješene nesuglasice u OSC-u

Riješene nesuglasice u OSC-u

13.09.2019. komentiraj

Ovog smo tjedna izvijestili o događajima unutar udruge Osijek Software City uoči i nakon konferencije KulenDayz. Cijela je priča dobila zadovoljavajući završetak, odnosno nisu se dogodili veći potresi, a nadamo se da problema neće biti ni u budućnosti.

50 američkih saveznih država i teritorija otvara istragu protiv Googlea

50 američkih saveznih država i teritorija otvara istragu protiv Googlea

13.09.2019. komentiraj

Google se nalazi u ozbiljnim problemima jer grupa 50 saveznih američkih država i teritorija pokrenula je istragu protiv njega zbog (pre)dominantne pozicije na tržištu internetskog oglašavanja. Ukratko, kao i u Europskoj uniji, tako se u Sjedinjenim Američkim Državama, Google ima problema s monopolizmom.