KOLUMNA - INES BAŠIĆ

Da li su vaši podaci zaista veliki?

Da li su vaši podaci zaista veliki?
Dražen Tomić

U zadnje vrijeme često se može čitati o velikim podacima te njihovoj interpretaciji i upotrebi u svakodnevnom radu. Činjenica je da količina podataka koje organizacije prikupljaju raste i postaje sve veća. Međutim, koji podaci su zaista veliki, toliko veliki da zahtijevaju neke nove tehnike prikupljanja i obrade, tehnologije na koje nismo navikli dosad? Prije nekoliko godina, radeći u telekomunikacijskom sektoru, kolege iz razvoja i održavanja mreže sazvali se sastanak u vezi prikupljanja url logova u lokalno skladište podataka.

S obzirom na to da se tehnologija u telekomunikacijskom sektoru brzo mijenja, pojavio se novi mrežni element s velikim mogućnostima prikupljanja različitih podataka u url logovima. Nakon par uobičajenih pitanja koja se postavljaju kod pokretanja takvog projekta; u kojem formatu su logovi, koliko često se generiraju, koje podatke sadrže, koliko dugo bi trebalo držati povijesne podatke i slično došli smo do pitanja o veličini logova.

Procjena je bila 50Gb komprimiranih podataka dnevno s tendencijom rasta. Iako navikli i pripremljeni na veliku količinu podataka u telekomunikacijskom sektoru, brzom računicom napamet došla sam do zaključka da takovu količinu podataka ne možemo podržati uobičajenim ritmom godišnjeg planiranja proširenja diskovnog prostora....

Ako su vaši podaci zaista veliki ima smisla razmisliti o cloud tehnologiji. Pri tome ne morate voditi brigu o proširenju data centra te izgradnji infrastrukture za smještaj istog. Prepustite  'velikim dečkima' brigu o tome.

Tehnologija koja je vrlo efektivna u cloudu su kolumnarne baze podataka. Specifično za kolumnarne baze podataka je da su spremaju podatke u kolone za razliku od relacijskih koje spremaju podatke u retke. Kolumnarne baze podatke su namijenjene dohvatu podatka, a ne promjeni vrijednosti, ali podatak možete dohvatiti jako brzo. Nedostatak kolumnarnih baza podataka je da trenutno ne postoji alat sličan alatu za izgradnju E/R dijagrama kao kod relacijskih baza.

Također, podaci mogu biti 'raštrkani' ili kolone mogu faliti. Potrebno je uložiti i dodatna sredstva u školovanje zaposlenika za rad sa kolumnarnim bazama podataka. Kolumnarne baze podataka nisu fleksibilne kao relacijske, zbog toga je potrebni dizajnirati tablice tako da je moguće odgovoriti na specifičan upit te je stoga potrebno unaprijed znati koji će to upiti biti.

Kad ste već odlučili prikupljati 'velike podatke' te riješili sve organizacijske, tehnološke, prostorne i ostale izazove pitanje je što s njima? U ovom konkretnom slučaju, inicijativa je došla iz tehničkog sektora te je namjena bila analiza logova u svrhu poboljšanja kvalitete i kapaciteta mreže. Tu ne treba stati, osim što su vrlo korisni za tehničke analize, potrebno je napraviti analizu kako je moguće iskoristi velike podatke radi povećanja vrijednosti u poslovnom smislu.

Uzimajući u obzir sva regulatorna ograničenja, potrebno je osmisliti koje podatke je moguće dodatno obrađivati u procesu rudarenja podataka (engl.  data mining ) te tako maksimalno iskoristiti uloženo. Proces rudarenja podataka u nekoj kompaniji, sastoji se od prikupljanja, obrade i analize svih mogućih dozvoljenih podataka o kupcima. Najčešće se rade prediktivni te deskriptivni modeli kupaca.

Deskriptivni modeli su razne segmentacije kupaca prema navikama korištenja usluga dok prediktivni modeli pokušavaju 'pogoditi' koji od kupca su kandidati za napuštanje vaše kompanije, koji od kupaca imaju sklonost kupovini određene vrste proizvoda, koji je kreditni score vašeg kupca i slično.

Kad ste već napravili segmentaciju kupca, prediktivne te ostale modele potrebno je sistematizirati vašu ponudu na tržištu odnosno napraviti matricu (engl.  cross sell / up sell) vaših proizvoda i usluga koje ćete ponuditi kupcu bilo u kontaktu iniciranom s vaše strane bilo u kontaktu iniciranom od strane kupca. Matrica sadrži proizvode i usluge koje želite dodatno ili skuplje prodati.

Opisana metodologija je primjenjiva za sve industrije te ako ju dobro i sistematično radite trebali bi osjetiti značajan  ROI porast.

 

*O autorici: Ines Bašić bavi se poslovnom inteligencijom te analitičkim CRM-om. Posjeduje dugogodišnje iskustvo iz telekomunikacijske i financijske industrije. Možete ju pronaći na LinkedIn-u.