TOP 10 najkorištenijih Big Data frameworka

TOP 10 najkorištenijih Big Data frameworka
Fotolia

Veliki podaci, ili na engleskom poznatiji kao Big Data, nastavljaju svoj izniman rast u svim industrijama i to ne čudi jer manje i veće kompanije oslanjaju se upravo na to što prikupe. Zatim ili prosljeđuju podatke ili ih jednostavno koriste za svoje potrebe, s ciljem da ono što nude bude bolje izvedeno, bolje plasirano i općenito bolje prihvaćeno.

Jasno, kako i samo ime kaže, riječ je o velikoj, iznimno velikoj, količini prikupljenih podataka i za njihovo filtriranje potrebna je ne samo stručnost nego i kompletan znanstveni pristup jer u suprotnom svi ti veliki podaci mogu postati loši podaci. U jednoj rečenici, Big Data je tehnologija koja omogućava prikupljanje i obradu velikih količina strukturiranih i nestrukturiranih podataka u realnom vremenu.

Kako bi Big Data bili prikupljeni na adekvatan način, odnosno, kako bi bili filtrirani i odvojeni u željene "ladice", potreban je framework. I to ne obični nego namijenjen za baratanje velikim podacima. A prema istraživanju provedenom od strane Quoblea i Dimensional Researcha, tržištem ne dominira osjetnije nijedan framework. Ali, naravno, postoje oni koji odskaču.

Među deset stoga situacija izgleda ovako:

1. Spark (31 posto)

2. Hive (17 posto)

3. HBase (17 posto)

4. MapReduce (15 posto)

5. Presto (13 posto)

6. Kafka (13 posto)

7. Impala (11 posto)

8. Storm (11 posto)

9. Flink (9 posto)

10. Pig (6 posto)

Problem u cijeloj priči jest što nedostaje stručnjaka za Big Data framework i s tim se suočava čak 75 posto kompanija koje su bile u istraživanju Quoblea i Dimensional Researcha. To je iznimno teška situacija jer 79 posto ispitanih želi povećati Big Data timove, no nemaju ljude kojima bi ih povećali, tržište je još uvijek siromašno Big Data stručnjacima...

Ali, sigurno neće tako ostati duže vrijeme, potražnja će učiniti svoje i motivirati IT stručnjake da se educiraju o ovom trendu.