Z masivnimi podatki do boljših praks
Čas branja 9 minTisti, ki zvesto sledijo najnovejšim in največjim HR-trendom, so se že spoznali s konceptom masivnih podatkov, kakor v slovenščini poimenujemo »big data«. Uporaba masivnih podatkov v kadrovski službi koristi predvsem pri izboljševanju odločitev, vezanih na zaposlene in organizacijo, saj slonijo na izjemnih količinah podatkov. Tako se odločitve zdijo bolj premišljene in koristne ter predstavljajo odmik od intuitivnega kadrovanja.

V dandanašnjem svetu skorajda z vsakim dejanjem, tako v fizičnem svetu kakor na spletu, puščamo digitalne sledi, ki raziskovalcem lahko veliko povedo o vedenju in lastnostih posameznika, ki jih je pustil. Lahko bi rekli, da sta danes komunikacija in vedenje posameznikov v veliki meri digitalizirana1. Ideja masivnih podatkov je zbiranje teh digitalnih sledi, ki jih je nato moč analizirati2. Ključnega pomena za to prakso pa so razvoji v tehnologiji.
Ali res veste, kaj je »big data«?
Masivne podatke je pravzaprav težko povsem natančno opredeliti, saj lahko vsaka organizacija zbira in uporablja zelo raznolike podatke, pa jih (zase) šteje kot »masivne«. Kljub temu pa masivni podatki nosijo štiri skupne lastnosti 1. Prvi kriterij je volumen oziroma obširnost podatkov. Da lahko podatkovno bazo štejemo za »masivno«, mora vsebovati terabite in terabite podatkov. Primer podjetja, ki zagotovo operira z neverjetno količino podatkov, je ameriška veriga Wal-Mart s kar 2,2 milijona zaposlenih. Tudi če njihova baza drži le najbolj osnovne informacije o zaposlenih, je izjemno velika. Hitrost podatkov je drugi kriterij. Če smo bili včasih vajeni, da se podatki o zaposlenih pridobivajo v določenih časovnih intervalih in samo nekajkrat letno (npr. ob vstopu na delovno mesto, ob zamenjavi delovnega mesta, ob ocenjevanju uspešnosti itd.), je ta premik pri masivnih podatkih – masiven. Od masivnih podatkov se pričakuje, da v bazo pritekajo skorajda neprestano, dnevno ali celo sekundno. Raznolikost kot naslednji kriterij se kaže v raznolikosti oblik in virov podatkov, kar zopet izvira iz tehnoloških napredkov. Tu se ustaljenim vrstam podatkov o zaposlenih, kot so demografski podatki, ocene uspešnosti, vedenjski podatki, zamujanja in odsotnosti in vprašalniki, pridružijo bolj nestrukturirani podatki, kot so CV-ji, profili na družbenih omrežjih ter objave in komentarji na različnih forumih ali blogih3. Zadnji kriterij pa govori o verodostojnosti podatkov. Predvsem kadar podatke zbiramo neprestano s pomočjo senzorjev ali pametnih telefonov, bomo poleg tistih relevantnih informacij, ki jih iščemo, nabrali tudi veliko »šuma« oziroma nepomembnih ali nepopolnih podatkov, ki lahko izkrivijo pravo sliko in otežijo izločevanje pomembnih ugotovitev. Vse podatke moramo redno preverjati, čistiti in v iskanju odgovora na problem resnično uporabiti zgolj tiste relevantne podatke, ki se na dani problem nanašajo.
V podjetju IBM so se med zaposlenimi širile pritožbe, saj jim podjetje ni krilo določenih potnih stroškov, kadar so le-te opravljali preko storitve Uber. Njihova kadrovska služba je preko analize internih komunikacijskih sistemov te pritožbe odkrila, preden se je to lahko razvilo v težavo.
