Big Data – Strategii esențiale de gestionare a volumelor mari de date – studiu

Big Data - Strategii esențiale de gestionare a volumelor mari de date - studiu

Companiile trebuie să se implice în dezvoltarea unor strategii de gestionare a volumelor mari de date (big data). Este concluzia unui studiu realizat de compania americană de consultanță și cercetare în IT, Gartner.

Studiul arată că deși companiile își doresc să pună accent pe big data ( seturi de date nestructurate, generate de utilizatori, de echipamente, de sisteme de facturare, etc.), nu au însă puse la punct strategii potrivite pentru volumele mari de date. Gartner, însă, atrage atenția că aceste strategii sunt extrem de importante și de valoroase pentru evoluția unei companii.

În prezent, potrivit studiului, mare parte dintre inițiativele de strategii pentru big data sunt strict legate de marketing. Gartner propune, însă, două mari tipuri de strategii: una de afaceri și una ce ține de IT.

Care ar fi diferența între o strategie de afaceri pentru big data și o strategie de tip IT?

big data

Strategia de afaceri pentru big data va fi interesată de găsirea de noi idei pe baza datelor, de a asigura că liderii companiilor sunt mai pragmatici în ceea ce privește investițiile și de găsirea unor surse de date valoroase.

De cealată parte, strategia IT  asigură că gestionarea unui volum mare de date este adecvată infrastructurii companiei, anticipează și gestionează riscuri și pune accent pe capacitatea analitică a unui lider.

Strategiile de big data, în general, presupun o serie de schimbări în orice companie, schimbări legate de surse, de infrastructură, de abilități, în condițiile în care vorbim de seturi de date greu de structurat. Acest volum de date mare, variat și care se modifică rapid, însă, oferă o viziune în profunzime asupra noilor piețe, dar și asupra noilor nevoi ale consumatorilor.

Potrivit Garter, pentru a gestiona un volum mare de date, informațiile ar putea fi include în categorii, în funcție de sursă. Firma de consultant americană a identificat cinci astfel de tipuri de informații:

1. Date operaționale

Sunt date despre consumatori, furnizori, parteneri și angajați deja accesibile pe baza unor procese de tranzacție sau din baze de date.

2. „Dark Data”

Dark date sunt informațiile adunate de-a lungul vremii în arhive, dar care nu pot fi clar structurate. În acest caz ar fi incluse mailurile, contratele, informațiile multimedia.

3. Date comerciale

Sunt date care pot veni prin intermediul agregatoarelor de date (care citesc RSS-urile) specifice,  în funcție de industrie .

4. Date publice

Datele publice aparțin instituțiilor statului (informații care vin de la Guvern, de la ministere).

5. Date din social media

Sunt datele care arată activitatea unui utilizator pe un blog, pe rețelele de socializare. Ele sunt utilie pentru a stabili trenduri, atitudini, preferințe.

Studiul efectuat de Gartner arată că liderii companiilor sunt în continuare reticenți în a stabili strategii pentru big data, dar mai ales reticenți față de ideea de a lua decizii pe baza informațiilor dificil de structurat și administrat, dar care permite, totuși, unei companii să facă schimbări în timp real.

Gartner recomandă, în acelați timp, ca atât CIO-ul, cât și CFO-ul să asigure alături de CEO-ul companiei că astfel de date nu ajung să fie ignorate. Într-adevăr, gestionarea unor date nestructurate este mai costisitoare, însă datele obținute pot servi  mai multor scopuri ale companiei. Pentru a eficientiza costurile pentru gestionarea de bog data, companiile pot apela la sisteme de management ale datelor precum NoSQL sau Hadoop.