Ce este Big Data? Introducere, Tipuri, Caracteristici, Exemple

รŽnainte de a trece la introducerea Big Data, mai รฎntรขi trebuie sฤƒ ศ™tiศ›i

Ce sunt datele?

Cantitฤƒศ›ile, caracterele sau simbolurile pe care sunt efectuate operaศ›iunile de cฤƒtre un computer, care pot fi stocate ศ™i transmise sub formฤƒ de semnale electrice ศ™i รฎnregistrate pe suporturi de รฎnregistrare magnetice, optice sau mecanice.

Acum, sฤƒ รฎnvฤƒศ›ฤƒm definiศ›ia Big Data

Ce este Big Data?

Datele mari este o colecศ›ie de date cu volum uriaศ™, dar care creศ™te exponenศ›ial รฎn timp. Sunt date cu dimensiuni ศ™i complexitate atรขt de mari รฎncรขt niciunul dintre instrumentele tradiศ›ionale de gestionare a datelor nu le poate stoca sau procesa eficient. Big data este, de asemenea, o datฤƒ, dar cu dimensiuni uriaศ™e.

Datele mari
Ce este Big Data?

Ce este un exemplu de Big Data?

Iatฤƒ cรขteva dintre exemplele de Big Data -

New York Stock Exchange este un exemplu de Big Data care genereazฤƒ aproximativ un terabyte de noi date comerciale pe zi.

Exemplu de Big Data

Social Media

Statistica aratฤƒ cฤƒ 500+teraocteศ›i de date noi sunt ingerate รฎn bazele de date ale site-ului de social media Facebook, รฎn fiecare zi. Aceste date sunt generate รฎn principal รฎn ceea ce priveศ™te รฎncฤƒrcฤƒrile de fotografii ศ™i videoclipuri, schimburile de mesaje, punerea de comentarii etc.

Exemplu de Big Data

Un singur Motor turboreactor poate genera 10+teraocteศ›i de date รฎn 30 minute a timpului de zbor. Cu multe mii de zboruri pe zi, generarea de date ajunge la mulศ›i Petabytes.

Exemplu de Big Data

Tipuri de date mari

Urmฤƒtoarele sunt tipurile de Big Data:

  1. structurat
  2. Nestructurat
  3. Semi-structurat

structurat

Orice date care pot fi stocate, accesate ศ™i procesate sub formฤƒ de format fix sunt denumite date โ€žstructurateโ€. De-a lungul timpului, talentul รฎn informaticฤƒ a obศ›inut un succes mai mare รฎn dezvoltarea tehnicilor de lucru cu astfel de date (unde formatul este bine cunoscut รฎn prealabil) ศ™i, de asemenea, รฎn obศ›inerea valorii din acestea. Cu toate acestea, รฎn zilele noastre, anticipฤƒm probleme atunci cรขnd o dimensiune a unor astfel de date creศ™te รฎntr-o mฤƒsurฤƒ uriaศ™ฤƒ, dimensiunile tipice sunt รฎn furia mai multor zettabytes.

Tu stii? 1021 bytes egal cu 1 zettabyte or un miliard de terabyศ›i formulare un zettabyte.

Privind aceste cifre, se poate รฎnศ›elege cu uศ™urinศ›ฤƒ de ce este dat numele Big Data ศ™i se poate imagina provocฤƒrile pe care le implicฤƒ stocarea ศ™i procesarea acestuia.

Tu stii? Datele stocate รฎntr-un sistem de management al bazelor de date relaศ›ionale sunt un exemplu de a โ€žstructuratโ€ de date.

Exemple de date structurate

Un tabel โ€žAngajatโ€ dintr-o bazฤƒ de date este un exemplu de date structurate

Card de identitate al angajatului Numele angajatului Gen Departament Salary_In_lacs
2365 Rajesh Kulkarni Masculin finanศ›e 650000
3398 Pratibha Joshi Femeie admin 650000
7465 Shushil Roy Masculin admin 500000
7500 Shubhojit Das Masculin finanศ›e 500000
7699 Priya Sane Femeie finanศ›e 550000

Nestructurat

Orice date cu formฤƒ sau structurฤƒ necunoscutฤƒ sunt clasificate ca date nestructurate. Pe lรขngฤƒ dimensiunea uriaศ™ฤƒ, datele nestructurate ridicฤƒ provocฤƒri multiple รฎn ceea ce priveศ™te procesarea lor pentru a obศ›ine valoare din ele. Un exemplu tipic de date nestructurate este o sursฤƒ de date eterogene care conศ›ine o combinaศ›ie de fiศ™iere text simple, imagini, videoclipuri etc. รŽn prezent, organizaศ›iile au o mulศ›ime de date disponibile cu ele, dar, din pฤƒcate, nu ศ™tiu cum sฤƒ obศ›inฤƒ valoare din acestea, deoarece aceste date sunt รฎn formฤƒ brutฤƒ sau รฎn format nestructurat.

Exemple de date nestructurate

Rezultatul returnat de โ€žCฤƒutare Googleโ€

Exemplu de date nestructurate
Exemplu de date nestructurate

Semi-structurat

Datele semi-structurate pot conศ›ine ambele forme de date. Putem vedea datele semi-structurate ca o formฤƒ structuratฤƒ, dar de fapt nu sunt definite cu, de exemplu, o definiศ›ie de tabel รฎn relaศ›ie Baze de date. Un exemplu de date semi-structurate este o datฤƒ reprezentatฤƒ รฎntr-un fiศ™ier XML.

Exemple de date semi-structurate

Date personale stocate รฎntr-un fiศ™ier XML -

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Creศ™terea datelor de-a lungul anilor

Creศ™terea datelor de-a lungul anilor
Creศ™terea datelor de-a lungul anilor

Vฤƒ rugฤƒm sฤƒ reลฃineลฃi cฤƒ aplicatie web datele, care sunt nestructurate, constau din fiศ™iere jurnal, fiศ™iere istorice tranzacศ›ii etc. Sistemele OLTP sunt construite pentru a funcศ›iona cu date structurate รฎn care datele sunt stocate รฎn relaศ›ii (tabele).

Caracteristicile Big Data

Big Data poate fi descris prin urmฤƒtoarele caracteristici:

  • Volum
  • Varietate
  • Vitezฤƒ
  • Variabilitate

(i) Volumul - Numele Big Data รฎn sine este legat de o dimensiune care este enormฤƒ. Dimensiunea datelor joacฤƒ un rol foarte important รฎn determinarea valorii datelor. De asemenea, dacฤƒ o anumitฤƒ date poate fi de fapt consideratฤƒ ca date mari sau nu, depinde de volumul de date. Prin urmare, 'Volum' este o caracteristicฤƒ care trebuie luatฤƒ รฎn considerare atunci cรขnd se ocupฤƒ de soluศ›ii Big Data.

(ii) Varietate - Urmฤƒtorul aspect al Big Data este acesta varietate.

Varietatea se referฤƒ la surse eterogene ศ™i la natura datelor, atรขt structurate, cรขt ศ™i nestructurate. รŽn zilele anterioare, foile de calcul ศ™i bazele de date erau singurele surse de date luate รฎn considerare de majoritatea aplicaศ›iilor. รŽn prezent, รฎn aplicaศ›iile de analizฤƒ sunt luate รฎn considerare ศ™i date sub formฤƒ de e-mailuri, fotografii, videoclipuri, dispozitive de monitorizare, PDF-uri, audio etc. Aceastฤƒ varietate de date nestructurate pune anumite probleme pentru stocarea, extragerea ศ™i analiza datelor.

(iii) Viteza โ€“ Termenul 'vitezฤƒ' se referฤƒ la viteza de generare a datelor. Cรขt de repede sunt generate ศ™i procesate datele pentru a satisface cerinศ›ele, determinฤƒ potenศ›ialul real al datelor.

Big Data Velocity se ocupฤƒ de viteza cu care fluxul de date din surse cum ar fi procesele de afaceri, jurnalele de aplicaศ›ii, reศ›elele ศ™i site-urile de social media, senzori, Mobil dispozitive etc. Fluxul de date este masiv ศ™i continuu.

(iv) Variabilitatea โ€“ Aceasta se referฤƒ la inconsecvenศ›a care poate fi arฤƒtatฤƒ de date uneori, รฎmpiedicรขnd astfel procesul de a putea gestiona ศ™i gestiona datele รฎn mod eficient.

Avantajele procesฤƒrii Big Data

Capacitatea de a procesa Big Data รฎn DBMS aduce multiple beneficii, cum ar fi-

  • Companiile pot utiliza informaศ›ii externe รฎn timp ce iau decizii

Acces la datele sociale de la motoarele de cฤƒutare ศ™i site-uri precum Facebook, Twitter permit organizaศ›iilor sฤƒ รฎศ™i ajusteze strategiile de afaceri.

  • Serviciu clienศ›i รฎmbunฤƒtฤƒศ›it

Sistemele tradiศ›ionale de feedback ale clienศ›ilor sunt รฎnlocuite cu sisteme noi proiectate cu tehnologii Big Data. รŽn aceste noi sisteme, Big Data ศ™i tehnologiile de procesare a limbajului natural sunt folosite pentru a citi ศ™i evalua rฤƒspunsurile consumatorilor.

  • Identificarea timpurie a riscului pentru produs/servicii, dacฤƒ este cazul
  • Eficienศ›ฤƒ operaศ›ionalฤƒ mai bunฤƒ

Tehnologiile Big Data pot fi folosite pentru a crea o zonฤƒ de aศ™teptare sau o zonฤƒ de aterizare pentru date noi รฎnainte de a identifica ce date ar trebui mutate รฎn depozit de date. รŽn plus, o astfel de integrare a tehnologiilor Big Data ศ™i a depozitului de date ajutฤƒ o organizaศ›ie sฤƒ descarce datele accesate rar.

Rezumat

  • Definiศ›ie Big Data: Big Data, adicฤƒ date de dimensiuni uriaศ™e. Bigdata este un termen folosit pentru a descrie o colecศ›ie de date care este uriaศ™ฤƒ ca dimensiune ศ™i totuศ™i creศ™te exponenศ›ial รฎn timp.
  • Exemplele de analizฤƒ Big Data includ burse de valori, site-uri de social media, motoare cu reacศ›ie etc.
  • Big Data ar putea fi 1) structurate, 2) nestructurate, 3) semi-structurate
  • Volumul, Varietatea, Viteza ศ™i Variabilitatea sunt cรขteva caracteristici Big Data
  • Servicii รฎmbunฤƒtฤƒศ›ite pentru clienศ›i, eficienศ›ฤƒ operaศ›ionalฤƒ mai bunฤƒ, Luare mai bunฤƒ a deciziilor sunt cรขteva avantaje ale Bigdata

Rezumaศ›i aceastฤƒ postare cu: