Ce este Big Data? Introducere, Tipuri, Caracteristici, Exemple
Ce sunt datele?
Cantitฤศile, caracterele sau simbolurile pe care sunt efectuate operaศiunile de cฤtre un computer, care pot fi stocate ศi transmise sub formฤ de semnale electrice ศi รฎnregistrate pe suporturi de รฎnregistrare magnetice, optice sau mecanice.
Acum, sฤ รฎnvฤศฤm definiศia Big Data
Ce este Big Data?
Datele mari este o colecศie de date cu volum uriaศ, dar care creศte exponenศial รฎn timp. Sunt date cu dimensiuni ศi complexitate atรขt de mari รฎncรขt niciunul dintre instrumentele tradiศionale de gestionare a datelor nu le poate stoca sau procesa eficient. Big data este, de asemenea, o datฤ, dar cu dimensiuni uriaศe.

Ce este un exemplu de Big Data?
Iatฤ cรขteva dintre exemplele de Big Data -
New York Stock Exchange este un exemplu de Big Data care genereazฤ aproximativ un terabyte de noi date comerciale pe zi.
Social Media
Statistica aratฤ cฤ 500+teraocteศi de date noi sunt ingerate รฎn bazele de date ale site-ului de social media Facebook, รฎn fiecare zi. Aceste date sunt generate รฎn principal รฎn ceea ce priveศte รฎncฤrcฤrile de fotografii ศi videoclipuri, schimburile de mesaje, punerea de comentarii etc.
Un singur Motor turboreactor poate genera 10+teraocteศi de date รฎn 30 minute a timpului de zbor. Cu multe mii de zboruri pe zi, generarea de date ajunge la mulศi Petabytes.
Tipuri de date mari
Urmฤtoarele sunt tipurile de Big Data:
- structurat
- Nestructurat
- Semi-structurat
structurat
Orice date care pot fi stocate, accesate ศi procesate sub formฤ de format fix sunt denumite date โstructurateโ. De-a lungul timpului, talentul รฎn informaticฤ a obศinut un succes mai mare รฎn dezvoltarea tehnicilor de lucru cu astfel de date (unde formatul este bine cunoscut รฎn prealabil) ศi, de asemenea, รฎn obศinerea valorii din acestea. Cu toate acestea, รฎn zilele noastre, anticipฤm probleme atunci cรขnd o dimensiune a unor astfel de date creศte รฎntr-o mฤsurฤ uriaศฤ, dimensiunile tipice sunt รฎn furia mai multor zettabytes.
Tu stii? 1021 bytes egal cu 1 zettabyte or un miliard de terabyศi formulare un zettabyte.
Privind aceste cifre, se poate รฎnศelege cu uศurinศฤ de ce este dat numele Big Data ศi se poate imagina provocฤrile pe care le implicฤ stocarea ศi procesarea acestuia.
Tu stii? Datele stocate รฎntr-un sistem de management al bazelor de date relaศionale sunt un exemplu de a โstructuratโ de date.
Exemple de date structurate
Un tabel โAngajatโ dintr-o bazฤ de date este un exemplu de date structurate
| Card de identitate al angajatului | Numele angajatului | Gen | Departament | Salary_In_lacs |
|---|---|---|---|---|
| 2365 | Rajesh Kulkarni | Masculin | finanศe | 650000 |
| 3398 | Pratibha Joshi | Femeie | admin | 650000 |
| 7465 | Shushil Roy | Masculin | admin | 500000 |
| 7500 | Shubhojit Das | Masculin | finanศe | 500000 |
| 7699 | Priya Sane | Femeie | finanศe | 550000 |
Nestructurat
Orice date cu formฤ sau structurฤ necunoscutฤ sunt clasificate ca date nestructurate. Pe lรขngฤ dimensiunea uriaศฤ, datele nestructurate ridicฤ provocฤri multiple รฎn ceea ce priveศte procesarea lor pentru a obศine valoare din ele. Un exemplu tipic de date nestructurate este o sursฤ de date eterogene care conศine o combinaศie de fiศiere text simple, imagini, videoclipuri etc. รn prezent, organizaศiile au o mulศime de date disponibile cu ele, dar, din pฤcate, nu ศtiu cum sฤ obศinฤ valoare din acestea, deoarece aceste date sunt รฎn formฤ brutฤ sau รฎn format nestructurat.
Exemple de date nestructurate
Rezultatul returnat de โCฤutare Googleโ

Semi-structurat
Datele semi-structurate pot conศine ambele forme de date. Putem vedea datele semi-structurate ca o formฤ structuratฤ, dar de fapt nu sunt definite cu, de exemplu, o definiศie de tabel รฎn relaศie Baze de date. Un exemplu de date semi-structurate este o datฤ reprezentatฤ รฎntr-un fiศier XML.
Exemple de date semi-structurate
Date personale stocate รฎntr-un fiศier XML -
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Creศterea datelor de-a lungul anilor

Vฤ rugฤm sฤ reลฃineลฃi cฤ aplicatie web datele, care sunt nestructurate, constau din fiศiere jurnal, fiศiere istorice tranzacศii etc. Sistemele OLTP sunt construite pentru a funcศiona cu date structurate รฎn care datele sunt stocate รฎn relaศii (tabele).
Caracteristicile Big Data
Big Data poate fi descris prin urmฤtoarele caracteristici:
- Volum
- Varietate
- Vitezฤ
- Variabilitate
(i) Volumul - Numele Big Data รฎn sine este legat de o dimensiune care este enormฤ. Dimensiunea datelor joacฤ un rol foarte important รฎn determinarea valorii datelor. De asemenea, dacฤ o anumitฤ date poate fi de fapt consideratฤ ca date mari sau nu, depinde de volumul de date. Prin urmare, 'Volum' este o caracteristicฤ care trebuie luatฤ รฎn considerare atunci cรขnd se ocupฤ de soluศii Big Data.
(ii) Varietate - Urmฤtorul aspect al Big Data este acesta varietate.
Varietatea se referฤ la surse eterogene ศi la natura datelor, atรขt structurate, cรขt ศi nestructurate. รn zilele anterioare, foile de calcul ศi bazele de date erau singurele surse de date luate รฎn considerare de majoritatea aplicaศiilor. รn prezent, รฎn aplicaศiile de analizฤ sunt luate รฎn considerare ศi date sub formฤ de e-mailuri, fotografii, videoclipuri, dispozitive de monitorizare, PDF-uri, audio etc. Aceastฤ varietate de date nestructurate pune anumite probleme pentru stocarea, extragerea ศi analiza datelor.
(iii) Viteza โ Termenul 'vitezฤ' se referฤ la viteza de generare a datelor. Cรขt de repede sunt generate ศi procesate datele pentru a satisface cerinศele, determinฤ potenศialul real al datelor.
Big Data Velocity se ocupฤ de viteza cu care fluxul de date din surse cum ar fi procesele de afaceri, jurnalele de aplicaศii, reศelele ศi site-urile de social media, senzori, Mobil dispozitive etc. Fluxul de date este masiv ศi continuu.
(iv) Variabilitatea โ Aceasta se referฤ la inconsecvenศa care poate fi arฤtatฤ de date uneori, รฎmpiedicรขnd astfel procesul de a putea gestiona ศi gestiona datele รฎn mod eficient.
Avantajele procesฤrii Big Data
Capacitatea de a procesa Big Data รฎn DBMS aduce multiple beneficii, cum ar fi-
- Companiile pot utiliza informaศii externe รฎn timp ce iau decizii
Acces la datele sociale de la motoarele de cฤutare ศi site-uri precum Facebook, Twitter permit organizaศiilor sฤ รฎศi ajusteze strategiile de afaceri.
- Serviciu clienศi รฎmbunฤtฤศit
Sistemele tradiศionale de feedback ale clienศilor sunt รฎnlocuite cu sisteme noi proiectate cu tehnologii Big Data. รn aceste noi sisteme, Big Data ศi tehnologiile de procesare a limbajului natural sunt folosite pentru a citi ศi evalua rฤspunsurile consumatorilor.
- Identificarea timpurie a riscului pentru produs/servicii, dacฤ este cazul
- Eficienศฤ operaศionalฤ mai bunฤ
Tehnologiile Big Data pot fi folosite pentru a crea o zonฤ de aศteptare sau o zonฤ de aterizare pentru date noi รฎnainte de a identifica ce date ar trebui mutate รฎn depozit de date. รn plus, o astfel de integrare a tehnologiilor Big Data ศi a depozitului de date ajutฤ o organizaศie sฤ descarce datele accesate rar.
Rezumat
- Definiศie Big Data: Big Data, adicฤ date de dimensiuni uriaศe. Bigdata este un termen folosit pentru a descrie o colecศie de date care este uriaศฤ ca dimensiune ศi totuศi creศte exponenศial รฎn timp.
- Exemplele de analizฤ Big Data includ burse de valori, site-uri de social media, motoare cu reacศie etc.
- Big Data ar putea fi 1) structurate, 2) nestructurate, 3) semi-structurate
- Volumul, Varietatea, Viteza ศi Variabilitatea sunt cรขteva caracteristici Big Data
- Servicii รฎmbunฤtฤศite pentru clienศi, eficienศฤ operaศionalฤ mai bunฤ, Luare mai bunฤ a deciziilor sunt cรขteva avantaje ale Bigdata



