Ce este Big Data? Introducere, Tipuri, Caracteristici, Exemple

Înainte de a trece la introducerea Big Data, mai întâi trebuie să știți

Ce sunt datele?

Cantitățile, caracterele sau simbolurile pe care sunt efectuate operațiunile de către un computer, care pot fi stocate și transmise sub formă de semnale electrice și înregistrate pe suporturi de înregistrare magnetice, optice sau mecanice.

Acum, să învățăm definiția Big Data

Ce este Big Data?

Datele mari este o colecție de date cu volum uriaș, dar care crește exponențial în timp. Sunt date cu dimensiuni și complexitate atât de mari încât niciunul dintre instrumentele tradiționale de gestionare a datelor nu le poate stoca sau procesa eficient. Big data este, de asemenea, o dată, dar cu dimensiuni uriașe.

Datele mari
Ce este Big Data?

Ce este un exemplu de Big Data?

Iată câteva dintre exemplele de Big Data -

New York Stock Exchange este un exemplu de Big Data care generează aproximativ un terabyte de noi date comerciale pe zi.

Exemplu de Big Data

Social Media

Statistica arată că 500+teraocteți de date noi sunt ingerate în bazele de date ale site-ului de social media Facebook, în fiecare zi. Aceste date sunt generate în principal în ceea ce privește încărcările de fotografii și videoclipuri, schimburile de mesaje, punerea de comentarii etc.

Exemplu de Big Data

Un singur Motor turboreactor poate genera 10+teraocteți de date în 30 minute a timpului de zbor. Cu multe mii de zboruri pe zi, generarea de date ajunge la mulți Petabytes.

Exemplu de Big Data

Tipuri de date mari

Următoarele sunt tipurile de Big Data:

  1. structurat
  2. Nestructurat
  3. Semi-structurat

structurat

Orice date care pot fi stocate, accesate și procesate sub formă de format fix sunt denumite date „structurate”. De-a lungul timpului, talentul în informatică a obținut un succes mai mare în dezvoltarea tehnicilor de lucru cu astfel de date (unde formatul este bine cunoscut în prealabil) și, de asemenea, în obținerea valorii din acestea. Cu toate acestea, în zilele noastre, anticipăm probleme atunci când o dimensiune a unor astfel de date crește într-o măsură uriașă, dimensiunile tipice sunt în furia mai multor zettabytes.

Tu stii? 1021 bytes egal cu 1 zettabyte or un miliard de terabyți formulare un zettabyte.

Privind aceste cifre, se poate înțelege cu ușurință de ce este dat numele Big Data și se poate imagina provocările pe care le implică stocarea și procesarea acestuia.

Tu stii? Datele stocate într-un sistem de management al bazelor de date relaționale sunt un exemplu de a „structurat” de date.

Exemple de date structurate

Un tabel „Angajat” dintr-o bază de date este un exemplu de date structurate

Card de identitate al angajatului Numele angajatului Gen Departament Salary_In_lacs
2365 Rajesh Kulkarni Masculin finanțe 650000
3398 Pratibha Joshi Femeie admin 650000
7465 Shushil Roy Masculin admin 500000
7500 Shubhojit Das Masculin finanțe 500000
7699 Priya Sane Femeie finanțe 550000

Nestructurat

Orice date cu formă sau structură necunoscută sunt clasificate ca date nestructurate. Pe lângă dimensiunea uriașă, datele nestructurate ridică provocări multiple în ceea ce privește procesarea lor pentru a obține valoare din ele. Un exemplu tipic de date nestructurate este o sursă de date eterogene care conține o combinație de fișiere text simple, imagini, videoclipuri etc. În prezent, organizațiile au o mulțime de date disponibile cu ele, dar, din păcate, nu știu cum să obțină valoare din acestea, deoarece aceste date sunt în formă brută sau în format nestructurat.

Exemple de date nestructurate

Rezultatul returnat de „Căutare Google”

Exemplu de date nestructurate
Exemplu de date nestructurate

Semi-structurat

Datele semi-structurate pot conține ambele forme de date. Putem vedea datele semi-structurate ca o formă structurată, dar de fapt nu sunt definite cu, de exemplu, o definiție de tabel în relație Baze de date. Un exemplu de date semi-structurate este o dată reprezentată într-un fișier XML.

Exemple de date semi-structurate

Date personale stocate într-un fișier XML -

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Creșterea datelor de-a lungul anilor

Creșterea datelor de-a lungul anilor
Creșterea datelor de-a lungul anilor

Vă rugăm să reţineţi că aplicatie web datele, care sunt nestructurate, constau din fișiere jurnal, fișiere istorice tranzacții etc. Sistemele OLTP sunt construite pentru a funcționa cu date structurate în care datele sunt stocate în relații (tabele).

Caracteristicile Big Data

Big Data poate fi descris prin următoarele caracteristici:

  • Volum
  • Varietate
  • Viteză
  • Variabilitate

(i) Volumul - Numele Big Data în sine este legat de o dimensiune care este enormă. Dimensiunea datelor joacă un rol foarte important în determinarea valorii datelor. De asemenea, dacă o anumită date poate fi de fapt considerată ca date mari sau nu, depinde de volumul de date. Prin urmare, 'Volum' este o caracteristică care trebuie luată în considerare atunci când se ocupă de soluții Big Data.

(ii) Varietate - Următorul aspect al Big Data este acesta varietate.

Varietatea se referă la surse eterogene și la natura datelor, atât structurate, cât și nestructurate. În zilele anterioare, foile de calcul și bazele de date erau singurele surse de date luate în considerare de majoritatea aplicațiilor. În prezent, în aplicațiile de analiză sunt luate în considerare și date sub formă de e-mailuri, fotografii, videoclipuri, dispozitive de monitorizare, PDF-uri, audio etc. Această varietate de date nestructurate pune anumite probleme pentru stocarea, extragerea și analiza datelor.

(iii) Viteza – Termenul 'viteză' se referă la viteza de generare a datelor. Cât de repede sunt generate și procesate datele pentru a satisface cerințele, determină potențialul real al datelor.

Big Data Velocity se ocupă de viteza cu care fluxul de date din surse cum ar fi procesele de afaceri, jurnalele de aplicații, rețelele și site-urile de social media, senzori, Mobil dispozitive etc. Fluxul de date este masiv și continuu.

(iv) Variabilitatea – Aceasta se referă la inconsecvența care poate fi arătată de date uneori, împiedicând astfel procesul de a putea gestiona și gestiona datele în mod eficient.

Avantajele procesării Big Data

Capacitatea de a procesa Big Data în DBMS aduce multiple beneficii, cum ar fi-

  • Companiile pot utiliza informații externe în timp ce iau decizii

Acces la datele sociale de la motoarele de căutare și site-uri precum Facebook, Twitter permit organizațiilor să își ajusteze strategiile de afaceri.

  • Serviciu clienți îmbunătățit

Sistemele tradiționale de feedback ale clienților sunt înlocuite cu sisteme noi proiectate cu tehnologii Big Data. În aceste noi sisteme, Big Data și tehnologiile de procesare a limbajului natural sunt folosite pentru a citi și evalua răspunsurile consumatorilor.

  • Identificarea timpurie a riscului pentru produs/servicii, dacă este cazul
  • Eficiență operațională mai bună

Tehnologiile Big Data pot fi folosite pentru a crea o zonă de așteptare sau o zonă de aterizare pentru date noi înainte de a identifica ce date ar trebui mutate în depozit de date. În plus, o astfel de integrare a tehnologiilor Big Data și a depozitului de date ajută o organizație să descarce datele accesate rar.

Rezumat

  • Definiție Big Data: Big Data, adică date de dimensiuni uriașe. Bigdata este un termen folosit pentru a descrie o colecție de date care este uriașă ca dimensiune și totuși crește exponențial în timp.
  • Exemplele de analiză Big Data includ burse de valori, site-uri de social media, motoare cu reacție etc.
  • Big Data ar putea fi 1) structurate, 2) nestructurate, 3) semi-structurate
  • Volumul, Varietatea, Viteza și Variabilitatea sunt câteva caracteristici Big Data
  • Servicii îmbunătățite pentru clienți, eficiență operațională mai bună, Luare mai bună a deciziilor sunt câteva avantaje ale Bigdata