Mi az a Big Data? Bevezetés, típusok, jellemzők, példák

Mielőtt rátérnénk a Big Data bevezetésére, először tudnod kell

Mi az adat?

Azok a mennyiségek, karakterek vagy szimbólumok, amelyeken a számítógép műveleteket hajt végre, amelyek elektromos jelek formájában tárolhatók és továbbíthatók, és mágneses, optikai vagy mechanikus adathordozón rögzíthetők.

Most pedig tanuljuk meg a Big Data definícióját

Mi a Big Data?

Big adatok hatalmas mennyiségű, de idővel exponenciálisan bővülő adatgyűjtemény. Ez egy olyan nagy méretű és összetett adat, hogy a hagyományos adatkezelési eszközök egyike sem képes hatékonyan tárolni vagy feldolgozni. A nagy adat szintén adat, de hatalmas mérettel.

Big adatok
Mi a Big Data?

Mi a Big Data példa?

Íme néhány példa a Big Data-ra

A New York Stock Exchange- egy példa a Big Data-ra, amely kb egy terabájt új kereskedelmi adatok naponta.

Példa a Big Data-ra

Social Media

A statisztika ezt mutatja 500+ terabájt az új adatok bekerülnek a közösségi oldalak adatbázisaiba Facebook, minden nap. Ezek az adatok főként fotó- és videófeltöltések, üzenetváltások, megjegyzések stb. során keletkeznek.

Példa a Big Data-ra

Egyetlen Repülőgép hajtómű generálhat 10+ terabájt az adatokból 30 perc a repülési időből. Napi sok ezer járattal az adatok generálása sokakat elér Petabájtok.

Példa a Big Data-ra

A Big Data típusai

A Big Data típusai a következők:

  1. Szerkesztett
  2. Strukturálatlan
  3. Félig strukturált

Szerkesztett

Minden olyan adatot, amely rögzített formátumban tárolható, hozzáférhető és feldolgozható, „strukturált” adatnak nevezzük. Az idők során a számítástechnikában tevékenykedő tehetségek nagyobb sikereket értek el az ilyen típusú adatokkal való munkavégzés technikáinak kidolgozásában (ahol a formátum előre jól ismert), és abból is értéket nyert. Napjainkban azonban problémákat látunk előre, amikor az ilyen adatok mérete hatalmasra nő, a tipikus méretek pedig a több zettabájt dühében vannak.

Tudod? 1021 bájt egyenlő 1 zettabájt or egymilliárd terabájt formák egy zettabyte.

Ezeket a számokat tekintve könnyen érthető, hogy miért adják a Big Data nevet, és elképzelhető, milyen kihívásokkal jár a tárolás és feldolgozás.

Tudod? A relációs adatbázis-kezelő rendszerben tárolt adatok egyik példája a 'strukturált' adatokat.

Példák strukturált adatokra

Az adatbázisban lévő „Alkalmazott” tábla egy példa a strukturált adatokra

Munkavállalói azonosító Alkalmazott Neve nem osztály Fizetés_lakokban
2365 Rajesh Kulkarni férfi Finanszíroz 650000
3398 Pratibha Joshi admin 650000
7465 Shushil Roy férfi admin 500000
7500 Shubhojit Das férfi Finanszíroz 500000
7699 Priya Sane Finanszíroz 550000

Strukturálatlan

Minden ismeretlen formájú vagy szerkezetű adat strukturálatlan adatnak minősül. A hatalmas méret mellett a strukturálatlan adatok több kihívást is jelentenek a feldolgozás szempontjából, hogy értéket nyerjenek ki belőlük. A strukturálatlan adatok tipikus példája a heterogén adatforrás, amely egyszerű szöveges fájlok, képek, videók stb. kombinációját tartalmazza. Napjainkban a szervezetek rengeteg adattal rendelkeznek, de sajnos nem tudják, hogyan lehet ebből értéket származtatni, mivel ezek az adatok nyers vagy strukturálatlan formátumban vannak.

Példák strukturálatlan adatokra

A „Google Keresés” által visszaadott kimenet

Példa strukturálatlan adatokra
Példa strukturálatlan adatokra

Félig strukturált

A félig strukturált adatok mindkét adatformát tartalmazhatják. A félig strukturált adatokat láthatjuk strukturált formában, de valójában nincs definiálva pl. táblázat definícióval relációs DBMS. A félig strukturált adatok példája egy XML-fájlban ábrázolt adat.

Példák félig strukturált adatokra

XML fájlban tárolt személyes adatok-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Adatnövekedés az évek során

Adatnövekedés az évek során
Adatnövekedés az évek során

Felhívjuk figyelmét, hogy webalkalmazás a strukturálatlan adat naplófájlokból, tranzakciós előzményekből stb. áll. Az OLTP-rendszerek strukturált adatokkal való együttműködésre épülnek, ahol az adatokat relációkban (táblázatokban) tárolják.

A Big Data jellemzői

A big data a következő jellemzőkkel írható le:

  • kötet
  • Fajta
  • Sebesség
  • Változékonyság

(i) kötet – Maga a Big Data név egy óriási mérethez kapcsolódik. Az adatok mérete nagyon fontos szerepet játszik az adatok értékének meghatározásában. Az is, hogy egy adott adat valóban Big Data-nak tekinthető-e vagy sem, az adatok mennyiségétől függ. Ennélfogva, 'Hangerő' Ez az egyik jellemző, amelyet figyelembe kell venni a Big Data megoldások kezelésekor.

(ii) fajta – A Big Data következő aspektusa az fajta.

A változatosság heterogén forrásokra és a strukturált és strukturálatlan adatok természetére utal. A korábbi időkben a legtöbb alkalmazásban a táblázatok és az adatbázisok voltak az egyetlen adatforrások. Napjainkban az elemző alkalmazásokban az e-mailek, fotók, videók, felügyeleti eszközök, PDF-ek, hanganyagok stb. formájában megjelenő adatokat is figyelembe veszik. A strukturálatlan adatok sokfélesége bizonyos problémákat vet fel az adatok tárolásával, bányászatával és elemzésével kapcsolatban.

(iii) Sebesség – A kifejezés 'sebesség' az adatgenerálás sebességére utal. Az, hogy az adatok milyen gyorsan generálódnak és dolgoznak fel az igényeknek megfelelően, meghatározza az adatokban rejlő valódi potenciált.

A Big Data Velocity azzal a sebességgel foglalkozik, amellyel az adatok olyan forrásokból áramlanak be, mint az üzleti folyamatok, az alkalmazásnaplók, a hálózatok és a közösségi média webhelyek, érzékelők, Mobil eszközök stb. Az adatáramlás hatalmas és folyamatos.

(iv) Változékonyság – Ez arra az inkonzisztenciára utal, amelyet az adatok időnként kimutathatnak, és így hátráltatják az adatok hatékony kezelésének és kezelésének folyamatát.

A Big Data Processing előnyei

A Big Data DBMS-ben történő feldolgozásának képessége számos előnnyel jár, mint pl.

  • A vállalkozások a döntéshozatal során felhasználhatják a külső intelligenciát

Hozzáférés a közösségi adatokhoz innen keresők és az olyan webhelyek, mint a Facebook, Twitter, lehetővé teszik a szervezetek számára, hogy finomhangolják üzleti stratégiáikat.

  • Javított ügyfélszolgálat

A hagyományos ügyfél-visszajelzési rendszereket felváltják a Big Data technológiákkal tervezett új rendszerek. Ezekben az új rendszerekben Big Data és természetes nyelvi feldolgozási technológiákat használnak a fogyasztói válaszok olvasására és értékelésére.

  • A termék/szolgáltatás kockázatának korai azonosítása, ha van ilyen
  • Jobb működési hatékonyság

A Big Data technológiái felhasználhatók egy állomáshely vagy leszállózóna létrehozására az új adatok számára, mielőtt meghatároznák, milyen adatokat kell áthelyezni a adattárház. Ezen túlmenően a Big Data technológiák és az adattárház ilyen integrációja segít a szervezetnek a ritkán elért adatok kiürítésében.

Összegzésként

  • Big Data meghatározása: A Big Data olyan adatot jelent, amely hatalmas méretű. A Bigdata olyan adatgyűjtemény leírására használatos, amely hatalmas méretű, de idővel exponenciálisan növekszik.
  • A Big Data elemzési példái közé tartoznak a tőzsdék, a közösségi média oldalak, a sugárhajtóművek stb.
  • A Big Data lehet 1) strukturált, 2) strukturálatlan, 3) félig strukturált
  • A mennyiség, a változatosság, a sebesség és a változékonyság néhány Big Data jellemző
  • A jobb ügyfélszolgálat, a jobb működési hatékonyság, a jobb döntéshozatal néhány előnye a Bigdatának