Mi az a Big Data? Bevezetés, típusok, jellemzők, példák
Mi az adat?
Azok a mennyiségek, karakterek vagy szimbólumok, amelyeken a számítógép műveleteket hajt végre, amelyek elektromos jelek formájában tárolhatók és továbbíthatók, és mágneses, optikai vagy mechanikus adathordozón rögzíthetők.
Most pedig tanuljuk meg a Big Data definícióját
Mi a Big Data?
Big adatok hatalmas mennyiségű, de idővel exponenciálisan bővülő adatgyűjtemény. Ez egy olyan nagy méretű és összetett adat, hogy a hagyományos adatkezelési eszközök egyike sem képes hatékonyan tárolni vagy feldolgozni. A nagy adat szintén adat, de hatalmas mérettel.

Mi a Big Data példa?
Íme néhány példa a Big Data-ra
A New York Stock Exchange- egy példa a Big Data-ra, amely kb egy terabájt új kereskedelmi adatok naponta.
Social Media
A statisztika ezt mutatja 500+ terabájt az új adatok bekerülnek a közösségi oldalak adatbázisaiba Facebook, minden nap. Ezek az adatok főként fotó- és videófeltöltések, üzenetváltások, megjegyzések stb. során keletkeznek.
Egyetlen Repülőgép hajtómű generálhat 10+ terabájt az adatokból 30 perc a repülési időből. Napi sok ezer járattal az adatok generálása sokakat elér Petabájtok.
A Big Data típusai
A Big Data típusai a következők:
- Szerkesztett
- Strukturálatlan
- Félig strukturált
Szerkesztett
Minden olyan adatot, amely rögzített formátumban tárolható, hozzáférhető és feldolgozható, „strukturált” adatnak nevezzük. Az idők során a számítástechnikában tevékenykedő tehetségek nagyobb sikereket értek el az ilyen típusú adatokkal való munkavégzés technikáinak kidolgozásában (ahol a formátum előre jól ismert), és abból is értéket nyert. Napjainkban azonban problémákat látunk előre, amikor az ilyen adatok mérete hatalmasra nő, a tipikus méretek pedig a több zettabájt dühében vannak.
Tudod? 1021 bájt egyenlő 1 zettabájt or egymilliárd terabájt formák egy zettabyte.
Ezeket a számokat tekintve könnyen érthető, hogy miért adják a Big Data nevet, és elképzelhető, milyen kihívásokkal jár a tárolás és feldolgozás.
Tudod? A relációs adatbázis-kezelő rendszerben tárolt adatok egyik példája a 'strukturált' adatokat.
Példák strukturált adatokra
Az adatbázisban lévő „Alkalmazott” tábla egy példa a strukturált adatokra
Munkavállalói azonosító | Alkalmazott Neve | nem | osztály | Fizetés_lakokban |
---|---|---|---|---|
2365 | Rajesh Kulkarni | férfi | Finanszíroz | 650000 |
3398 | Pratibha Joshi | nő | admin | 650000 |
7465 | Shushil Roy | férfi | admin | 500000 |
7500 | Shubhojit Das | férfi | Finanszíroz | 500000 |
7699 | Priya Sane | nő | Finanszíroz | 550000 |
Strukturálatlan
Minden ismeretlen formájú vagy szerkezetű adat strukturálatlan adatnak minősül. A hatalmas méret mellett a strukturálatlan adatok több kihívást is jelentenek a feldolgozás szempontjából, hogy értéket nyerjenek ki belőlük. A strukturálatlan adatok tipikus példája a heterogén adatforrás, amely egyszerű szöveges fájlok, képek, videók stb. kombinációját tartalmazza. Napjainkban a szervezetek rengeteg adattal rendelkeznek, de sajnos nem tudják, hogyan lehet ebből értéket származtatni, mivel ezek az adatok nyers vagy strukturálatlan formátumban vannak.
Példák strukturálatlan adatokra
A „Google Keresés” által visszaadott kimenet
Félig strukturált
A félig strukturált adatok mindkét adatformát tartalmazhatják. A félig strukturált adatokat láthatjuk strukturált formában, de valójában nincs definiálva pl. táblázat definícióval relációs DBMS. A félig strukturált adatok példája egy XML-fájlban ábrázolt adat.
Példák félig strukturált adatokra
XML fájlban tárolt személyes adatok-
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Adatnövekedés az évek során
Felhívjuk figyelmét, hogy webalkalmazás a strukturálatlan adat naplófájlokból, tranzakciós előzményekből stb. áll. Az OLTP-rendszerek strukturált adatokkal való együttműködésre épülnek, ahol az adatokat relációkban (táblázatokban) tárolják.
A Big Data jellemzői
A big data a következő jellemzőkkel írható le:
- kötet
- Fajta
- Sebesség
- Változékonyság
(i) kötet – Maga a Big Data név egy óriási mérethez kapcsolódik. Az adatok mérete nagyon fontos szerepet játszik az adatok értékének meghatározásában. Az is, hogy egy adott adat valóban Big Data-nak tekinthető-e vagy sem, az adatok mennyiségétől függ. Ennélfogva, 'Hangerő' Ez az egyik jellemző, amelyet figyelembe kell venni a Big Data megoldások kezelésekor.
(ii) fajta – A Big Data következő aspektusa az fajta.
A változatosság heterogén forrásokra és a strukturált és strukturálatlan adatok természetére utal. A korábbi időkben a legtöbb alkalmazásban a táblázatok és az adatbázisok voltak az egyetlen adatforrások. Napjainkban az elemző alkalmazásokban az e-mailek, fotók, videók, felügyeleti eszközök, PDF-ek, hanganyagok stb. formájában megjelenő adatokat is figyelembe veszik. A strukturálatlan adatok sokfélesége bizonyos problémákat vet fel az adatok tárolásával, bányászatával és elemzésével kapcsolatban.
(iii) Sebesség – A kifejezés 'sebesség' az adatgenerálás sebességére utal. Az, hogy az adatok milyen gyorsan generálódnak és dolgoznak fel az igényeknek megfelelően, meghatározza az adatokban rejlő valódi potenciált.
A Big Data Velocity azzal a sebességgel foglalkozik, amellyel az adatok olyan forrásokból áramlanak be, mint az üzleti folyamatok, az alkalmazásnaplók, a hálózatok és a közösségi média webhelyek, érzékelők, Mobil eszközök stb. Az adatáramlás hatalmas és folyamatos.
(iv) Változékonyság – Ez arra az inkonzisztenciára utal, amelyet az adatok időnként kimutathatnak, és így hátráltatják az adatok hatékony kezelésének és kezelésének folyamatát.
A Big Data Processing előnyei
A Big Data DBMS-ben történő feldolgozásának képessége számos előnnyel jár, mint pl.
- A vállalkozások a döntéshozatal során felhasználhatják a külső intelligenciát
Hozzáférés a közösségi adatokhoz innen keresők és az olyan webhelyek, mint a Facebook, Twitter, lehetővé teszik a szervezetek számára, hogy finomhangolják üzleti stratégiáikat.
- Javított ügyfélszolgálat
A hagyományos ügyfél-visszajelzési rendszereket felváltják a Big Data technológiákkal tervezett új rendszerek. Ezekben az új rendszerekben Big Data és természetes nyelvi feldolgozási technológiákat használnak a fogyasztói válaszok olvasására és értékelésére.
- A termék/szolgáltatás kockázatának korai azonosítása, ha van ilyen
- Jobb működési hatékonyság
A Big Data technológiái felhasználhatók egy állomáshely vagy leszállózóna létrehozására az új adatok számára, mielőtt meghatároznák, milyen adatokat kell áthelyezni a adattárház. Ezen túlmenően a Big Data technológiák és az adattárház ilyen integrációja segít a szervezetnek a ritkán elért adatok kiürítésében.
Összegzésként
- Big Data meghatározása: A Big Data olyan adatot jelent, amely hatalmas méretű. A Bigdata olyan adatgyűjtemény leírására használatos, amely hatalmas méretű, de idővel exponenciálisan növekszik.
- A Big Data elemzési példái közé tartoznak a tőzsdék, a közösségi média oldalak, a sugárhajtóművek stb.
- A Big Data lehet 1) strukturált, 2) strukturálatlan, 3) félig strukturált
- A mennyiség, a változatosság, a sebesség és a változékonyság néhány Big Data jellemző
- A jobb ügyfélszolgálat, a jobb működési hatékonyság, a jobb döntéshozatal néhány előnye a Bigdatának