Vad är Big Data? Introduktion, typer, egenskaper, exempel

Innan vi går till introduktion till Big Data behöver du först veta

Vad är data?

De kvantiteter, tecken eller symboler på vilka operationer utförs av en dator, vilka kan lagras och sändas i form av elektriska signaler och registreras på magnetiska, optiska eller mekaniska inspelningsmedia.

Låt oss nu lära oss definitionen av Big Data

Vad är Big Data?

Stora data är en samling data som är enorm i volym, men som ändå växer exponentiellt med tiden. Det är en data med så stor storlek och komplexitet att inget av traditionella datahanteringsverktyg kan lagra det eller bearbeta det effektivt. Big data är också en data men med enorm storlek.

Stora data
Vad är Big Data?

Vad är ett exempel på Big Data?

Följande är några av Big Data-exemplen-

Smakämnen New York Stock Exchange är ett exempel på Big Data som genererar ca en terabyte nya handelsdata per dag.

Exempel på Big Data

Sociala medier

Det visar statistiken 500+terabyte av ny data tas in i databaserna på sociala medier Facebook, varje dag. Dessa data genereras huvudsakligen i form av foto- och videouppladdningar, meddelandeutbyten, kommentarer etc.

Exempel på Big Data

En enda Jetmotor kan generera 10+terabyte av data i 30 minuter av flygtiden. Med många tusen flygningar per dag når genereringen av data upp till många Petabyte.

Exempel på Big Data

Typer av Big Data

Följande är typerna av Big Data:

  1. Strukturerad
  2. Ostrukturerad
  3. Halvstrukturerad

Strukturerad

All data som kan lagras, nås och bearbetas i form av fast format kallas "strukturerad" data. Med tiden har talang inom datavetenskap nått större framgång i att utveckla tekniker för att arbeta med sådan typ av data (där formatet är välkänt i förväg) och även få värde ur det. Men nuförtiden förutser vi problem när en storlek på sådan data växer i stor utsträckning, typiska storlekar är i rasande fart för flera zettabyte.

Vet du? 1021 byte lika med 1 zettabyte or en miljard terabyte former en zettabyte.

Om man tittar på dessa siffror kan man lätt förstå varför namnet Big Data ges och föreställa sig de utmaningar som är involverade i dess lagring och bearbetning.

Vet du? Data som lagras i ett relationsdatabashanteringssystem är ett exempel på en 'strukturerad' data.

Exempel på strukturerad data

En 'Employee'-tabell i en databas är ett exempel på strukturerad data

Anställnings-ID Anställd Namn Kön Avdelning Lön_I_lacs
2365 Rajesh Kulkarni man Finans 650000
3398 Pratibha Joshi Kvinna Administration 650000
7465 Shushil Roy man Administration 500000
7500 Shubhojit Das man Finans 500000
7699 Priya Sane Kvinna Finans 550000

Ostrukturerad

All data med okänd form eller struktur klassificeras som ostrukturerad data. Förutom att storleken är enorm, innebär ostrukturerad data flera utmaningar när det gäller dess bearbetning för att härleda värde ur den. Ett typiskt exempel på ostrukturerad data är en heterogen datakälla som innehåller en kombination av enkla textfiler, bilder, videor etc. Nuförtiden har organisationer tillgång till mängder av data men tyvärr vet de inte hur de ska hämta värde ur det eftersom dessa data är i sin råa form eller ostrukturerade format.

Exempel på ostrukturerad data

Utdata som returneras av "Google Sök"

Exempel på ostrukturerad data
Exempel på ostrukturerad data

Halvstrukturerad

Semistrukturerad data kan innehålla båda typerna av data. Vi kan se semistrukturerad data som en strukturerad form men den är faktiskt inte definierad med t.ex. en tabelldefinition i relationell DBMS. Exempel på semistrukturerad data är en data som representeras i en XML-fil.

Exempel på semistrukturerad data

Personuppgifter lagrade i en XML-fil-

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Datatillväxt under åren

Datatillväxt under åren
Datatillväxt under åren

Observera att webbapplikation data, som är ostrukturerad, består av loggfiler, transaktionshistorikfiler etc. OLTP-system är byggda för att arbeta med strukturerad data där data lagras i relationer (tabeller).

Egenskaper hos Big Data

Big data kan beskrivas med följande egenskaper:

  • Volym
  • Variety
  • Hastighet
  • Variabilitet

(i) Volym – Namnet Big Data i sig är relaterat till en storlek som är enorm. Storleken på data spelar en mycket avgörande roll för att bestämma värdet av data. Huruvida en viss data faktiskt kan betraktas som en Big Data eller inte, beror på mängden data. Därav, 'Volym' är en egenskap som måste beaktas när man hanterar Big Data-lösningar.

(ii) Variation – Nästa aspekt av Big Data är dess mängd.

Variation hänvisar till heterogena källor och arten av data, både strukturerade och ostrukturerade. Under tidigare dagar var kalkylblad och databaser de enda datakällorna som beaktades av de flesta applikationerna. Numera övervägs även data i form av e-post, foton, videor, övervakningsenheter, PDF-filer, ljud etc. i analysapplikationerna. Denna mängd ostrukturerade data ställer till vissa problem för lagring, gruvdrift och analys av data.

(iii) Hastighet – Uttrycket 'hastighet' hänvisar till hastigheten för generering av data. Hur snabbt data genereras och bearbetas för att möta kraven, avgör den verkliga potentialen i datan.

Big Data Velocity handlar om den hastighet med vilken data strömmar in från källor som affärsprocesser, applikationsloggar, nätverk och sociala medier, sensorer, Mobil enheter etc. Dataflödet är massivt och kontinuerligt.

(iv) Variabilitet – Detta hänvisar till den inkonsekvens som kan visas av data ibland, vilket hindrar processen för att kunna hantera och hantera data effektivt.

Fördelar med Big Data Processing

Förmågan att bearbeta Big Data i DBMS ger flera fördelar, t.ex.

  • Företag kan använda extern intelligens när de fattar beslut

Tillgång till sociala data från sökmotorer och webbplatser som Facebook, Twitter gör det möjligt för organisationer att finjustera sina affärsstrategier.

  • Förbättrad kundservice

Traditionella kundfeedbacksystem ersätts av nya system designade med Big Data-teknik. I dessa nya system används Big Data och naturliga språkbehandlingsteknologier för att läsa och utvärdera konsumenternas svar.

  • Tidig identifiering av risk för produkten/tjänsterna, om någon
  • Bättre operativ effektivitet

Big Data-tekniker kan användas för att skapa en mellanstation eller landningszon för ny data innan man identifierar vilken data som ska flyttas till datalagret. Dessutom hjälper sådan integrering av Big Data-teknologier och datalager en organisation att avlasta sällan åtkomst till data.

Sammanfattning

  • Big Data definition: Big Data betyder en data som är enorm i storlek. Bigdata är en term som används för att beskriva en samling data som är enorm i storlek och som ändå växer exponentiellt med tiden.
  • Exempel på Big Data-analys inkluderar börser, webbplatser för sociala medier, jetmotorer, etc.
  • Big Data kan vara 1) strukturerad, 2) ostrukturerad, 3) halvstrukturerad
  • Volym, variation, hastighet och variation är få Big Data-egenskaper
  • Förbättrad kundservice, bättre operativ effektivitet, Bättre beslutsfattande är få fördelar med Bigdata