Vad är Big Data? Introduktion, typer, egenskaper, exempel
Vad är data?
De kvantiteter, tecken eller symboler på vilka operationer utförs av en dator, vilka kan lagras och sändas i form av elektriska signaler och registreras på magnetiska, optiska eller mekaniska inspelningsmedia.
Låt oss nu lära oss definitionen av Big Data
Vad är Big Data?
Stora data är en samling data som är enorm i volym, men som ändå växer exponentiellt med tiden. Det är en data med så stor storlek och komplexitet att inget av traditionella datahanteringsverktyg kan lagra det eller bearbeta det effektivt. Big data är också en data men med enorm storlek.

Vad är ett exempel på Big Data?
Följande är några av Big Data-exemplen-
Smakämnen New York Stock Exchange är ett exempel på Big Data som genererar ca en terabyte nya handelsdata per dag.
Sociala medier
Det visar statistiken 500+terabyte av ny data tas in i databaserna på sociala medier Facebook, varje dag. Dessa data genereras huvudsakligen i form av foto- och videouppladdningar, meddelandeutbyten, kommentarer etc.
En enda Jetmotor kan generera 10+terabyte av data i 30 minuter av flygtiden. Med många tusen flygningar per dag når genereringen av data upp till många Petabyte.
Typer av Big Data
Följande är typerna av Big Data:
- Strukturerad
- Ostrukturerad
- Halvstrukturerad
Strukturerad
All data som kan lagras, nås och bearbetas i form av fast format kallas "strukturerad" data. Med tiden har talang inom datavetenskap nått större framgång i att utveckla tekniker för att arbeta med sådan typ av data (där formatet är välkänt i förväg) och även få värde ur det. Men nuförtiden förutser vi problem när en storlek på sådan data växer i stor utsträckning, typiska storlekar är i rasande fart för flera zettabyte.
Vet du? 1021 byte lika med 1 zettabyte or en miljard terabyte former en zettabyte.
Om man tittar på dessa siffror kan man lätt förstå varför namnet Big Data ges och föreställa sig de utmaningar som är involverade i dess lagring och bearbetning.
Vet du? Data som lagras i ett relationsdatabashanteringssystem är ett exempel på en 'strukturerad' data.
Exempel på strukturerad data
En 'Employee'-tabell i en databas är ett exempel på strukturerad data
Anställnings-ID | Anställd Namn | Kön | Avdelning | Lön_I_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | man | Finans | 650000 |
3398 | Pratibha Joshi | Kvinna | Administration | 650000 |
7465 | Shushil Roy | man | Administration | 500000 |
7500 | Shubhojit Das | man | Finans | 500000 |
7699 | Priya Sane | Kvinna | Finans | 550000 |
Ostrukturerad
All data med okänd form eller struktur klassificeras som ostrukturerad data. Förutom att storleken är enorm, innebär ostrukturerad data flera utmaningar när det gäller dess bearbetning för att härleda värde ur den. Ett typiskt exempel på ostrukturerad data är en heterogen datakälla som innehåller en kombination av enkla textfiler, bilder, videor etc. Nuförtiden har organisationer tillgång till mängder av data men tyvärr vet de inte hur de ska hämta värde ur det eftersom dessa data är i sin råa form eller ostrukturerade format.
Exempel på ostrukturerad data
Utdata som returneras av "Google Sök"
Halvstrukturerad
Semistrukturerad data kan innehålla båda typerna av data. Vi kan se semistrukturerad data som en strukturerad form men den är faktiskt inte definierad med t.ex. en tabelldefinition i relationell DBMS. Exempel på semistrukturerad data är en data som representeras i en XML-fil.
Exempel på semistrukturerad data
Personuppgifter lagrade i en XML-fil-
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Datatillväxt under åren
Observera att webbapplikation data, som är ostrukturerad, består av loggfiler, transaktionshistorikfiler etc. OLTP-system är byggda för att arbeta med strukturerad data där data lagras i relationer (tabeller).
Egenskaper hos Big Data
Big data kan beskrivas med följande egenskaper:
- Volym
- Variety
- Hastighet
- Variabilitet
(i) Volym – Namnet Big Data i sig är relaterat till en storlek som är enorm. Storleken på data spelar en mycket avgörande roll för att bestämma värdet av data. Huruvida en viss data faktiskt kan betraktas som en Big Data eller inte, beror på mängden data. Därav, 'Volym' är en egenskap som måste beaktas när man hanterar Big Data-lösningar.
(ii) Variation – Nästa aspekt av Big Data är dess mängd.
Variation hänvisar till heterogena källor och arten av data, både strukturerade och ostrukturerade. Under tidigare dagar var kalkylblad och databaser de enda datakällorna som beaktades av de flesta applikationerna. Numera övervägs även data i form av e-post, foton, videor, övervakningsenheter, PDF-filer, ljud etc. i analysapplikationerna. Denna mängd ostrukturerade data ställer till vissa problem för lagring, gruvdrift och analys av data.
(iii) Hastighet – Uttrycket 'hastighet' hänvisar till hastigheten för generering av data. Hur snabbt data genereras och bearbetas för att möta kraven, avgör den verkliga potentialen i datan.
Big Data Velocity handlar om den hastighet med vilken data strömmar in från källor som affärsprocesser, applikationsloggar, nätverk och sociala medier, sensorer, Mobil enheter etc. Dataflödet är massivt och kontinuerligt.
(iv) Variabilitet – Detta hänvisar till den inkonsekvens som kan visas av data ibland, vilket hindrar processen för att kunna hantera och hantera data effektivt.
Fördelar med Big Data Processing
Förmågan att bearbeta Big Data i DBMS ger flera fördelar, t.ex.
- Företag kan använda extern intelligens när de fattar beslut
Tillgång till sociala data från sökmotorer och webbplatser som Facebook, Twitter gör det möjligt för organisationer att finjustera sina affärsstrategier.
- Förbättrad kundservice
Traditionella kundfeedbacksystem ersätts av nya system designade med Big Data-teknik. I dessa nya system används Big Data och naturliga språkbehandlingsteknologier för att läsa och utvärdera konsumenternas svar.
- Tidig identifiering av risk för produkten/tjänsterna, om någon
- Bättre operativ effektivitet
Big Data-tekniker kan användas för att skapa en mellanstation eller landningszon för ny data innan man identifierar vilken data som ska flyttas till datalagret. Dessutom hjälper sådan integrering av Big Data-teknologier och datalager en organisation att avlasta sällan åtkomst till data.
Sammanfattning
- Big Data definition: Big Data betyder en data som är enorm i storlek. Bigdata är en term som används för att beskriva en samling data som är enorm i storlek och som ändå växer exponentiellt med tiden.
- Exempel på Big Data-analys inkluderar börser, webbplatser för sociala medier, jetmotorer, etc.
- Big Data kan vara 1) strukturerad, 2) ostrukturerad, 3) halvstrukturerad
- Volym, variation, hastighet och variation är få Big Data-egenskaper
- Förbättrad kundservice, bättre operativ effektivitet, Bättre beslutsfattande är få fördelar med Bigdata