Mikä on Big Data? Johdanto, tyypit, ominaisuudet, esimerkit

Ennen kuin siirrymme Big Datan esittelyyn, sinun on ensin tiedettävä

Mikä on Data?

Suuret, merkit tai symbolit, joilla tietokone suorittaa toimintoja, jotka voidaan tallentaa ja lähettää sähköisten signaalien muodossa ja tallentaa magneettiselle, optiselle tai mekaaniselle tallennusvälineelle.

Opitaan nyt Big Datan määritelmä

Mikä on Big Data?

Big Data on kokoelma dataa, jonka määrä on valtava, mutta joka kuitenkin kasvaa eksponentiaalisesti ajan myötä. Se on niin suurta ja monimutkaista dataa, että mikään perinteisistä tiedonhallintatyökaluista ei pysty tallentamaan tai käsittelemään sitä tehokkaasti. Big data on myös dataa, mutta sen koko on valtava.

Big Data
Mikä on Big Data?

Mikä on esimerkki Big Datasta?

Seuraavassa on joitain esimerkkejä Big Datasta -

- New York Stock Exchange on esimerkki Big Datasta, joka tuottaa noin yksi teratavu uutta kauppadataa päivässä.

Esimerkki Big Datasta

Sosiaalinen media

Tilasto osoittaa sen 500+ teratavua uudesta tiedosta pääsee sosiaalisen median tietokantoihin Facebook, joka päivä. Nämä tiedot syntyvät pääasiassa kuvien ja videoiden latauksista, viestien vaihdosta, kommenteista jne.

Esimerkki Big Datasta

Yksi Suihkumoottori voi tuottaa 10+ teratavua tiedoista sisään 30 minuuttia lentoajasta. Monilla tuhansilla lentoilla päivässä tiedon tuottaminen ulottuu jopa moniin Petabyyttiä.

Esimerkki Big Datasta

Big Datan tyypit

Seuraavat ovat Big Datan tyypit:

  1. Strukturoidut
  2. Rakentamaton
  3. Puolirakenteinen

Strukturoidut

Kaikkia tietoja, joita voidaan tallentaa, käyttää ja käsitellä kiinteässä muodossa, kutsutaan "strukturoiduksi" tiedoksi. Tietojenkäsittelytieteen kyvykkyys on ajan mittaan saavuttanut suurempaa menestystä kehittäessään tekniikoita tällaisten tietojen kanssa työskentelyyn (jos formaatti on hyvin tiedossa etukäteen) ja myös arvon johtamisessa. Kuitenkin nykyään ennakoimme ongelmia, kun tällaisen tiedon koko kasvaa valtavasti, tyypilliset koot ovat raivoissaan useiden zettatavujen raivoissa.

Tiedätkö? 1021 tavua yhtä kuin 1 zettatavu or miljardi teratavua lomakkeet zettatavu.

Näitä lukuja tarkasteltaessa voi helposti ymmärtää, miksi Big Data on nimetty, ja kuvitella sen tallentamiseen ja käsittelyyn liittyviä haasteita.

Tiedätkö? Relaatiotietokannan hallintajärjestelmään tallennettu data on yksi esimerkki a 'rakenteinen' tietoja.

Esimerkkejä strukturoidusta tiedosta

Tietokannan työntekijätaulukko on esimerkki strukturoidusta tiedosta

Henkilöstökortti Työntekijän nimi Sukupuoli osasto Palkka_lakeissa
2365 Rajesh Kulkarni Mies Rahoittaa 650000
3398 Pratibha Joshi Nainen admin 650000
7465 Shushil Roy Mies admin 500000
7500 Shubhojit Das Mies Rahoittaa 500000
7699 Priya Sane Nainen Rahoittaa 550000

Rakentamaton

Kaikki tiedot, joiden muoto tai rakenne on tuntematon, luokitellaan jäsentämättömäksi tiedoksi. Sen lisäksi, että jäsentämätön data on valtava, se asettaa useita haasteita sen käsittelyyn arvon saamiseksi. Tyypillinen esimerkki jäsentämättömästä tiedosta on heterogeeninen tietolähde, joka sisältää yhdistelmän yksinkertaisia ​​tekstitiedostoja, kuvia, videoita jne. Nykyään organisaatioilla on käytettävissään runsaasti dataa, mutta valitettavasti ne eivät tiedä, kuinka saada siitä arvoa, koska nämä tiedot ovat raakamuodossaan tai jäsentämättömässä muodossa.

Esimerkkejä jäsentämättömästä tiedosta

Google-haun palauttama tulos

Esimerkki jäsentämättömästä tiedosta
Esimerkki strukturoimattomasta tiedosta

Puolirakenteinen

Puolistrukturoitu data voi sisältää molempia datamuotoja. Voimme nähdä puolistrukturoidun tiedon strukturoituna muodossa, mutta sitä ei itse asiassa määritellä esim. taulukkomääritelmällä relaatiomuodossa DBMS. Esimerkki puolistrukturoidusta tiedosta on XML-tiedostossa esitetty data.

Esimerkkejä puolistrukturoidusta datasta

XML-tiedostoon tallennetut henkilötiedot

<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec>
<rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec>
<rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec>
<rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec>
<rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>

Datan kasvu vuosien varrella

Datan kasvu vuosien varrella
Datan kasvu vuosien varrella

Huomaa, että Web-sovellus data, joka on jäsentämätön, koostuu lokitiedostoista, tapahtumahistoriatiedostoista jne. OLTP-järjestelmät on rakennettu toimimaan strukturoidun datan kanssa, jossa tiedot on tallennettu suhteisiin (taulukoihin).

Big Datan ominaisuudet

Big dataa voidaan kuvata seuraavilla ominaisuuksilla:

  • tilavuus
  • lajike
  • Nopeus
  • vaihtelevuus

(i) määrä – Itse Big Datan nimi liittyy valtavaan kokoon. Tietojen koolla on erittäin tärkeä rooli määritettäessä datan arvoa. Myös se, voidaanko tiettyä dataa todella pitää Big Datana vai ei, riippuu datan määrästä. Siten, 'Äänenvoimakkuus' on yksi ominaisuus, joka on otettava huomioon käsiteltäessä Big Data -ratkaisuja.

(ii) lajike – Big Datan seuraava puoli on sen lajike.

Monimuotoisuus viittaa heterogeenisiin lähteisiin ja datan luonteeseen, niin strukturoituun kuin jäsentämättömäänkin. Aikaisemmin laskentataulukot ja tietokannat olivat ainoat tietolähteet, joita useimmat sovellukset ottivat huomioon. Nykyään analyysisovelluksissa huomioidaan myös data sähköpostien, valokuvien, videoiden, valvontalaitteiden, PDF-tiedostojen, äänen jne. muodossa. Tämä monimuotoinen jäsentämätön data aiheuttaa tiettyjä ongelmia tietojen tallentamisessa, louhinnassa ja analysoinnissa.

(iii) Nopeus – Termi 'nopeus' viittaa tiedon tuoton nopeuteen. Datan todellisen potentiaalin määrää se, kuinka nopeasti data tuotetaan ja käsitellään tarpeiden mukaisesti.

Big Data Velocity käsittelee nopeutta, jolla data virtaa lähteistä, kuten liiketoimintaprosesseista, sovelluslokeista, verkoista ja sosiaalisen median sivustoista, antureista, Puhelinnumero laitteet jne. Tietovirta on massiivinen ja jatkuva.

(iv) Vaihtuvuus – Tämä viittaa epäjohdonmukaisuuteen, jonka tiedot voivat toisinaan osoittaa, mikä vaikeuttaa tietojen tehokasta käsittelyä ja hallintaa.

Big Data Processingin edut

Mahdollisuus käsitellä Big Dataa DBMS:ssä tuo monia etuja, kuten

  • Yritykset voivat hyödyntää ulkopuolista älykkyyttä tehdessään päätöksiä

Pääsy sosiaalisiin tietoihin osoitteesta Hakukoneet ja sivustot, kuten Facebook ja Twitter, antavat organisaatioille mahdollisuuden hienosäätää liiketoimintastrategioitaan.

  • Parempi asiakaspalvelu

Perinteiset asiakaspalautejärjestelmät korvataan uusilla Big Data -teknologioilla suunnitelluilla järjestelmillä. Näissä uusissa järjestelmissä käytetään Big Dataa ja luonnollisen kielen käsittelytekniikoita kuluttajien vastausten lukemiseen ja arvioimiseen.

  • Tuotteeseen/palveluihin mahdollisesti kohdistuvan riskin varhainen tunnistaminen
  • Parempi toiminnan tehokkuus

Big Data -teknologioiden avulla voidaan luoda uusille tiedoille pysähdysalue tai laskeutumisalue ennen kuin määritellään, mitä dataa pitäisi siirtää tietovarasto. Lisäksi tällainen Big Data -teknologioiden ja tietovaraston integrointi auttaa organisaatiota purkamaan harvoin käytettyä dataa.

Yhteenveto

  • Big Datan määritelmä: Big Data tarkoittaa valtavaa dataa. Bigdata on termi, jota käytetään kuvaamaan tietokokoelmaa, joka on kooltaan valtava ja joka kuitenkin kasvaa eksponentiaalisesti ajan myötä.
  • Big Datan analytiikan esimerkkejä ovat pörssit, sosiaalisen median sivustot, suihkumoottorit jne.
  • Big Data voi olla 1) jäsenneltyä, 2) jäsentämätöntä, 3) puolirakenteista
  • Volyymi, vaihtelu, nopeus ja vaihtelevuus ovat harvoja Big Datan ominaisuuksia
  • Parempi asiakaspalvelu, parempi toiminnan tehokkuus, parempi päätöksenteko ovat muutamia Bigdatan etuja