Mikä on Big Data? Johdanto, tyypit, ominaisuudet, esimerkit
Mikä on Data?
Suuret, merkit tai symbolit, joilla tietokone suorittaa toimintoja, jotka voidaan tallentaa ja lähettää sähköisten signaalien muodossa ja tallentaa magneettiselle, optiselle tai mekaaniselle tallennusvälineelle.
Opitaan nyt Big Datan määritelmä
Mikä on Big Data?
Big Data on kokoelma dataa, jonka määrä on valtava, mutta joka kuitenkin kasvaa eksponentiaalisesti ajan myötä. Se on niin suurta ja monimutkaista dataa, että mikään perinteisistä tiedonhallintatyökaluista ei pysty tallentamaan tai käsittelemään sitä tehokkaasti. Big data on myös dataa, mutta sen koko on valtava.

Mikä on esimerkki Big Datasta?
Seuraavassa on joitain esimerkkejä Big Datasta -
- New York Stock Exchange on esimerkki Big Datasta, joka tuottaa noin yksi teratavu uutta kauppadataa päivässä.
Sosiaalinen media
Tilasto osoittaa sen 500+ teratavua uudesta tiedosta pääsee sosiaalisen median tietokantoihin Facebook, joka päivä. Nämä tiedot syntyvät pääasiassa kuvien ja videoiden latauksista, viestien vaihdosta, kommenteista jne.
Yksi Suihkumoottori voi tuottaa 10+ teratavua tiedoista sisään 30 minuuttia lentoajasta. Monilla tuhansilla lentoilla päivässä tiedon tuottaminen ulottuu jopa moniin Petabyyttiä.
Big Datan tyypit
Seuraavat ovat Big Datan tyypit:
- Strukturoidut
- Rakentamaton
- Puolirakenteinen
Strukturoidut
Kaikkia tietoja, joita voidaan tallentaa, käyttää ja käsitellä kiinteässä muodossa, kutsutaan "strukturoiduksi" tiedoksi. Tietojenkäsittelytieteen kyvykkyys on ajan mittaan saavuttanut suurempaa menestystä kehittäessään tekniikoita tällaisten tietojen kanssa työskentelyyn (jos formaatti on hyvin tiedossa etukäteen) ja myös arvon johtamisessa. Kuitenkin nykyään ennakoimme ongelmia, kun tällaisen tiedon koko kasvaa valtavasti, tyypilliset koot ovat raivoissaan useiden zettatavujen raivoissa.
Tiedätkö? 1021 tavua yhtä kuin 1 zettatavu or miljardi teratavua lomakkeet zettatavu.
Näitä lukuja tarkasteltaessa voi helposti ymmärtää, miksi Big Data on nimetty, ja kuvitella sen tallentamiseen ja käsittelyyn liittyviä haasteita.
Tiedätkö? Relaatiotietokannan hallintajärjestelmään tallennettu data on yksi esimerkki a 'rakenteinen' tietoja.
Esimerkkejä strukturoidusta tiedosta
Tietokannan työntekijätaulukko on esimerkki strukturoidusta tiedosta
Henkilöstökortti | Työntekijän nimi | Sukupuoli | osasto | Palkka_lakeissa |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Mies | Rahoittaa | 650000 |
3398 | Pratibha Joshi | Nainen | admin | 650000 |
7465 | Shushil Roy | Mies | admin | 500000 |
7500 | Shubhojit Das | Mies | Rahoittaa | 500000 |
7699 | Priya Sane | Nainen | Rahoittaa | 550000 |
Rakentamaton
Kaikki tiedot, joiden muoto tai rakenne on tuntematon, luokitellaan jäsentämättömäksi tiedoksi. Sen lisäksi, että jäsentämätön data on valtava, se asettaa useita haasteita sen käsittelyyn arvon saamiseksi. Tyypillinen esimerkki jäsentämättömästä tiedosta on heterogeeninen tietolähde, joka sisältää yhdistelmän yksinkertaisia tekstitiedostoja, kuvia, videoita jne. Nykyään organisaatioilla on käytettävissään runsaasti dataa, mutta valitettavasti ne eivät tiedä, kuinka saada siitä arvoa, koska nämä tiedot ovat raakamuodossaan tai jäsentämättömässä muodossa.
Esimerkkejä jäsentämättömästä tiedosta
Google-haun palauttama tulos
Puolirakenteinen
Puolistrukturoitu data voi sisältää molempia datamuotoja. Voimme nähdä puolistrukturoidun tiedon strukturoituna muodossa, mutta sitä ei itse asiassa määritellä esim. taulukkomääritelmällä relaatiomuodossa DBMS. Esimerkki puolistrukturoidusta tiedosta on XML-tiedostossa esitetty data.
Esimerkkejä puolistrukturoidusta datasta
XML-tiedostoon tallennetut henkilötiedot
<rec><name>Prashant Rao</name><sex>Male</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Female</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Male</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Male</sex><age>26</age></rec> <rec><name>Jeremiah J.</name><sex>Male</sex><age>35</age></rec>
Datan kasvu vuosien varrella
Huomaa, että Web-sovellus data, joka on jäsentämätön, koostuu lokitiedostoista, tapahtumahistoriatiedostoista jne. OLTP-järjestelmät on rakennettu toimimaan strukturoidun datan kanssa, jossa tiedot on tallennettu suhteisiin (taulukoihin).
Big Datan ominaisuudet
Big dataa voidaan kuvata seuraavilla ominaisuuksilla:
- tilavuus
- lajike
- Nopeus
- vaihtelevuus
(i) määrä – Itse Big Datan nimi liittyy valtavaan kokoon. Tietojen koolla on erittäin tärkeä rooli määritettäessä datan arvoa. Myös se, voidaanko tiettyä dataa todella pitää Big Datana vai ei, riippuu datan määrästä. Siten, 'Äänenvoimakkuus' on yksi ominaisuus, joka on otettava huomioon käsiteltäessä Big Data -ratkaisuja.
(ii) lajike – Big Datan seuraava puoli on sen lajike.
Monimuotoisuus viittaa heterogeenisiin lähteisiin ja datan luonteeseen, niin strukturoituun kuin jäsentämättömäänkin. Aikaisemmin laskentataulukot ja tietokannat olivat ainoat tietolähteet, joita useimmat sovellukset ottivat huomioon. Nykyään analyysisovelluksissa huomioidaan myös data sähköpostien, valokuvien, videoiden, valvontalaitteiden, PDF-tiedostojen, äänen jne. muodossa. Tämä monimuotoinen jäsentämätön data aiheuttaa tiettyjä ongelmia tietojen tallentamisessa, louhinnassa ja analysoinnissa.
(iii) Nopeus – Termi 'nopeus' viittaa tiedon tuoton nopeuteen. Datan todellisen potentiaalin määrää se, kuinka nopeasti data tuotetaan ja käsitellään tarpeiden mukaisesti.
Big Data Velocity käsittelee nopeutta, jolla data virtaa lähteistä, kuten liiketoimintaprosesseista, sovelluslokeista, verkoista ja sosiaalisen median sivustoista, antureista, Puhelinnumero laitteet jne. Tietovirta on massiivinen ja jatkuva.
(iv) Vaihtuvuus – Tämä viittaa epäjohdonmukaisuuteen, jonka tiedot voivat toisinaan osoittaa, mikä vaikeuttaa tietojen tehokasta käsittelyä ja hallintaa.
Big Data Processingin edut
Mahdollisuus käsitellä Big Dataa DBMS:ssä tuo monia etuja, kuten
- Yritykset voivat hyödyntää ulkopuolista älykkyyttä tehdessään päätöksiä
Pääsy sosiaalisiin tietoihin osoitteesta Hakukoneet ja sivustot, kuten Facebook ja Twitter, antavat organisaatioille mahdollisuuden hienosäätää liiketoimintastrategioitaan.
- Parempi asiakaspalvelu
Perinteiset asiakaspalautejärjestelmät korvataan uusilla Big Data -teknologioilla suunnitelluilla järjestelmillä. Näissä uusissa järjestelmissä käytetään Big Dataa ja luonnollisen kielen käsittelytekniikoita kuluttajien vastausten lukemiseen ja arvioimiseen.
- Tuotteeseen/palveluihin mahdollisesti kohdistuvan riskin varhainen tunnistaminen
- Parempi toiminnan tehokkuus
Big Data -teknologioiden avulla voidaan luoda uusille tiedoille pysähdysalue tai laskeutumisalue ennen kuin määritellään, mitä dataa pitäisi siirtää tietovarasto. Lisäksi tällainen Big Data -teknologioiden ja tietovaraston integrointi auttaa organisaatiota purkamaan harvoin käytettyä dataa.
Yhteenveto
- Big Datan määritelmä: Big Data tarkoittaa valtavaa dataa. Bigdata on termi, jota käytetään kuvaamaan tietokokoelmaa, joka on kooltaan valtava ja joka kuitenkin kasvaa eksponentiaalisesti ajan myötä.
- Big Datan analytiikan esimerkkejä ovat pörssit, sosiaalisen median sivustot, suihkumoottorit jne.
- Big Data voi olla 1) jäsenneltyä, 2) jäsentämätöntä, 3) puolirakenteista
- Volyymi, vaihtelu, nopeus ja vaihtelevuus ovat harvoja Big Datan ominaisuuksia
- Parempi asiakaspalvelu, parempi toiminnan tehokkuus, parempi päätöksenteko ovat muutamia Bigdatan etuja