Mikä Data Mart on Data Warehousessa? Tyypit ja esimerkki

Mikä Data Mart on?

A Data Mart on keskittynyt yhteen organisaation toiminnalliseen alueeseen ja sisältää osajoukon tietovarastoon tallennettuja tietoja. Data Mart on Data Warehousen tiivistetty versio, ja se on suunniteltu organisaation tietyn osaston, yksikön tai käyttäjäjoukon käyttöön. Esim. markkinointi, myynti, HR tai rahoitus. Sitä ohjaa usein yksi organisaation osasto.

Data Mart kerää tietoja yleensä vain muutamasta lähteestä tietovarastoon verrattuna. Datamarketit ovat kooltaan pieniä ja joustavampia kuin Datawarehouse.

Miksi tarvitsemme Data Martia?

  • Data Mart auttaa pidentämään käyttäjän vasteaikaa datamäärän vähenemisen vuoksi
  • Se tarjoaa helpon pääsyn usein pyydettyihin tietoihin.
  • Data mart on yksinkertaisempi toteuttaa verrattuna yrityksen Datawarehouseen. Samaan aikaan Data Martin käyttöönottokustannukset ovat varmasti alhaisemmat verrattuna täyden tietovaraston toteuttamiseen.
  • Data Warehouseen verrattuna datamart on ketterä. Jos mallia vaihdetaan, datamart voidaan rakentaa nopeammin pienemmän koon vuoksi.
  • Datamartin määrittelee yksi aiheasiantuntija. Päinvastoin, tietovaraston määrittelevät monitieteiset pk-yritykset useilta eri aloilta. Siksi Data mart on avoimempi muutokselle kuin Datawarehouse.
  • Tiedot on osioitu ja mahdollistaa erittäin yksityiskohtaiset kulunvalvontaoikeudet.
  • Tiedot voidaan segmentoida ja tallentaa eri laitteisto-/ohjelmistoalustoille.

Data Mart -tyypit

Datamartteja on kolme päätyyppiä:

  1. riippuvainen: Riippuvaiset tietomarkkinat luodaan ottamalla tietoja suoraan operatiivisista, ulkoisista tai molemmista lähteistä.
  2. Itsenäinen: Itsenäinen datakauppa luodaan ilman keskustietovaraston käyttöä.
  3. Hybridi: Tämän tyyppiset datamarkkinat voivat ottaa tietoja tietovarastoista tai käyttöjärjestelmistä.

Dependent Data Mart

Riippuvainen datakauppa mahdollistaa organisaation tietojen hankinnan yhdestä tietovarastosta. Se on yksi datamarkkinoiden esimerkkejä, joka tarjoaa keskittämisen edun. Jos sinun on kehitettävä yksi tai useampia fyysisiä tietomarkkinoita, sinun on määritettävä ne riippuvaisiksi datamarkkeiksi.

Dependent Data Mart tietovarastoon voidaan rakentaa kahdella eri tavalla. Joko siellä, missä käyttäjä pääsee tarpeesta riippuen sekä datakauppaan että tietovarastoon, tai missä pääsy on rajoitettu vain datakauppaan. Toinen lähestymistapa ei ole optimaalinen, koska se tuottaa joskus nimitystä dataromu. Dataromussa kaikki tiedot alkavat yhteisestä lähteestä, mutta ne romutetaan ja enimmäkseen romutetaan.

Dependent Data Mart
Dependent Data Mart

Independent Data Mart

Itsenäinen datakauppa luodaan ilman keskustietovaraston käyttöä. Tällainen Data Mart on ihanteellinen vaihtoehto organisaation pienemmille ryhmille.

Riippumattomalla datamarketilla ei ole suhdetta yrityksen tietovarastoon eikä mihinkään muuhun datakauppaan. Independent data martissa tiedot syötetään erikseen ja sen analyysit suoritetaan myös itsenäisesti.

Riippumattomien datamarkkinoiden toteuttaminen on ristiriidassa tietovaraston rakentamisen motivaation kanssa. Ensinnäkin tarvitset johdonmukaisen, keskitetyn yritystietojen varaston, jota useat käyttäjät, joilla on erilaisia ​​kiinnostuksen kohteita, voivat analysoida hyvin erilaisia ​​tietoja.

Independent Data Mart

Independent Data Mart

Hybrid Data Mart

Hybriditietokauppa yhdistää syötteet muista lähteistä kuin tietovarastosta. Tästä voi olla apua, kun haluat ad hoc -integroinnin, esimerkiksi sen jälkeen, kun organisaatioon on lisätty uusi ryhmä tai tuote.

Se on paras Data Mart -esimerkki, joka sopii useisiin tietokantaympäristöihin ja nopeaan käyttöönottovaiheeseen mille tahansa organisaatiolle. Se vaatii myös vähiten tietojen puhdistamista. Hybrid Data mart tukee myös suuria tallennusrakenteita, ja se soveltuu parhaiten joustavaan pienempiin tietokeskeisiin sovelluksiin.

Hybrid Data Mart

Hybrid Data Mart

Datamartin käyttöönottovaiheet

Datamartin käyttöönottovaiheet

Data Martin käyttöönotto on palkitseva mutta monimutkainen toimenpide. Tässä on yksityiskohtaiset vaiheet Data Martin käyttöönottamiseksi:

Suunnittelu

Suunnittelu on Data Mart -toteutuksen ensimmäinen vaihe. Se kattaa kaikki tehtävät datamartin pyynnön aloittamisesta vaatimuksia koskevien tietojen keräämiseen. Lopuksi luomme loogisen ja fyysisen Data Mart -suunnittelun.

Suunnitteluvaihe sisältää seuraavat tehtävät:

  • Liiketoiminnan ja teknisten vaatimusten kerääminen ja tietolähteiden tunnistaminen.
  • Sopivan tietojen osajoukon valitseminen.
  • Datamarketin loogisen ja fyysisen rakenteen suunnittelu.

Tiedot voidaan osioida seuraavien kriteerien perusteella:

  • Päivämäärä
  • Liiketoiminta- tai toiminnallinen yksikkö
  • Maantiede
  • Mikä tahansa yllä olevien yhdistelmä

Tiedot voidaan osioida sovellus- tai DBMS-tasolla. On kuitenkin suositeltavaa osioida sovellustasolla, koska se mahdollistaa erilaisia ​​tietomalleja joka vuosi liiketoimintaympäristön muuttuessa.

Mitä tuotteita ja tekniikoita tarvitset?

Yksinkertainen kynä ja paperi riittäisi. Vaikka työkaluja, jotka auttavat sinua luomaan UML tai ER-kaavio lisäisi myös metatietoja loogisiin ja fyysisiin suunnitelmiisi.

rakentamalla

Tämä on täytäntöönpanon toinen vaihe. Se sisältää luomisen fyysinen tietokanta ja loogiset rakenteet.

Tämä vaihe sisältää seuraavat tehtävät:

  • Aikaisemmassa vaiheessa suunnitellun fyysisen tietokannan toteuttaminen. Luodaan esimerkiksi tietokantaskeeman objekteja, kuten taulukoita, indeksejä, näkymiä jne.

Mitä tuotteita ja tekniikoita tarvitset?

Sinä tarvitset relaatiotietokannan hallintajärjestelmä rakentaa datamarket. RDBMS:ssä on useita ominaisuuksia, joita Data Martin menestyminen edellyttää.

  • Tallennuksen hallinta: RDBMS tallentaa ja hallitsee tietoja tietojen luomiseksi, lisäämiseksi ja poistamiseksi.
  • Nopea pääsy dataan: SQL-kyselyllä pääset helposti käsiksi tietoihin tiettyjen ehtojen/suodattimien perusteella.
  • Datan suojelu: RDBMS-järjestelmä tarjoaa myös tavan toipua järjestelmävioista, kuten sähkökatkoksista. Se mahdollistaa myös tietojen palauttamisen näistä varmuuskopioista, jos levy epäonnistuu.
  • Monen käyttäjän tuki: Tiedonhallintajärjestelmä tarjoaa samanaikaisen pääsyn, useiden käyttäjien mahdollisuuden päästä käsiksi ja muokata tietoja häiritsemättä tai korvaamatta toisen käyttäjän tekemiä muutoksia.
  • Turvallisuus: RDMS-järjestelmä tarjoaa myös tavan säädellä käyttäjien pääsyä esineisiin ja tietyntyyppisiin toimintoihin.

asuttavat

Kolmannessa vaiheessa tiedot täytetään datakauppaan.

Täyttövaihe sisältää seuraavat tehtävät:

  • Lähdetiedot kohdetietojen kartoitukseen
  • Lähdetietojen purkaminen
  • Tietojen puhdistus- ja muunnostoiminnot
  • Ladataan tietoja datakauppaan
  • Metatietojen luominen ja tallentaminen

Mitä tuotteita ja tekniikoita tarvitset?

Suoritat nämä populaatiotehtävät käyttämällä ETL (Extract Transform Load) -työkalu. Tämän työkalun avulla voit tarkastella tietolähteitä, suorittaa lähteen ja kohteen välisen kartoituksen, poimia tiedot, muuntaa, puhdistaa ne ja ladata sen takaisin tietokauppaan.

Prosessin aikana työkalu luo myös metatietoja, jotka liittyvät esimerkiksi siihen, mistä tiedot ovat peräisin, kuinka tuoretta ne ovat, minkä tyyppisiä muutoksia dataan on tehty ja minkä tasoinen yhteenveto on tehty.

pääsy

Pääsy on neljäs vaihe, joka sisältää tietojen käyttöönoton: tiedoista kyselyn, raporttien, kaavioiden luomisen ja niiden julkaisemisen. Loppukäyttäjä lähettää kyselyt tietokantaan ja näyttää kyselyiden tulokset

Käyttövaiheen on suoritettava seuraavat tehtävät:

  • Määritä metakerros, joka muuntaa tietokantarakenteet ja objektien nimet liiketoimintatermeiksi. Tämä auttaa ei-teknisiä käyttäjiä pääsemään Data martiin helposti.
  • Luoda ja ylläpitää tietokantarakenteita.
  • Määritä tarvittaessa API ja rajapinnat

Mitä tuotteita ja tekniikoita tarvitset?

Pääset datakauppaan komentorivin tai graafisen käyttöliittymän avulla. GUI on suositeltava, koska se voi helposti luoda kaavioita ja on käyttäjäystävällinen verrattuna komentoriville.

Hallinta

Tämä on Data Mart -toteutusprosessin viimeinen vaihe. Tämä vaihe kattaa hallintotehtävät, kuten

  • Jatkuva käyttöoikeuksien hallinta.
  • Järjestelmän optimointi ja hienosäätö paremman suorituskyvyn saavuttamiseksi.
  • Tuoreen tiedon lisääminen ja hallinta datakauppaan.
  • Suunnittele toipumisskenaariot ja varmista järjestelmän saatavuus, jos järjestelmä epäonnistuu.

Mitä tuotteita ja tekniikoita tarvitset?

Voit käyttää graafista käyttöliittymää tai komentoriviä datamarkkinoiden hallintaan.

Data Martsin käyttöönoton parhaat käytännöt

Seuraavat ovat parhaat käytännöt, joita sinun on noudatettava Data Mart -käyttöönottoprosessin aikana:

  • Data Martin lähteen tulee olla osastojen mukainen
  • Data Martin toteutussykliä tulisi mitata lyhyissä ajanjaksoissa, eli viikkoissa kuukausien tai vuosien sijaan.
  • On tärkeää ottaa kaikki sidosryhmät mukaan suunnittelu- ja suunnitteluvaiheeseen, koska datamarkkinoiden toteutus voi olla monimutkaista.
  • Data Mart -laitteisto-/ohjelmisto-, verkko- ja toteutuskustannukset tulee budjetoida tarkasti suunnitelmaasi
  • Vaikka Data mart on luotu samalle laitteistolle, ne saattavat tarvita eri ohjelmistoja käyttäjien kyselyjen käsittelemiseen. Lisäkäsittelytehoa ja levytallennusvaatimuksia tulee arvioida, jotta käyttäjä reagoi nopeasti
  • Datakauppa voi olla eri paikassa kuin tietovarasto. Siksi on tärkeää varmistaa, että heillä on tarpeeksi verkkokapasiteettia käsittelemään datamäärät, joita tarvitaan tiedon siirtämiseen datakauppaan.
  • Käyttöönottokustannusten tulisi budjetoida Datamartin latausprosessiin kuluva aika. Latausaika pitenee muunnosten monimutkaisuuden kasvaessa.

Data Martin edut ja haitat

edut

  • Datamarkkinat sisältävät osajoukon organisaation laajuisia tietoja. Nämä tiedot ovat arvokkaita tietylle organisaation ihmisryhmälle.
  • Se on kustannustehokas vaihtoehto a tietovarasto, jonka rakentaminen voi vaatia korkeita kustannuksia.
  • Data Mart mahdollistaa nopeamman pääsyn dataan.
  • Data Mart on helppokäyttöinen, koska se on suunniteltu erityisesti käyttäjiensä tarpeisiin. Näin datamarkkinat voivat nopeuttaa liiketoimintaprosesseja.
  • Data Marts tarvitsee vähemmän käyttöönottoaikaa verrattuna Data Warehouse -järjestelmiin. Data Mart on nopeampi toteuttaa, koska sinun tarvitsee vain keskittää datan ainoa osajoukko.
  • Se sisältää historiallisia tietoja, joiden avulla analyytikko voi määrittää datatrendejä.

Haitat

  • Usein yritykset luovat liian monia erilaisia ​​ja toisiinsa liittymättömiä datamarkkinoita ilman suurta hyötyä. Siitä voi tulla suuri este säilyttää.
  • Data Mart ei voi tarjota koko yrityksen tietojen analysointi koska niiden tietokanta on rajallinen.

Yhteenveto

  • Määritä Data Mart : Data Mart määritellään Data Warehousen osajoukoksi, joka keskittyy organisaation yhteen toiminnalliseen alueeseen.
  • Data Mart auttaa pidentämään käyttäjän vasteaikaa datamäärän vähenemisen vuoksi.
  • Kolmen tyyppisiä datamarkkinoita ovat 1) riippuvainen 2) riippumaton 3) hybridi
  • Data Martin tärkeitä käyttöönottovaiheita ovat 1) Suunnittelu 2) Rakentaminen 3 Täyttö 4) Pääsy ja 5) Hallinta
  • Data Martin toteutussykliä tulisi mitata lyhyissä ajanjaksoissa, eli viikkoissa kuukausien tai vuosien sijaan.
  • Data mart on kustannustehokas vaihtoehto tietovarastolle, jonka rakentaminen voi vaatia korkeita kustannuksia.
  • Data Mart ei voi tarjota koko yrityksen data-analyysiä, koska tietojoukko on rajallinen.