Mis on Data Mart andmelaos? Tüübid ja näide

Mis on Data Mart?

A Andmed Mart on keskendunud organisatsiooni ühele funktsionaalsele valdkonnale ja sisaldab andmelaos salvestatud andmete alamhulka. Data Mart on Data Warehouse'i lühendatud versioon ja see on mõeldud kasutamiseks organisatsiooni kindlale osakonnale, üksusele või kasutajate rühmale. Nt turundus, müük, personal või rahandus. Sageli kontrollib seda organisatsiooni üks osakond.

Võrreldes andmelaoga, ammutab Data Mart andmeid tavaliselt vähestest allikatest. Andmekeskused on väikese suurusega ja paindlikumad võrreldes andmehoidlaga.

Miks me vajame Data Mart?

  • Data Mart aitab andmemahu vähenemise tõttu pikendada kasutaja reageerimisaega
  • See pakub lihtsat juurdepääsu sageli nõutavatele andmetele.
  • Data marti on ettevõtte Datawarehouse'iga võrreldes lihtsam rakendada. Samas on Data Mardi juurutamise maksumus kindlasti madalam võrreldes täisandmelao juurutamisega.
  • Võrreldes Data Warehouse'iga on datamart vilgas. Mudeli muutumise korral saab Datamarti väiksema suuruse tõttu kiiremini üles ehitada.
  • Datamarti määrab üks aineekspert. Vastupidi, andmeladu on määratletud erinevate valdkondade interdistsiplinaarsete VKEde poolt. Seetõttu on Data mart Datawarehouse'iga võrreldes muutustele avatum.
  • Andmed on jaotatud ja võimaldavad väga üksikasjalikke juurdepääsukontrolli õigusi.
  • Andmeid saab segmenteerida ja salvestada erinevatele riist-/tarkvaraplatvormidele.

Andmete Mart tüübid

Andmemargi on kolm peamist tüüpi:

  1. Sõltuv: Sõltuvad andmemargid luuakse andmete otse töö-, välis- või mõlemast allikast ammutades.
  2. Sõltumatu: Sõltumatu andmemart luuakse ilma keskset andmeladu kasutamata.
  3. hübriid: seda tüüpi andmekeskused võivad võtta andmeid andmeladudest või operatsioonisüsteemidest.

Dependent Data Mart

Sõltuv andmemarket võimaldab hankida organisatsiooni andmeid ühest andmelaost. See on üks andmeturu näidetest, mis pakub tsentraliseerimise eeliseid. Kui teil on vaja välja töötada üks või mitu füüsilist andmekeskust, peate need konfigureerima sõltuvate andmekeskustena.

Dependent Data Mart andmelaos saab ehitada kahel erineval viisil. Kas siis, kui kasutaja pääseb vastavalt vajadusele juurde nii andmeturule kui ka andmelaole või kus juurdepääs on piiratud ainult andmeturuga. Teine lähenemisviis ei ole optimaalne, kuna see toodab mõnikord andmeprügiks. Andmeprügikojas algavad kõik andmed ühisest allikast, kuid need lammutatakse ja enamasti rämpsutakse.

Dependent Data Mart
Dependent Data Mart

Independent Data Mart

Sõltumatu andmemarket luuakse ilma keskse andmelao kasutamiseta. Selline Data Mart on ideaalne võimalus organisatsiooni väiksematele gruppidele.

Sõltumatul andmeturul ei ole seost ettevõtte andmelao ega ühegi teise andmemargiga. Independent data martis sisestatakse andmed eraldi ning selle analüüsid tehakse ka autonoomselt.

Sõltumatute andmeturgude rakendamine on vastuolus andmelao ehitamise motivatsiooniga. Esiteks on teil vaja ühtset tsentraliseeritud ettevõtteandmete salvestusruumi, mida saavad analüüsida mitmed erinevate huvidega kasutajad, kes soovivad saada väga erinevat teavet.

Independent Data Mart

Independent Data Mart

Hübriidandmete Mart

Hübriidandmete mart ühendab sisendi, mis pärineb allikatest peale andmelao. See võib olla kasulik, kui soovite ad hoc integratsiooni, näiteks pärast uue rühma või toote lisamist organisatsiooni.

See on parim andmemargi näide, mis sobib mitmesse andmebaasikeskkonda ja mis tahes organisatsiooni kiireks juurutamiseks. See nõuab ka kõige vähem andmete puhastamise jõupingutusi. Hübriidandmete mart toetab ka suuri salvestusstruktuure ja sobib kõige paremini paindlikuks väiksemate andmekesksete rakenduste jaoks.

Hübriidandmete Mart

Hübriidandmete Mart

Datamarti juurutamise sammud

Datamarti juurutamise sammud

Data Mart'i juurutamine on rahuldust pakkuv, kuid keeruline protseduur. Siin on üksikasjalikud sammud Data Mart'i juurutamiseks.

Projekteerimine

Projekteerimine on Data Mart'i juurutamise esimene etapp. See hõlmab kõiki ülesandeid alates andmemargi päringu algatamisest kuni nõuete kohta teabe kogumiseni. Lõpuks loome loogilise ja füüsilise Data Mart kujunduse.

Disainietapp hõlmab järgmisi ülesandeid:

  • Äri- ja tehniliste nõuete kogumine ning andmeallikate tuvastamine.
  • Sobiva andmete alamhulga valimine.
  • Andmemargi loogilise ja füüsilise struktuuri kujundamine.

Andmeid saab jagada järgmiste kriteeriumide alusel:

  • kuupäev
  • Äri- või funktsionaalüksus
  • Geograafia
  • Mis tahes ülaltoodud kombinatsioon

Andmeid saab jagada rakenduse või DBMS-i tasemel. Kuigi on soovitatav sektsioonida rakenduse tasemel, kuna see võimaldab igal aastal erinevaid andmemudeleid vastavalt ärikeskkonna muutumisele.

Milliseid tooteid ja tehnoloogiaid vajate?

Piisaks lihtsast pliiatsist ja paberist. Kuigi tööriistad, mis aitavad teil luua UML-i või ER diagramm lisab teie loogilistele ja füüsilistele kujundustele ka metaandmeid.

Ehitamine

See on rakendamise teine ​​etapp. See hõlmab loomist füüsiline andmebaas ja loogilised struktuurid.

See samm hõlmab järgmisi ülesandeid:

  • Varasemas etapis kavandatud füüsilise andmebaasi juurutamine. Näiteks luuakse andmebaasiskeemi objektid, nagu tabel, indeksid, vaated jne.

Milliseid tooteid ja tehnoloogiaid vajate?

Sa pead a relatsioonilise andmebaasi haldussüsteem andmeturu konstrueerimiseks. RDBMS-il on mitu funktsiooni, mis on Data Mart'i edu saavutamiseks vajalikud.

  • Salvestusruumi haldamine: RDBMS salvestab ja haldab andmeid andmete loomiseks, lisamiseks ja kustutamiseks.
  • Kiire juurdepääs andmetele: SQL-päringuga pääsete hõlpsalt juurde teatud tingimustel/filtritel põhinevatele andmetele.
  • Andmekaitse: RDBMS-süsteem pakub ka võimalust süsteemitõrgetest (nt voolukatkestusest) taastumiseks. Samuti võimaldab see ketta rikke korral nendest varukoopiatest andmeid taastada.
  • Mitme kasutaja tugi: Andmehaldussüsteem pakub samaaegset juurdepääsu, mitme kasutaja võimalust andmetele juurde pääseda ja neid muuta ilma teise kasutaja tehtud muudatusi segamata või üle kirjutamata.
  • Turvalisus: RDMS-süsteem pakub ka võimalust reguleerida kasutajate juurdepääsu objektidele ja teatud tüüpi toimingutele.

Asustamine

Kolmandas faasis sisestatakse andmed andmeturule.

Täitmise etapp hõlmab järgmisi ülesandeid:

  • Lähteandmed sihtandmete kaardistamiseks
  • Lähteandmete väljavõtmine
  • Andmete puhastamise ja teisendamise toimingud
  • Andmete laadimine andmeturule
  • Metaandmete loomine ja salvestamine

Milliseid tooteid ja tehnoloogiaid vajate?

Saate need populatsiooniülesanded täita kasutades ETL (Extract Transform Load) tööriist. See tööriist võimaldab teil vaadata andmeallikaid, teostada allika ja sihtmärgi vastendamist, eraldada andmeid, teisendada, puhastada ja laadida need uuesti andmeturule.

Protsessi käigus loob tööriist ka metaandmeid, mis on seotud selliste asjadega nagu kust andmed pärinevad, kui hiljutised need on, millist tüüpi muudatusi andmetes tehti ja millisel tasemel tehti kokkuvõte.

Juurdepääs

Juurdepääs on neljas samm, mis hõlmab andmete kasutuselevõttu: andmete päringuid, aruannete, diagrammide loomist ja nende avaldamist. Lõppkasutaja esitab päringuid andmebaasi ja kuvab päringute tulemused

Juurdepääsuetapp peab täitma järgmised toimingud:

  • Seadistage metakiht, mis tõlgib andmebaasistruktuurid ja objektide nimed äriterminiteks. See aitab mittetehnilistel kasutajatel andmemargile hõlpsasti juurde pääseda.
  • Andmebaasistruktuuride seadistamine ja hooldamine.
  • Vajadusel seadistage API ja liidesed

Milliseid tooteid ja tehnoloogiaid vajate?

Andmemargile pääsete juurde käsurea või GUI abil. Eelistatud on GUI, kuna see suudab hõlpsasti graafikuid genereerida ja on käsureaga võrreldes kasutajasõbralik.

Juhtiv

See on Data Mart juurutamisprotsessi viimane samm. See samm hõlmab juhtimisülesandeid, nagu

  • Pidev kasutaja juurdepääsu haldamine.
  • Süsteemi optimeerimine ja peenhäälestus parema jõudluse saavutamiseks.
  • Värskete andmete lisamine ja haldamine andmeturule.
  • Taastestsenaariumide kavandamine ja süsteemi käideldavuse tagamine süsteemi rikke korral.

Milliseid tooteid ja tehnoloogiaid vajate?

Andmeturu haldamiseks võite kasutada GUI-d või käsurida.

Data Martsi juurutamise parimad tavad

Allpool on toodud parimad tavad, mida peate Data Mart'i juurutamisprotsessis järgima.

  • Data Mardi allikas peaks olema osakondade kaupa üles ehitatud
  • Data Mardi juurutustsüklit tuleks mõõta lühikestes ajavahemikes, st kuude või aastate asemel nädalates.
  • Oluline on kaasata kõik sidusrühmad planeerimis- ja projekteerimisfaasi, kuna andmemargi juurutamine võib olla keeruline.
  • Data Mart Riist-/tarkvara-, võrgu- ja juurutuskulud peaksid olema teie plaanis täpselt eelarvestatud
  • Isegi kui Data mart luuakse samal riistvaral, võivad nad kasutajate päringute käsitlemiseks vajada erinevat tarkvara. Kasutaja kiire reageerimise huvides tuleks hinnata täiendavaid töötlemisvõimsuse ja kettasalvestusnõudeid
  • Andmemarket võib asuda andmelaost erinevas asukohas. Sellepärast on oluline tagada, et neil oleks piisavalt võrguvõimsust, et käsitleda andmemahtusid, mis on vajalikud andmete edastamiseks andmeturule..
  • Rakenduskulud peaksid arvestama Datamarti laadimisprotsessi ajakulu. Laadimisaeg pikeneb teisenduste keerukuse suurenedes.

Data Mart'i eelised ja puudused

Eelised

  • Andmemargid sisaldavad alamhulka kogu organisatsiooni hõlmavaid andmeid. Need andmed on väärtuslikud organisatsiooni kindlale inimrühmale.
  • See on kulutõhus alternatiiv a andmekogus, mille ehitamine võib võtta suuri kulutusi.
  • Data Mart võimaldab andmetele kiiremat juurdepääsu.
  • Data Mart on lihtne kasutada, kuna see on loodud spetsiaalselt selle kasutajate vajadustele. Seega võib andmemarket kiirendada äriprotsesse.
  • Data Marts vajab vähem juurutusaega võrreldes Data Warehouse süsteemidega. Data Mart'i juurutamine on kiirem, kuna peate koondama ainult andmete ainsa alamhulga.
  • See sisaldab ajaloolisi andmeid, mis võimaldavad analüütikul määrata andmete suundumusi.

Puudused

  • Sageli loovad ettevõtted liiga palju erinevaid ja omavahel mitteseotud andmeturte, ilma et sellest palju kasu oleks. Selle säilitamine võib muutuda suureks takistuseks.
  • Data Mart ei suuda pakkuda kogu ettevõtet andmete analüüs kuna nende andmekogum on piiratud.

kokkuvõte

  • Define Data Mart : Data Mart on määratletud kui andmelao alamhulk, mis on keskendunud organisatsiooni ühele funktsionaalsele piirkonnale.
  • Data Mart aitab andmemahu vähenemise tõttu pikendada kasutaja reageerimisaega.
  • Kolme tüüpi andmemart on 1) sõltuv 2) sõltumatu 3) hübriid
  • Data Mart'i olulised juurutamise etapid on 1) kujundamine 2) ehitamine 3 täitmine 4) juurdepääs ja 5) haldamine
  • Data Mardi juurutustsüklit tuleks mõõta lühikestes ajavahemikes, st kuude või aastate asemel nädalates.
  • Data mart on andmelao kulutõhus alternatiiv, mille ehitamine võib võtta palju kulusid.
  • Data Mart ei saa pakkuda kogu ettevõtte andmete analüüsi, kuna andmekogum on piiratud.