Mis on mõõtmete modelleerimine andmelaos? Õppige tüüpe

Mõõtmeline modelleerimine

Dimensiooniline modelleerimine (DM) on andmehoidlas andmete salvestamiseks optimeeritud andmestruktuuri tehnika. Dimensioonide modelleerimise eesmärk on optimeerida andmebaasi andmete kiiremaks otsimiseks. Dimensioonilise modelleerimise kontseptsiooni töötas välja Ralph Kimball ja see koosneb "faktide" ja "mõõtmete" tabelitest.

Andmelaos olev dimensioonimudel on loodud andmelaos arvulise teabe (nt väärtused, saldod, loendused, kaalud jne) lugemiseks, kokkuvõtmiseks ja analüüsimiseks. Seevastu suhtemudelid on optimeeritud andmete lisamiseks, värskendamiseks ja kustutamiseks reaalajas võrgutehingute süsteemis.

Nendel dimensioonilistel ja relatsioonilistel mudelitel on ainulaadne andmete salvestamise viis, millel on konkreetsed eelised.

Näiteks relatsioonirežiimis vähendavad normaliseerimise ja ER mudelid andmete liiasust. Vastupidi, dimensioonimudel andmelaos korraldab andmed nii, et infot on lihtsam hankida ja aruandeid koostada.

Seetõttu kasutatakse mõõtmete mudeleid andmelaosüsteemid ja see ei sobi hästi relatsioonisüsteemide jaoks.

Mõõtmeandmete mudeli elemendid

Fakt

Faktid on teie äriprotsessi mõõtmised/mõõdikud või faktid. Müügi äriprotsessi puhul oleks mõõtmine kvartali müügiarv

mõõde

Dimensioon pakub äriprotsessi sündmust ümbritseva konteksti. Lihtsamalt öeldes annavad nad fakti, kes, mida, kus. Müügi äriprotsessis oleksid kvartali müüginumbrid dimensioonid

  • Kes – klientide nimed
  • Kus - Asukoht
  • Mis – toote nimi

Teisisõnu, mõõde on aken faktide teabe vaatamiseks.

Näitajad

Atribuudid on dimensiooni erinevad omadused dimensiooniandmete modelleerimisel.

Asukoha dimensioonis võivad atribuudid olla

  • riik
  • Riik
  • Sihtnumber jne.

Atribuute kasutatakse faktide otsimiseks, filtreerimiseks või klassifitseerimiseks. Dimensioonitabelid sisaldavad atribuute

Faktitabel

Faktitabel on mõõtmete modelleerimisel esmane tabel.

Faktitabel sisaldab

  1. Mõõtmised/faktid
  2. Mõõtmistabeli võõrvõti

Mõõtmete tabel

  • Dimensioonitabel sisaldab fakti mõõtmeid.
  • Need ühendatakse faktitabeliga võõrvõtme kaudu.
  • Mõõtmistabelid on denormeeritud tabelid.
  • Dimensiooniatribuudid on dimensioonitabeli erinevad veerud
  • Dimensions pakub faktide kirjeldavaid omadusi nende atribuutide abil
  • Mõõtmete arvule ei ole määratud piirangut
  • Dimensioon võib sisaldada ka ühte või mitut hierarhilist seost

Dimensioonide tüübid andmelaos

Järgmised on Dimensioonide tüübid andmelaos:

  • Vastav mõõde
  • Tugijalgade mõõde
  • Kahanenud mõõde
  • Rollimängu mõõde
  • Mõõtmed mõõtmete tabeliks
  • Rämpsu mõõde
  • Degenereerunud mõõde
  • Vahetatav mõõde
  • Sammu mõõde

Mõõtmete modelleerimise etapid

Teie mõõtmete modelleerimise loomise täpsus määrab teie andmelao rakendamise edukuse. Siin on juhised dimensioonimudeli loomiseks

  1. Tuvastage äriprotsess
  2. Teravuse tuvastamine (detailsuse tase)
  3. Määrake mõõtmed
  4. Tuvastage faktid
  5. Ehitage täht

Mudel peaks kirjeldama teie äriprotsessi Miks, Kui palju, Millal/Kus/Kes ja Mida

Mõõtmete modelleerimise etapid

1. samm) Tehke kindlaks äriprotsess

Tegeliku äriprotsessi tuvastamine, mida andmemaja peaks hõlmama. See võib olla turundus, müük, personal jne andmete analüüs organisatsiooni vajadustele. Äriprotsessi valik sõltub ka selle protsessi jaoks saadaolevate andmete kvaliteedist. See on andmemodelleerimisprotsessi kõige olulisem samm ja siin esinev rike võib põhjustada kaskaadseid ja parandamatuid defekte.

Äriprotsessi kirjeldamiseks võite kasutada lihtteksti või põhilist äriprotsesside modelleerimismärki (BPMN) või ühtset modelleerimiskeelt (UML).

2. samm) tuvastage tera

Grain kirjeldab äriprobleemi/lahenduse detailsust. See on teie andmelaos oleva mis tahes tabeli madalaima teabetaseme tuvastamise protsess. Kui tabel sisaldab iga päeva müügiandmeid, siis peaks see olema päevane detailsus. Kui tabel sisaldab iga kuu müügiandmeid, on sellel igakuine detailsus.

Selles etapis vastate küsimustele nagu

  1. Kas peame hoidma kõiki saadaolevaid tooteid või vaid mõnda tüüpi tooteid? See otsus põhineb Datawarehouse'i jaoks valitud äriprotsessidel
  2. Kas säilitame toote müügiteavet kuu, nädala, päeva või tunni kaupa? See otsus sõltub juhtide nõutavate aruannete olemusest
  3. Kuidas mõjutavad ülaltoodud kaks valikut andmebaasi suurust?

Teravilja näide:

MNC tegevjuht soovib iga päev leida konkreetsete toodete müüki erinevates kohtades.

Seega on teravili "toodete müügiteave asukoha järgi päevade kaupa".

3. samm) Määrake mõõtmed

Mõõtmed on nimisõnad nagu kuupäev, pood, inventar jne. Need mõõtmed on koht, kus kõik andmed tuleks salvestada. Näiteks võib kuupäeva dimensioon sisaldada selliseid andmeid nagu aasta, kuu ja nädalapäev.

Mõõtmete näide:

MNC tegevjuht soovib iga päev leida konkreetsete toodete müüki erinevates kohtades.

Mõõdud: Toode, asukoht ja aeg

Atribuudid: Toote jaoks: Tootevõti (välisvõti), nimi, tüüp, spetsifikatsioonid

Hierarhiad: Asukoha jaoks: riik, osariik, linn, aadress, nimi

4. samm) tuvastage fakt

See samm on seotud süsteemi ärikasutajatega, kuna see on koht, kus nad saavad juurdepääsu andmelaos salvestatud andmetele. Enamik faktitabeli ridu on arvväärtused, nagu hind või ühiku hind jne.

Näide faktidest:

MNC tegevjuht soovib iga päev leida konkreetsete toodete müüki erinevates kohtades.

Siin on müügisumma toodete kaupa asukoha ja aja järgi.

5. samm) koostage skeem

Selles etapis rakendate mõõtmete mudelit. Skeem pole midagi muud kui andmebaasi struktuur (tabelite paigutus). On kaks populaarset skeemi

  1. Täheskeem

Täheskeemi arhitektuuri on lihtne kujundada. Seda nimetatakse täheskeemiks, kuna diagramm meenutab tähte, mille punktid kiirgavad tsentrist. Tähe keskpunkt koosneb faktitabelitest ja tähe punktid on mõõtmete tabelid.

Faktitabelid täheskeemis, mis on kolmas normaalvorm, samas kui mõõtmetabelid on denormeeritud.

  1. Lumehelbe skeem

Lumehelbe skeem on täheskeemi laiendus. Lumehelbeskeemis normaliseeritakse iga mõõde ja ühendatakse rohkemate mõõtmete tabelitega.

Kontrollige ka: - Tähe ja lumehelbe skeem andmelaos mudelinäidetega

Mõõtmete modelleerimise reeglid

Järgmised on mõõtmete modelleerimise reeglid ja põhimõtted:

  • Laadige aatomiandmed dimensioonilistesse struktuuridesse.
  • Looge äriprotsesside ümber dimensioonilisi mudeleid.
  • Tuleb tagada, et igal faktitabelil oleks seotud kuupäeva dimensioonitabel.
  • Veenduge, et kõik ühes faktitabelis olevad faktid oleksid samal teralisusel või üksikasjalikkuse tasemel.
  • Aruandesildid ja domeeniväärtuste filtreerimine on oluline dimensioonitabelites
  • Peate tagama, et mõõtmete tabelid kasutaksid asendusvõtit
  • Pidevalt tasakaalustage nõudeid ja tegelikkust, et pakkuda ärilahendusi, mis toetavad nende otsuste tegemist

Mõõtmete modelleerimise eelised

  • Dimensioonide standardimine võimaldab hõlpsasti aruandlust koostada erinevates ärivaldkondades.
  • Mõõtmistabelid salvestavad mõõtmete teabe ajaloo.
  • See võimaldab tuua sisse täiesti uue mõõtme ilma suuremate häireteta faktitabelis.
  • Mõõtmeline ka andmete salvestamiseks sellisel viisil, et pärast andmete andmebaasi salvestamist on andmetest lihtsam teavet hankida.
  • Võrreldes normaliseeritud mudeliga on mõõtmete tabel lihtsam mõista.
  • Teave on rühmitatud selgetesse ja lihtsatesse ärikategooriatesse.
  • Dimensioonimudel on ettevõttele väga arusaadav. See mudel põhineb äritingimustel, nii et ettevõte teab, mida iga fakt, dimensioon või atribuut tähendab.
  • Mõõtmemudelid on deformeeritud ja optimeeritud kiireks andmepärimiseks. Paljud relatsiooniandmebaasi platvormid tunnevad selle mudeli ära ja optimeerivad jõudluse parandamiseks päringu täitmisplaane.
  • Mõõtmete modelleerimine andmelaos loob skeemi, mis on optimeeritud suure jõudluse jaoks. See tähendab vähem liitumisi ja aitab minimeerida andmete liiasust.
  • Dimensioonimudel aitab ka päringu jõudlust suurendada. See on rohkem denormaliseeritud, seetõttu on see päringute jaoks optimeeritud.
  • Mõõtmetega mudelid mahutavad mugavalt muutusi. Dimensioonitabelitele saab lisada rohkem veerge, ilma et see mõjutaks neid tabeleid kasutavaid olemasolevaid ärianalüüsi rakendusi.

Mis on andmelaos mitmemõõtmeline andmemudel?

Mitmemõõtmeline andmemudel andmeladu on mudel, mis esitab andmeid andmekuubikute kujul. See võimaldab modelleerida ja vaadata andmeid mitmes dimensioonis ning see on määratletud mõõtmete ja faktidega. Mitmemõõtmeline andmemudel liigitatakse üldiselt keskse teema ümber ja seda esindab faktitabel.

kokkuvõte

  • Dimensioonimudel on selleks optimeeritud andmestruktuuri tehnika Andmehoidla tööriistad.
  • Faktid on teie äriprotsessi mõõtmised/mõõdikud või faktid.
  • Dimensioon pakub äriprotsessi sündmust ümbritseva konteksti.
  • Atribuudid on mõõtmete modelleerimise erinevad omadused.
  • Faktitabel on mõõtmete mudeli esmane tabel.
  • Dimensioonitabel sisaldab fakti mõõtmeid.
  • Fakte on kolme tüüpi: 1. Lisand 2. Mitteaditiivne 3. Pooladitiivne.
  • Mõõtmete tüübid on vastavus, tugijalg, kahanenud, rollimäng, mõõtmete tabel, rämps, degenereerunud, vahetatav ja astmeline mõõde.
  • Mõõtmete modelleerimise viis etappi on 1. Äriprotsessi tuvastamine 2. Teravuse tuvastamine (detailsuse tase) 3. Dimensioonide tuvastamine 4. Faktide tuvastamine 5. Stari ehitamine
  • Andmelaos mõõtmete modelleerimise jaoks on vaja tagada, et igal faktitabelil oleks seotud kuupäeva dimensioonitabel.