Hva er dimensjonsmodellering i datavarehus? Lær typer

Dimensjonsmodellering

Dimensjonsmodellering (DM) er en datastrukturteknikk optimalisert for datalagring i et datavarehus. Hensikten med dimensjonsmodellering er å optimalisere databasen for raskere gjenfinning av data. Konseptet med dimensjonsmodellering ble utviklet av Ralph Kimball og består av "fakta" og "dimensjons"-tabeller.

En dimensjonsmodell i datavarehus er designet for å lese, oppsummere, analysere numerisk informasjon som verdier, balanser, tellinger, vekter osv. i et datavarehus. I motsetning til dette er relasjonsmodeller optimalisert for tillegg, oppdatering og sletting av data i et sanntids Online Transaction System.

Disse dimensjonelle og relasjonsmodellene har sin unike måte for datalagring som har spesifikke fordeler.

For eksempel, i relasjonsmodus reduserer normalisering og ER-modeller redundans i data. Tvert imot, dimensjonsmodell i datavarehus ordner data på en slik måte at det er lettere å hente informasjon og generere rapporter.

Derfor brukes dimensjonsmodeller i datavarehussystemer og passer ikke godt for relasjonssystemer.

Elementer i dimensjonsdatamodellen

Faktum

Fakta er målingene/beregningene eller fakta fra forretningsprosessen din. For en salgsforretningsprosess vil en måling være kvartalsvis salgsnummer

Dimensjon

Dimension gir konteksten rundt en forretningsprosesshendelse. Enkelt sagt gir de hvem, hva, hvor av et faktum. I Sales forretningsprosessen, for faktum kvartalsvis salgsnummer, ville dimensjoner være

  • Hvem – Kundenavn
  • Hvor – Plassering
  • Hva – Produktnavn

Med andre ord er en dimensjon et vindu for å se informasjon i fakta.

attributter

Attributtene er de ulike egenskapene til dimensjonen i dimensjonal datamodellering.

I Location-dimensjonen kan attributtene være

  • Tilstand
  • Land
  • Postnummer osv.

Attributter brukes til å søke, filtrere eller klassifisere fakta. Dimensjonstabeller inneholder attributter

Faktatabell

En faktatabell er en primærtabell i dimensjonsmodellering.

En faktatabell inneholder

  1. Mål/fakta
  2. Fremmednøkkel til dimensjonstabell

Dimensjonstabell

  • En dimensjonstabell inneholder dimensjoner av et faktum.
  • De er koblet til faktatabellen via en fremmednøkkel.
  • Dimensjonstabeller er de-normaliserte tabeller.
  • Dimensjonsattributtene er de forskjellige kolonnene i en dimensjonstabell
  • Dimensjoner tilbyr beskrivende egenskaper ved fakta ved hjelp av deres attributter
  • Ingen satt grense for gitt for antall dimensjoner
  • Dimensjonen kan også inneholde en eller flere hierarkiske relasjoner

Typer dimensjoner i datavarehus

Følgende er Typer dimensjoner i datavarehus:

  • Tilpasset dimensjon
  • Utrigger dimensjon
  • Krympet dimensjon
  • Rollespilldimensjon
  • Dimensjon til dimensjonstabell
  • Søppeldimensjon
  • Degenerert dimensjon
  • Byttbar dimensjon
  • Trinndimensjon

Trinn for dimensjonsmodellering

Nøyaktigheten i å lage din dimensjonsmodellering avgjør suksessen til implementeringen av datavarehus. Her er trinnene for å lage dimensjonsmodell

  1. Identifiser forretningsprosessen
  2. Identifiser korn (detaljnivå)
  3. Identifiser dimensjoner
  4. Identifiser fakta
  5. Bygg stjerne

Modellen skal beskrive hvorfor, hvor mye, når/hvor/hvem og hva i forretningsprosessen din

Trinn for dimensjonsmodellering

Trinn 1) Identifiser forretningsprosessen

Identifisere den faktiske forretningsprosessen et datahus skal dekke. Dette kan være markedsføring, salg, HR, etc. i henhold til dataanalyse organisasjonens behov. Valget av forretningsprosessen avhenger også av kvaliteten på dataene som er tilgjengelige for den prosessen. Det er det viktigste trinnet i datamodelleringsprosessen, og en feil her vil ha kaskadende og uopprettelige defekter.

For å beskrive forretningsprosessen kan du bruke ren tekst eller bruke grunnleggende Business Process Modeling Notation (BPMN) eller Unified Modeling Language (UML).

Trinn 2) Identifiser kornet

Kornet beskriver detaljnivået for forretningsproblemet/løsningen. Det er prosessen med å identifisere det laveste informasjonsnivået for en hvilken som helst tabell i datavarehuset ditt. Hvis en tabell inneholder salgsdata for hver dag, bør det være daglig granularitet. Hvis en tabell inneholder totale salgsdata for hver måned, har den månedlig granularitet.

I løpet av denne fasen svarer du på spørsmål som

  1. Trenger vi å lagre alle tilgjengelige produkter eller bare noen få typer produkter? Denne beslutningen er basert på forretningsprosessene som er valgt for Datawarehouse
  2. Lagrer vi produktsalgsinformasjonen på månedlig, ukentlig, daglig eller timebasis? Denne avgjørelsen avhenger av arten av rapporter etterspurt av ledere
  3. Hvordan påvirker de to valgene ovenfor databasestørrelsen?

Eksempel på korn:

Administrerende direktør ved en MNC ønsker å finne salget for spesifikke produkter på forskjellige steder på daglig basis.

Så kornet er "informasjon om produktsalg etter sted etter dag."

Trinn 3) Identifiser dimensjonene

Dimensjoner er substantiv som dato, butikk, inventar osv. Disse dimensjonene er der alle data skal lagres. Datodimensjonen kan for eksempel inneholde data som år, måned og ukedag.

Eksempel på dimensjoner:

Administrerende direktør ved en MNC ønsker å finne salget for spesifikke produkter på forskjellige steder på daglig basis.

Dimensjoner: Produkt, Sted og Tid

Attributter: For produkt: Produktnøkkel (utenlandsk nøkkel), navn, type, spesifikasjoner

Hierarkier: For sted: land, stat, by, gateadresse, navn

Trinn 4) Identifiser fakta

Dette trinnet er co-assosiert med forretningsbrukerne av systemet fordi det er her de får tilgang til data som er lagret i datavarehuset. De fleste faktatabellradene er numeriske verdier som pris eller kostnad per enhet, etc.

Eksempel på fakta:

Administrerende direktør ved en MNC ønsker å finne salget for spesifikke produkter på forskjellige steder på daglig basis.

Faktum her er summen av salg etter produkt etter sted etter tid.

Trinn 5) Bygg skjema

I dette trinnet implementerer du dimensjonsmodellen. Et skjema er ikke annet enn databasestrukturen (arrangement av tabeller). Det er to populære skjemaer

  1. Stjerneskjema

Stjerneskjemaarkitekturen er enkel å designe. Det kalles et stjerneskjema fordi diagrammet ligner en stjerne, med punkter som stråler ut fra et senter. Stjernens sentrum består av faktatabellen, og punktene til stjernen er dimensjonstabeller.

Faktatabellene i et stjerneskjema som er tredje normalform, mens dimensjonstabeller er denormalisert.

  1. Snøfnuggskjema

Snøfnuggskjemaet er en utvidelse av stjerneskjemaet. I et snøfnuggskjema er hver dimensjon normalisert og koblet til flere dimensjonstabeller.

Sjekk også: - Stjerne- og snøfnuggskjema i datavarehus med modelleksempler

Regler for dimensjonsmodellering

Følgende er reglene og prinsippene for dimensjonsmodellering:

  • Last inn atomdata i dimensjonale strukturer.
  • Bygg dimensjonsmodeller rundt forretningsprosesser.
  • Må sørge for at hver faktatabell har en tilknyttet datodimensjonstabell.
  • Sørg for at alle fakta i en enkelt faktatabell er på samme detalj eller detaljnivå.
  • Det er viktig å lagre rapportetiketter og filtrere domeneverdier i dimensjonstabeller
  • Må sørge for at dimensjonstabeller bruker en surrogatnøkkel
  • Kontinuerlig balansere krav og realiteter for å levere forretningsløsninger for å støtte deres beslutningstaking

Fordeler med dimensjonsmodellering

  • Standardisering av dimensjoner gjør det enkelt å rapportere på tvers av virksomhetens områder.
  • Dimensjonstabeller lagrer historien til dimensjonsinformasjonen.
  • Det gjør det mulig å introdusere en helt ny dimensjon uten store forstyrrelser i faktatabellen.
  • Dimensjonalt også for å lagre data på en slik måte at det er lettere å hente informasjonen fra dataene når først dataene er lagret i databasen.
  • Sammenlignet med den normaliserte modellen er dimensjonstabellen lettere å forstå.
  • Informasjon er gruppert i klare og enkle forretningskategorier.
  • Den dimensjonale modellen er veldig forståelig for virksomheten. Denne modellen er basert på forretningsvilkår, slik at virksomheten vet hva hvert faktum, hver dimensjon eller egenskap betyr.
  • Dimensjonsmodeller er deformalisert og optimalisert for rask dataspørring. Mange relasjonsdatabaseplattformer gjenkjenner denne modellen og optimerer utførelsesplaner for spørringer for å hjelpe til med ytelsen.
  • Dimensjonsmodellering i datavarehus skaper et skjema som er optimalisert for høy ytelse. Det betyr færre tilkoblinger og hjelper med minimert dataredundans.
  • Dimensjonsmodellen bidrar også til å øke søkeytelsen. Den er mer denormalisert, derfor er den optimalisert for spørring.
  • Dimensjonsmodeller kan komfortabelt ta imot endringer. Dimensjonstabeller kan ha flere kolonner lagt til uten å påvirke eksisterende business intelligence-applikasjoner som bruker disse tabellene.

Hva er multidimensjonal datamodell i datavarehus?

Flerdimensjonal datamodell i datavarehus er en modell som representerer data i form av datakuber. Den lar deg modellere og se dataene i flere dimensjoner, og den er definert av dimensjoner og fakta. Flerdimensjonal datamodell er generelt kategorisert rundt et sentralt tema og representert av en faktatabell.

Sammendrag

  • En dimensjonsmodell er en datastrukturteknikk optimalisert for Datavarehusverktøy.
  • Fakta er målingene/beregningene eller fakta fra forretningsprosessen din.
  • Dimension gir konteksten rundt en forretningsprosesshendelse.
  • Attributter er de ulike egenskapene til dimensjonsmodelleringen.
  • En faktatabell er en primærtabell i en dimensjonsmodell.
  • En dimensjonstabell inneholder dimensjoner av et faktum.
  • Det er tre typer fakta 1. Additiv 2. Ikke-additiv 3. Semi-additiv.
  • Typer av dimensjoner er konformert, utrigger, krympet, rollespill, dimensjon til dimensjonstabell, søppel, degenerert, byttebar og trinndimensjon.
  • Fem trinn i dimensjonsmodellering er 1. Identifiser forretningsprosess 2. Identifiser korn (detaljnivå) 3. Identifiser dimensjoner 4. Identifiser fakta 5. Bygg stjerne
  • For dimensjonsmodellering i datavarehus er det behov for å sikre at hver faktatabell har en tilknyttet datodimensjonstabell.