Hva er Star Schema i datavarehusmodellering?
Hva er et stjerneskjema?
Stjerneskjema i datavarehus, er et skjema der midten av stjernen kan ha én faktatabell og en rekke tilhørende dimensjonstabeller. Det er kjent som stjerneskjema da dets struktur ligner en stjerne. Star Schema-datamodellen er den enkleste typen Data Warehouse-skjema. Det er også kjent som Star Join Schema og er optimalisert for spørring i store datasett.
Hva er flerdimensjonalt skjema?
Flerdimensjonalt skjema er spesielt utviklet for å modellere datavarehussystemer. Skjemaene er designet for å møte de unike behovene til svært store databaser designet for analytiske formål (OLAP).
Typer datavarehusskjema:
Følgende er 3 hovedtyper av flerdimensjonale skjemaer som hver har sine unike fordeler.
- Stjerneskjema
- Snøfnuggskjema
- Galaxy -skjema
Eksempel på stjerneskjemadatamodellering
I det følgende Star Schema-eksemplet er faktatabellen i sentrum som inneholder nøkler til hver dimensjonstabell som Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID og andre attributter som solgte enheter og inntekter.
Faktatabeller
En faktatabell i et stjerneskjema inneholder fakta og er knyttet til dimensjoner. En faktatabell har to typer kolonner:
- En kolonne som inneholder fakta
- Fremmednøkkel til dimensjonstabell
Generelt er primærnøkkelen til en faktatabell en sammensatt nøkkel som består av alle fremmednøklene som utgjør tabellen.
Faktatabeller kan inneholde fakta på detaljnivå eller aggregerte fakta. Faktatabeller som inkluderer aggregerte fakta kalles ofte oppsummeringstabeller. Faktatabeller inneholder vanligvis fakta som er aggregert til et eller annet nivå.
Dimensjonstabeller
En dimensjon er en arkitektur som kategoriserer data i et hierarki. En dimensjon uten hierarkier og nivåer kalles en flat dimensjon eller liste. Hver dimensjonstabells primærnøkkel er en del av den sammensatte primærnøkkelen til faktatabellen. Et dimensjonsattributt er et beskrivende tekstattributt som hjelper til med å beskrive en dimensjonsverdi. Faktatabeller er vanligvis større enn dimensjonstabeller.
Kjennetegn ved stjerneskjema
- Hver dimensjon i et stjerneskjema er representert med den eneste endimensjonstabellen.
- Dimensjonstabellen skal inneholde settet med attributter.
- Dimensjonstabellen kobles til faktatabellen ved hjelp av en fremmednøkkel
- Dimensjonstabellen er ikke forbundet med hverandre
- Faktatabell vil inneholde nøkkel og mål
- Stjerneskjemaet er enkelt å forstå og gir optimal diskbruk.
- Dimensjonstabellene er ikke normalisert. For eksempel, i figuren ovenfor, har ikke Country_ID Country-oppslagstabell som en OLTP-design ville ha.
- Skjemaet støttes bredt av BI-verktøy
Fordeler med Star Schema
- Stjerneskjemaer har en mer enkel sammenføyningslogikk sammenlignet med andre skjemaer for å hente data fra svært normaliserte transaksjonsskjemaer.
- I motsetning til svært normaliserte transaksjonsskjemaer, forenkler stjerneskjemaet vanlig forretningsrapporteringslogikk, for eksempel rapportering og periode-over-periode.
- Stjerneskjemaer er mye brukt av OLAP-systemer for å designe kuber effektivt. Et stjerneskjema kan brukes som en kilde uten å designe en kubestruktur i de fleste store OLAP-systemer.
- Ved å aktivere spesifikke ytelsesskjemaer som kan brukes på spørringer, kan spørringsprosessorprogramvaren i Star Schema tilby bedre utførelsesplaner.
Ulempen med Star Schema
- Siden skjemaet er svært denormalisert, håndheves ikke dataintegriteten godt.
- Ikke fleksibel med tanke på analytiske behov.
- Stjerneskjemaer forsterker ikke mange-til-mange-relasjoner innen forretningsenheter.