Hvad er Star Schema i Data Warehouse-modellering?
Hvad er et stjerneskema?
Stjerneskema i data warehouse, er et skema, hvor stjernens centrum kan have én faktatabel og et antal tilhørende dimensionstabeller. Det er kendt som stjerneskema, da dets struktur ligner en stjerne. Star Schema-datamodellen er den enkleste type Data Warehouse-skema. Det er også kendt som Star Join Schema og er optimeret til forespørgsler i store datasæt.
Hvad er multidimensionelt skema?
Multidimensionelt skema er specielt designet til at modellere datavarehussystemer. Skemaerne er designet til at imødekomme de unikke behov i meget store databaser designet til det analytiske formål (OLAP).
Typer af datavarehusskema:
Følgende er 3 hovedtyper af multidimensionelle skemaer, der hver har sine unikke fordele.
- Stjerneskema
- Snefnugskema
- Galaxy-skema
Eksempel på stjerneskemadatamodellering
I det følgende stjerneskema-eksempel er faktatabellen i centrum, som indeholder nøgler til hver dimensionstabel som Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID og andre attributter som solgte enheder og omsætning.
Faktatabeller
En faktatabel i et stjerneskema indeholder fakta og er forbundet med dimensioner. En faktatabel har to typer kolonner:
- En kolonne, der indeholder Fakta
- Udenlandske nøgle til dimensionstabel
Generelt er den primære nøgle i en faktatabel en sammensat nøgle, der består af alle de fremmednøgler, der udgør tabellen.
Faktatabeller kan indeholde fakta på detaljeniveau eller aggregerede fakta. Faktatabeller, der indeholder aggregerede fakta, kaldes ofte opsummeringstabeller. Faktatabeller indeholder normalt fakta, der er blevet aggregeret til et eller andet niveau.
Dimensionstabeller
En dimension er en arkitektur, der kategoriserer data i et hierarki. En dimension uden hierarkier og niveauer kaldes en flad dimension eller liste. Hver dimensionstabels primære nøgle er en del af den sammensatte primære nøgle i faktatabellen. En dimensionsattribut er en beskrivende tekstegenskab, der hjælper med at beskrive en dimensionel værdi. Faktatabeller er normalt større end dimensionstabeller.
Karakteristika for stjerneskema
- Hver dimension i et stjerneskema er repræsenteret med den eneste endimensionelle tabel.
- Dimensionstabellen skal indeholde sættet af attributter.
- Dimensionstabellen er forbundet med faktatabellen ved hjælp af en fremmednøgle
- Dimensionstabellen er ikke forbundet med hinanden
- Faktatabel ville indeholde nøgle og målestok
- Stjerneskemaet er let at forstå og giver optimal diskbrug.
- Dimensionstabellerne er ikke normaliserede. For eksempel, i ovenstående figur, har Country_ID ikke Country-opslagstabel, som et OLTP-design ville have.
- Skemaet er bredt understøttet af BI-værktøjer
Fordele ved Star Schema
- Stjerneskemaer har en mere ligetil joinlogik sammenlignet med andre skemaer til at hente data fra meget normaliserede transaktionsskemaer.
- I modsætning til meget normaliserede transaktionsskemaer forenkler stjerneskemaet almindelig forretningsrapporteringslogik, såsom rapportering og periode-over-periode.
- Stjerneskemaer bruges i vid udstrækning af OLAP-systemer til at designe kuber effektivt. Et stjerneskema kan bruges som en kilde uden at designe en terningstruktur i de fleste større OLAP-systemer.
- Ved at aktivere specifikke præstationsskemaer, der kan anvendes på forespørgsler, kan forespørgselsprocessorsoftwaren i Star Schema tilbyde bedre eksekveringsplaner.
Ulempe ved stjerneskema
- Da skemaet er stærkt denormaliseret, håndhæves dataintegriteten ikke godt.
- Ikke fleksibel i forhold til analytiske behov.
- Stjerneskemaer forstærker ikke mange-til-mange-relationer inden for forretningsenheder.