Wat is Star Schema in Data Warehouse-modellering?
Wat is een sterrenschema?
Sterrenschema in datawarehouse is een schema waarin het midden van de ster één feitentabel en een aantal bijbehorende dimensietabellen kan hebben. Het staat bekend als een sterrenschema omdat de structuur op een ster lijkt. Het Star Schema-gegevensmodel is het eenvoudigste type Data Warehouse-schema. Het staat ook bekend als Star Join Schema en is geoptimaliseerd voor het bevragen van grote datasets.
Wat is een multidimensionaal schema?
Multidimensionaal schema is speciaal ontworpen om datawarehouse-systemen te modelleren. De schema's zijn ontworpen om tegemoet te komen aan de unieke behoeften van zeer grote databases die zijn ontworpen voor analytische doeleinden (OLAP).
Soorten datawarehouse-schema's:
Hieronder staan de drie belangrijkste typen multidimensionale schema's, elk met zijn eigen unieke voordelen.
- Sterrenschema
- Sneeuwvlokschema
- Melkwegschema
Voorbeeld van gegevensmodellering van sterrenschema's
In het volgende Star Schema-voorbeeld staat de feitentabel in het midden. Deze bevat sleutels voor elke dimensietabel, zoals Dealer_ID, Model_ID, Date_ID, Product_ID, Filiaal_ID en andere kenmerken, zoals verkochte eenheden en omzet.
Feitentabellen
Een feitentabel in een sterrenschema bevat feiten en is gekoppeld aan dimensies. Een feitentabel heeft twee soorten kolommen:
- Een kolom met feiten
- Buitenlandse sleutel tot afmetingentabel
Over het algemeen is de primaire sleutel van een feitentabel een samengestelde sleutel die bestaat uit alle externe sleutels waaruit de tabel bestaat.
Feitentabellen kunnen feiten op detailniveau of geaggregeerde feiten bevatten. Feitentabellen die geaggregeerde feiten bevatten, worden vaak samenvattende tabellen genoemd. Feitentabellen bevatten doorgaans feiten die tot een bepaald niveau zijn geaggregeerd.
Dimensietabellen
Een dimensie is een architectuur die gegevens categoriseert in een hiërarchie. Een dimensie zonder hiërarchieën en niveaus wordt een platte dimensie of lijst genoemd. De primaire sleutel van elke dimensietabel is onderdeel van de samengestelde primaire sleutel van de feitentabel. Een dimensiekenmerk is een beschrijvend, tekstueel kenmerk dat helpt bij het beschrijven van een dimensionale waarde. Feitentabellen zijn doorgaans groter dan dimensietabellen.
Kenmerken van Star Schema
- Elke dimensie in een sterrenschema wordt weergegeven met de enige tabel met één dimensie.
- De dimensietabel moet de set attributen bevatten.
- De dimensietabel wordt met behulp van een externe sleutel aan de feitentabel gekoppeld
- De maattabel is niet met elkaar verbonden
- De feitentabel zou de sleutel en de maatstaf bevatten
- Het Star-schema is gemakkelijk te begrijpen en zorgt voor optimaal schijfgebruik.
- De dimensietabellen zijn niet genormaliseerd. In de bovenstaande afbeelding heeft Country_ID bijvoorbeeld geen opzoektabel Land, zoals een OLTP-ontwerp zou hebben.
- Het schema wordt breed ondersteund door BI Tools
Voordelen van Star Schema
- Sterschema's hebben een eenvoudigere koppelingslogica vergeleken met andere schema's voor het ophalen van gegevens uit sterk genormaliseerde transactionele schema's.
- In tegenstelling tot sterk genormaliseerde transactieschema's vereenvoudigt het sterschema de gebruikelijke logica voor bedrijfsrapportage, zoals rapportage en periode-over-periode.
- Sterschema's worden veel gebruikt door OLAP-systemen om kubussen efficiënt te ontwerpen. In de meeste grote OLAP-systemen kan een sterschema als bron worden gebruikt zonder een kubusstructuur te ontwerpen.
- Door specifieke prestatieschema's mogelijk te maken die op query's kunnen worden toegepast, kan de queryprocessorsoftware in Star Schema betere uitvoeringsplannen bieden.
Nadeel van sterrenschema
- Omdat het schema sterk gedenormaliseerd is, wordt de gegevensintegriteit niet goed afgedwongen.
- Niet flexibel in termen van analytische behoeften.
- Sterrenschema's versterken de veel-op-veel-relaties binnen bedrijfsentiteiten niet.