Sneeuwvlokschema in datawarehouse-model
Wat is een sneeuwvlokschema?
Sneeuwvlokschema in een datawarehouse is een logische rangschikking van tabellen in een multidimensionale database, zodat de ER-diagram lijkt op een sneeuwvlokvorm. Een Sneeuwvlokschema is een uitbreiding van een Sterrenschema en voegt extra dimensies toe. De dimensietabellen zijn genormaliseerd, waardoor gegevens in extra tabellen worden opgesplitst.
Voorbeeld van een sneeuwvlokschema
In het volgende Snowflake-schemavoorbeeld wordt Land verder genormaliseerd in een afzonderlijke tabel.

Kenmerken van Snowflake Schema
- Het belangrijkste voordeel van het sneeuwvlokschema is dat het kleinere schijfruimte gebruikt.
- Er wordt eenvoudiger een dimensie aan het schema toegevoegd
- Omdat er meerdere tabellen zijn, worden de queryprestaties verminderd
- De belangrijkste uitdaging waarmee u te maken krijgt bij het gebruik van het sneeuwvlokschema is dat u meer onderhoudsinspanningen moet uitvoeren vanwege het grotere aantal opzoektabellen.
Voordeel van Sneeuwvlokschema
- Het belangrijkste voordeel van het Snowflake-schema is de mogelijkheid om de schijfopslagvereisten te verminderen en kleinere opzoektabellen samen te voegen, waardoor de queryprestaties worden verbeterd.
- Biedt grotere schaalbaarheid in de onderlinge relatie tussen componenten en dimensieniveaus.
- Er is geen redundantie, dus het is gemakkelijker te onderhouden.
Nadeel van het Sneeuwvlokschema
- Een belangrijk nadeel van het sneeuwvlokschema is het grotere onderhoud dat nodig is.
- Complexe vragen zijn lastig te begrijpen.
- Een groter aantal tabellen betekent meer joins, dus een langere uitvoeringstijd van de query.
Wat is een Galaxy-schema?
A Melkwegschema bevat twee facttabellen die dimensietabellen delen. Het wordt ook wel Fact Constellation Schema genoemd. Het schema wordt gezien als een verzameling sterren, vandaar de naam Galaxy Schema.
Zoals u in het bovenstaande voorbeeld kunt zien, zijn er twee feitentabellen
- Revgevolg
- Artikel.
In Galaxy-schema's worden dimensies conforme dimensies genoemd.
Kenmerken van Galaxy Schema
- De dimensies in dit schema zijn onderverdeeld in afzonderlijke dimensies op basis van de verschillende hiërarchieniveaus.
- Als geografie bijvoorbeeld vier hiërarchieniveaus heeft, zoals regio, land, staat en stad, dan zou het Galaxy-schema vier dimensies moeten hebben.
- Bovendien is het mogelijk dit type schema op te bouwen door het één-sterrenschema op te splitsen in meer sterschema's.
- De dimensies zijn groot in dit schema, dat nodig is om te bouwen op basis van de hiërarchieniveaus.
- Dit schema is handig voor het aggregeren van feitentabellen voor een beter begrip.
Wat is ster Cluster Schema?
Snowflake-schema bevat volledig uitgebreide hiërarchieën. Dit kan echter complexiteit toevoegen aan het schema en vereist extra joins. Aan de andere kant, ster schema bevat volledig samengevouwen hiërarchieën, wat kan leiden tot redundantie. Dus de beste oplossing kan een balans zijn tussen deze twee schema's, wat Star is Cluster Schema-ontwerp.
Overlappende dimensies kunnen worden gevonden als forks in hiërarchieën. Een fork vindt plaats wanneer een entiteit als ouder fungeert in twee verschillende dimensionale hiërarchieën. Fork-entiteiten worden vervolgens geïdentificeerd als classificatie met een-op-veel-relaties.