Sterrenschema versus sneeuwvlokschema – verschil daartussen
Belangrijkste verschil tussen sterrenschema en sneeuwvlokschema
- Het sterschema is het eenvoudigste type Data Warehouse-schema. Het staat bekend als een sterrenschema omdat de structuur op een ster lijkt.
- Als we het Sneeuwvlok- en Sterrenschema vergelijken, is een Sneeuwvlokschema een uitbreiding van een Sterrenschema en voegt het extra dimensies toe. Het wordt sneeuwvlok genoemd omdat het diagram op een sneeuwvlok lijkt.
- In een sterschema definieert alleen een enkele join de relatie tussen de feitentabel en eventuele dimensietabellen.
- Het sterrenschema bevat een feitentabel omgeven door dimensietabellen.
- Het Sneeuwvlokschema is omgeven door een dimensietabel, die op zijn beurt wordt omgeven door een dimensietabel
- Voor een sneeuwvlokschema zijn veel joins nodig om de gegevens op te halen.
- Als we het Star-schema vergelijken met het Snowflake-schema, zien we dat het Start-schema een eenvoudig DB-ontwerp heeft, terwijl het Snowflake-schema een zeer complex DB-ontwerp heeft.
Wat is een sterrenschema?
Sterrenschema in een datawarehouse, waarin het centrum van de ster één feitentabel en een aantal bijbehorende dimensietabellen kan hebben. Het staat bekend als een sterrenschema omdat de structuur op een ster lijkt. Het Star Schema-gegevensmodel is het eenvoudigste type Data Warehouse-schema. Het staat ook bekend als Star Join Schema en is geoptimaliseerd voor het bevragen van grote datasets.
In het volgende Star Schema-voorbeeld staat de feitentabel in het midden. Deze bevat sleutels voor elke dimensietabel, zoals Dealer_ID, Model_ID, Date_ID, Product_ID, Filiaal_ID en andere kenmerken, zoals verkochte eenheden en omzet.
Wat is een sneeuwvlokschema?
Sneeuwvlokschema in een datawarehouse is een logische rangschikking van tabellen in een multidimensionale database, zodat de ER-diagram lijkt op een sneeuwvlokvorm. Een Sneeuwvlokschema is een uitbreiding van een Sterrenschema en voegt extra dimensies toe. De dimensietabellen zijn genormaliseerd, waardoor gegevens in extra tabellen worden opgesplitst.
In het volgende Snowflake-schemavoorbeeld wordt Land verder genormaliseerd in een afzonderlijke tabel.
Verschil tussen sterrenschema en sneeuwvlokschema
Hieronder vindt u een belangrijk verschil tussen het Snowflake-schema en het Star-schema:
Sterrenschema | Sneeuwvlokschema |
---|---|
Hiërarchieën voor de dimensies worden opgeslagen in de dimensietabel. | Hiërarchieën zijn verdeeld in afzonderlijke tabellen. |
Het bevat een feitentabel omgeven door dimensietabellen. | Eén feitentabel omringd door dimensietafels die op hun beurt omgeven zijn door dimensietafels |
In een sterschema creëert slechts één join de relatie tussen de feitentabel en eventuele dimensietabellen. | Voor een sneeuwvlokschema zijn veel joins nodig om de gegevens op te halen. |
Eenvoudig DB-ontwerp. | Zeer complex DB-ontwerp. |
Gedenormaliseerde gegevensstructuur en query's werken ook sneller. | Genormaliseerde gegevensstructuur. |
Hoog niveau van gegevensredundantie | Gegevensredundantie op zeer laag niveau |
De tabel met één dimensie bevat geaggregeerde gegevens. | Gegevens opgesplitst in verschillende dimensietabellen. |
Kubusverwerking is sneller. | De verwerking van kubussen kan traag zijn vanwege de complexe join. |
Biedt beter presterende zoekopdrachten met behulp van Star Join Query Optimization. Tabellen kunnen met meerdere dimensies worden verbonden. |
Het Sneeuwvlokschema wordt weergegeven door een gecentraliseerde feitentabel die waarschijnlijk verband houdt met meerdere dimensies. |