Sneeuwvlokschema in datawarehouse-model

Wat is een sneeuwvlokschema?

Sneeuwvlokschema in een datawarehouse is een logische rangschikking van tabellen in een multidimensionale database, zodat de ER-diagram lijkt op een sneeuwvlokvorm. Een Sneeuwvlokschema is een uitbreiding van een Sterrenschema en voegt extra dimensies toe. De dimensietabellen zijn genormaliseerd, waardoor gegevens in extra tabellen worden opgesplitst.

Voorbeeld van een sneeuwvlokschema

In het vervolgwing Sneeuwvlokschema-voorbeeld: Land wordt verder genormaliseerd in een individuele tabel.

Sneeuwvlokschema
Voorbeeld van een sneeuwvlokschema

Kenmerken van Snowflake Schema

  • Het belangrijkste voordeel van het sneeuwvlokschema is dat het kleinere schijfruimte gebruikt.
  • Er wordt eenvoudiger een dimensie aan het schema toegevoegd
  • Omdat er meerdere tabellen zijn, worden de queryprestaties verminderd
  • De belangrijkste uitdaging waarmee u te maken krijgt bij het gebruik van het sneeuwvlokschema is dat u meer onderhoudsinspanningen moet uitvoeren vanwege het grotere aantal opzoektabellen.

Voordeel van Sneeuwvlokschema

  • Het belangrijkste voordeel van het Snowflake-schema is de mogelijkheid om de schijfopslagvereisten te verminderen en kleinere opzoektabellen samen te voegen, waardoor de queryprestaties worden verbeterd.
  • Biedt grotere schaalbaarheid in de onderlinge relatie tussen componenten en dimensieniveaus.
  • Er is geen redundantie, dus het is gemakkelijker te onderhouden.

Nadeel van het Sneeuwvlokschema

  • Een belangrijk nadeel van het sneeuwvlokschema is het grotere onderhoud dat nodig is.
  • complex vragen zijn moeilijk te begrijpen.
  • Een groter aantal tabellen betekent meer joins, dus een langere uitvoeringstijd van de query.

Wat is een Galaxy-schema?

A Melkwegschema bevat twee feitentabellen die dimensietabellen onderling delen. Het wordt ook wel Fact Constellation Schema genoemd. Het schema wordt gezien als een verzameling sterren, vandaar de naam Galaxy Schema.

Melkwegschema
Voorbeeld van Galaxy-schema

Zoals u in het bovenstaande voorbeeld kunt zien, zijn er twee feitentabellen

  1. Inkomsten
  2. Artikel.

In Galaxy-schema shares afmetingen worden conforme afmetingen genoemd.

Kenmerken van Galaxy Schema

  • De dimensies in dit schema zijn onderverdeeld in afzonderlijke dimensies op basis van de verschillende hiërarchieniveaus.
  • Als geografie bijvoorbeeld vier hiërarchieniveaus heeft, zoals regio, land, staat en stad, dan zou het Galaxy-schema vier dimensies moeten hebben.
  • Bovendien is het mogelijk dit type schema op te bouwen door het één-sterrenschema op te splitsen in meer sterschema's.
  • De dimensies zijn groot in dit schema, dat nodig is om te bouwen op basis van de hiërarchieniveaus.
  • Dit schema is handig voor het aggregeren van feitentabellen voor een beter begrip.

Wat is het sterrenclusterschema?

Het Sneeuwvlokschema bevat een volledig uitgevouwen hierarchies. Dit kan echter complexaansluit bij het schema en vereist extra joins. Aan de andere kant, ster schema bevat volledig samengevouwen hierarchies, wat tot overtolligheid kan leiden. De beste oplossing kan dus een balans zijn tussen deze twee schema's, namelijk het ontwerp van het Star Cluster Schema.

Sterrenclusterschema
Voorbeeld van een sterrenclusterschema

Overlappende afmetingen zijn hier als vorken te vindenarchies. Een vork vindt plaats wanneer een entiteit als ouder fungeert in een tweedimensionale hierarchies. Fork-entiteiten worden vervolgens geïdentificeerd als classificatie met een-op-veel-relaties.