Snowflake Schema i Data Warehouse Model
Hvad er et snefnugskema?
Snefnugskema i data warehouse er et logisk arrangement af tabeller i en multidimensionel database, således at ER diagram ligner en snefnugform. Et snefnugskema er en udvidelse af et stjerneskema, og det tilføjer yderligere dimensioner. Dimensionstabellerne er normaliserede, hvilket opdeler data i yderligere tabeller.
Eksempel på snefnugskema
I det følgende eksempel på snefnugskema er Land yderligere normaliseret til en individuel tabel.

Karakteristika for Snowflake Schema
- Den største fordel ved snefnugskemaet bruger mindre diskplads.
- Lettere at implementere en dimension føjes til skemaet
- På grund af flere tabeller er forespørgselsydeevne reduceret
- Den primære udfordring, som du vil møde, mens du bruger snefnug-skemaet, er, at du skal udføre flere vedligeholdelsesindsatser på grund af de flere opslagstabeller.
Fordel ved Snowflake Schema
- Snowflake-skemaets primære fordel er dets evne til at reducere krav til disklager og slutte sig til mindre opslagstabeller, hvilket forbedrer forespørgselsydeevnen.
- Giver større skalerbarhed i sammenhængen mellem komponenter og dimensionsniveauer.
- Der er ingen redundans, så det er lettere at vedligeholde.
Ulempe ved Snowflake Schema
- En væsentlig ulempe ved snefnugskemaet er den øgede vedligeholdelse, der kræves.
- Komplekse forespørgsler er udfordrende at forstå.
- Et større antal tabeller betyder flere joins, så en længere udførelsestid for forespørgsler.
Hvad er et Galaxy Schema?
A Galaxy-skema indeholder to faktatabeller, der deler dimensionstabeller mellem sig. Det kaldes også Fact Constellation Schema. Skemaet ses som en samling stjerner deraf navnet Galaxy Schema.
Som du kan se i ovenstående eksempel, er der to faktatabel
- Revenue
- Produkt.
I Galaxy-skemaandele kaldes dimensioner for tilpassede dimensioner.
Karakteristika for Galaxy Schema
- Dimensionerne i dette skema er opdelt i separate dimensioner baseret på de forskellige niveauer af hierarki.
- For eksempel, hvis geografi har fire niveauer af hierarki som region, land, stat og by, skal Galaxy-skemaet have fire dimensioner.
- Desuden er det muligt at bygge denne type skema ved at opdele et-stjerneskemaet i flere stjerneskemaer.
- Dimensionerne er store i dette skema, som er nødvendigt for at bygge baseret på hierarkiets niveauer.
- Dette skema er nyttigt til at samle faktatabeller for bedre forståelse.
Hvad er Star Cluster Skema?
Snowflake-skemaet indeholder fuldt udvidede hierarkier. Dette kan dog tilføje kompleksitet til skemaet og kræver ekstra joinforbindelser. På den anden side, stjerneskema indeholder fuldstændigt kollapsede hierarkier, hvilket kan føre til redundans. Så den bedste løsning kan være en balance mellem disse to skemaer, som er Star Cluster Skema design.
Overlappende dimensioner kan findes som gafler i hierarkier. En forgrening sker, når en enhed fungerer som en forælder i to forskellige dimensionshierarkier. Fork-enheder identificeres derefter som klassifikation med en-til-mange-relationer.