Snowflake Schema i Data Warehouse Model
Vad är ett Snowflake Schema?
Snöflingaschema i data warehouse är ett logiskt arrangemang av tabeller i en flerdimensionell databas så att ER-diagram liknar en snöflingaform. Ett Snowflake Schema är en förlängning av ett Star Schema och det lägger till ytterligare dimensioner. Dimensionstabellerna är normaliserade vilket delar upp data i ytterligare tabeller.
Exempel på snöflingaschema
I följande Snowflake Schema-exempel normaliseras Country ytterligare till en individuell tabell.
Egenskaper för Snowflake Schema
- Den största fördelen med snowflake-schemat använder mindre diskutrymme.
- Enklare att implementera en dimension läggs till i schemat
- På grund av flera tabeller minskar frågeprestanda
- Den primära utmaningen som du kommer att möta när du använder snöflingaschemat är att du behöver utföra mer underhållsinsatser på grund av de fler uppslagstabellerna.
Fördel med Snowflake Schema
- Snowflake-schemats främsta fördel är dess förmåga att minska kraven på disklagring och gå med i mindre uppslagstabeller, vilket förbättrar frågeprestanda.
- Ger större skalbarhet i sambandet mellan komponenter och dimensionsnivåer.
- Det finns ingen redundans, så det är lättare att underhålla.
Nackdel med Snowflake Schema
- En betydande nackdel med snöflingeschemat är det ökade underhållet som krävs.
- Komplexa frågor är utmanande att förstå.
- Ett större antal tabeller innebär fler kopplingar, så en längre tid för körning av frågor.
Vad är ett Galaxy Schema?
A Galaxy Schema innehåller två faktatabeller som delar dimensionstabeller mellan sig. Det kallas också Fact Constellation Schema. Schemat ses som en samling stjärnor därav namnet Galaxy Schema.
Som du kan se i ovanstående exempel finns det två faktatabeller
- Revenue
- Produkt.
I Galaxy-schemadelningar kallas dimensioner för anpassade dimensioner.
Egenskaper för Galaxy Schema
- Dimensionerna i det här schemat är uppdelade i separata dimensioner baserat på de olika nivåerna av hierarki.
- Till exempel, om geografi har fyra nivåer av hierarki som region, land, stat och stad bör Galaxy-schemat ha fyra dimensioner.
- Dessutom är det möjligt att bygga den här typen av schema genom att dela upp det enstjärniga schemat i fler stjärnscheman.
- Dimensionerna är stora i detta schema som behövs för att bygga utifrån hierarkinivåerna.
- Detta schema är användbart för att aggregera faktatabeller för bättre förståelse.
Vad är Star Cluster Schema?
Snowflake-schemat innehåller helt utökade hierarkier. Detta kan dock lägga till komplexitet till schemat och kräver extra kopplingar. Å andra sidan, stjärnschema innehåller helt kollapsade hierarkier, vilket kan leda till redundans. Så den bästa lösningen kan vara en balans mellan dessa två scheman som är Star Cluster Schema design.
Överlappande dimensioner kan hittas som gafflar i hierarkier. En gaffel uppstår när en entitet agerar som en förälder i två olika dimensionella hierarkier. Fork-enheter identifierades sedan som klassificering med en-till-många-relationer.