Snowflake-Schema im Data Warehouse-Modell
Was ist ein Snowflake-Schema?
Schneeflockenschema Im Data Warehouse handelt es sich um eine logische Anordnung von Tabellen in einer mehrdimensionalen Datenbank, sodass die ER-Diagramm ähnelt einer Schneeflockenform. Ein Snowflake-Schema ist eine Erweiterung eines Star-Schemas und fügt zusätzliche Dimensionen hinzu. Die Dimensionstabellen sind normalisiert, wodurch die Daten in zusätzliche Tabellen aufgeteilt werden.
Beispiel für ein Snowflake-Schema
Im folgenden Snowflake-Schemabeispiel wird „Land“ weiter in eine einzelne Tabelle normalisiert.

Eigenschaften des Snowflake-Schemas
- Der Hauptvorteil des Snowflake-Schemas besteht darin, dass weniger Speicherplatz benötigt wird.
- Eine einfacher zu implementierende Dimension wird dem Schema hinzugefügt
- Aufgrund mehrerer Tabellen ist die Abfrageleistung verringert
- Die größte Herausforderung bei der Verwendung des Snowflake-Schemas besteht darin, dass Sie aufgrund der mehr Nachschlagetabellen mehr Wartungsaufwand betreiben müssen.
Vorteil des Snowflake-Schemas
- Der Hauptvorteil des Snowflake-Schemas besteht in seiner Fähigkeit, den Festplattenspeicherbedarf zu reduzieren und kleinere Nachschlagetabellen zu verknüpfen, wodurch die Abfrageleistung verbessert wird.
- Bietet eine größere Skalierbarkeit in der Wechselbeziehung zwischen Komponenten und Dimensionsebenen.
- Es gibt keine Redundanz und ist daher einfacher zu warten.
Nachteil des Snowflake-Schemas
- Ein wesentlicher Nachteil des Snowflake-Schemas ist der erhöhte Wartungsaufwand.
- Komplexe Abfragen sind schwierig zu verstehen.
- Eine größere Anzahl von Tabellen bedeutet mehr Verknüpfungen und damit eine längere Abfrageausführungszeit.
Was ist ein Galaxy-Schema?
A Galaxienschema enthält zwei Faktentabellen, die Dimensionstabellen untereinander teilen. Es wird auch als Faktenkonstellationsschema bezeichnet. Das Schema wird als eine Sammlung von Sternen betrachtet, daher der Name Galaxy Schema.
Wie Sie im obigen Beispiel sehen können, gibt es zwei Faktentabellen
- Revfolge
- Produkt.
Im Galaxy-Schema werden freigegebene Dimensionen als „angepasste Dimensionen“ bezeichnet.
Eigenschaften des Galaxy-Schemas
- Die Dimensionen in diesem Schema sind basierend auf den verschiedenen Hierarchieebenen in separate Dimensionen unterteilt.
- Wenn die Geographie beispielsweise über vier Hierarchieebenen wie Region, Land, Bundesstaat und Stadt verfügt, sollte das Galaxy-Schema über vier Dimensionen verfügen.
- Darüber hinaus ist es möglich, diese Art von Schema zu erstellen, indem das Ein-Stern-Schema in mehrere Stern-Schemata aufgeteilt wird.
- Die Dimensionen in diesem Schema sind groß und müssen auf der Grundlage der Hierarchieebenen erstellt werden.
- Dieses Schema ist hilfreich, um Faktentabellen zum besseren Verständnis zusammenzufassen.
Was ist Stern Cluster Schema?
Das Snowflake-Schema enthält vollständig erweiterte Hierarchien. Dies kann jedoch die Komplexität des Schemas erhöhen und zusätzliche Verknüpfungen erfordern. Andererseits Sternschema enthält vollständig reduzierte Hierarchien, was zu Redundanz führen kann. Die beste Lösung könnte also ein Gleichgewicht zwischen diesen beiden Schemata sein, nämlich Star Cluster Schemadesign.
Überlappende Dimensionen können als Verzweigungen in Hierarchien gefunden werden. Eine Verzweigung entsteht, wenn eine Entität als übergeordnetes Element in zwei unterschiedlichen Dimensionshierarchien fungiert. Verzweigte Entitäten werden dann als Klassifizierung mit Eins-zu-vielen-Beziehungen identifiziert.