Was ist Star Schema in der Data Warehouse-Modellierung?

Was ist ein Sternschema?

Sternschema Im Data Warehouse handelt es sich um ein Schema, bei dem die Mitte des Sterns eine Faktentabelle und mehrere zugehörige Dimensionstabellen haben kann. Es ist als Sternschema bekannt, da seine Struktur einem Stern ähnelt. Das Star Schema-Datenmodell ist der einfachste Typ eines Data Warehouse-Schemas. Es wird auch als Star-Join-Schema bezeichnet und ist für die Abfrage großer Datenmengen optimiert.

Was ist ein mehrdimensionales Schema?

Mehrdimensionales Schema ist speziell für die Modellierung von Data-Warehouse-Systemen konzipiert. Die Schemata sind so konzipiert, dass sie den besonderen Anforderungen sehr großer Datenbanken gerecht werden, die für Analysezwecke konzipiert sind (OLAP).

Arten von Data Warehouse-Schemas:

Im Folgenden sind die drei Haupttypen mehrdimensionaler Schemata aufgeführt, von denen jeder seine eigenen einzigartigen Vorteile hat.

Beispiel für die Modellierung von Star-Schema-Daten

Im folgenden Sternschema-Beispiel steht die Faktentabelle im Mittelpunkt, die Schlüssel zu allen Dimensionstabellen enthält, wie etwa Dealer_ID, Model_ID, Date_ID, Product_ID, Branch_ID und andere Attribute wie etwa verkaufte Einheiten und Umsatz.

Sternschema-Datenmodellierung
Beispiel eines Sternschemadiagramms

Faktentabellen

Eine Faktentabelle in einem Sternschema enthält Fakten und ist mit Dimensionen verbunden. Eine Faktentabelle hat zwei Arten von Spalten:

  • Eine Spalte, die Fakten enthält
  • Fremdschlüssel zur Dimensionstabelle

Im Allgemeinen ist der Primärschlüssel einer Faktentabelle ein zusammengesetzter Schlüssel, der aus allen Fremdschlüsseln besteht, aus denen die Tabelle besteht.

Faktentabellen können Fakten auf Detailebene oder aggregierte Fakten enthalten. Faktentabellen, die aggregierte Fakten enthalten, werden oft als Übersichtstabellen bezeichnet. Faktentabellen enthalten normalerweise Fakten, die auf einer bestimmten Ebene aggregiert wurden.

Maßtabellen

Eine Dimension ist eine Architektur, die Daten in einer Hierarchie kategorisiert. Eine Dimension ohne Hierarchien und Ebenen wird als flache Dimension oder Liste bezeichnet. Der Primärschlüssel jeder Dimensionstabelle ist Teil des zusammengesetzten Primärschlüssels der Faktentabelle. Ein Dimensionsattribut ist ein beschreibendes Textattribut, das bei der Beschreibung eines Dimensionswerts hilft. Faktentabellen sind normalerweise größer als Dimensionstabellen.

Eigenschaften des Sternschemas

  • Jede Dimension in einem Sternschema wird durch die einzige eindimensionale Tabelle dargestellt.
  • Die Dimensionstabelle sollte den Satz von Attributen enthalten.
  • Die Dimensionstabelle wird über einen Fremdschlüssel mit der Faktentabelle verknüpft
  • Die Dimensionstabellen sind nicht miteinander verbunden
  • Die Faktentabelle würde Schlüssel und Maß enthalten
  • Das Star-Schema ist leicht zu verstehen und bietet eine optimale Festplattennutzung.
  • Die Dimensionstabellen sind nicht normalisiert. In der obigen Abbildung verfügt Country_ID beispielsweise nicht über eine Länder-Nachschlagetabelle, wie dies bei einem OLTP-Design der Fall wäre.
  • Das Schema wird von BI Tools weitgehend unterstützt

Vorteile des Sternschemas

  • Sternschemata verfügen im Vergleich zu anderen Schemata über eine einfachere Verknüpfungslogik zum Abrufen von Daten aus stark normalisierten Transaktionsschemata.
  • Im Gegensatz zu stark normalisierten Transaktionsschemata vereinfacht das Sternschema die gängige Geschäftsberichtslogik, wie z. B. Berichterstellung und Periode-über-Periode.
  • Sternschemata werden von OLAP-Systemen häufig zum effizienten Entwerfen von Cubes verwendet. In den meisten großen OLAP-Systemen kann ein Sternschema als Quelle verwendet werden, ohne dass eine Würfelstruktur entworfen werden muss.
  • Durch die Aktivierung spezifischer Leistungsschemata, die auf Abfragen angewendet werden können, kann die Abfrageprozessorsoftware in Star Schema bessere Ausführungspläne bieten.

Nachteil des Star-Schemas

  • Da das Schema stark denormalisiert ist, wird die Datenintegrität nicht gut durchgesetzt.
  • Nicht flexibel in Bezug auf analytische Bedürfnisse.
  • Sternschemata verstärken keine Viele-zu-Viele-Beziehungen innerhalb von Geschäftseinheiten.