Was ist Star Schema in der Data Warehouse-Modellierung?

Was ist ein Sternschema?

Sternschema Im Data Warehouse handelt es sich um ein Schema, bei dem die Mitte des Sterns eine Faktentabelle und mehrere zugehรถrige Dimensionstabellen haben kann. Es ist als Sternschema bekannt, da seine Struktur einem Stern รคhnelt. Das Star Schema-Datenmodell ist der einfachste Typ eines Data Warehouse-Schemas. Es wird auch als Star-Join-Schema bezeichnet und ist fรผr die Abfrage groรŸer Datenmengen optimiert.

Was ist ein mehrdimensionales Schema?

Mehrdimensionales Schema ist speziell fรผr die Modellierung von Data-Warehouse-Systemen konzipiert. Die Schemata sind so konzipiert, dass sie den besonderen Anforderungen sehr groรŸer Datenbanken gerecht werden, die fรผr Analysezwecke konzipiert sind (OLAP).

Arten von Data Warehouse-Schemas:

Im Folgenden sind die drei Haupttypen mehrdimensionaler Schemata aufgefรผhrt, von denen jeder seine eigenen einzigartigen Vorteile hat.

Beispiel fรผr die Modellierung von Star-Schema-Daten

Im folgenden Sternschema-Beispiel steht die Faktentabelle im Mittelpunkt, die Schlรผssel zu allen Dimensionstabellen enthรคlt, wie etwa Dealer_ID, Model_ID, Date_ID, Product_ID, Branch_ID und andere Attribute wie etwa verkaufte Einheiten und Umsatz.

Sternschema-Datenmodellierung
Beispiel eines Sternschemadiagramms

Faktentabellen

Eine Faktentabelle in einem Sternschema enthรคlt Fakten und ist mit Dimensionen verbunden. Eine Faktentabelle hat zwei Arten von Spalten:

  • Eine Spalte, die Fakten enthรคlt
  • Fremdschlรผssel zur Dimensionstabelle

Im Allgemeinen ist der Primรคrschlรผssel einer Faktentabelle ein zusammengesetzter Schlรผssel, der aus allen Fremdschlรผsseln besteht, aus denen die Tabelle besteht.

Faktentabellen kรถnnen Fakten auf Detailebene oder aggregierte Fakten enthalten. Faktentabellen, die aggregierte Fakten enthalten, werden oft als รœbersichtstabellen bezeichnet. Faktentabellen enthalten normalerweise Fakten, die auf einer bestimmten Ebene aggregiert wurden.

MaรŸtabellen

Eine Dimension ist eine Architektur, die Daten in einer Hierarchie kategorisiert. Eine Dimension ohne Hierarchien und Ebenen wird als flache Dimension oder Liste bezeichnet. Der Primรคrschlรผssel jeder Dimensionstabelle ist Teil des zusammengesetzten Primรคrschlรผssels der Faktentabelle. Ein Dimensionsattribut ist ein beschreibendes Textattribut, das bei der Beschreibung eines Dimensionswerts hilft. Faktentabellen sind normalerweise grรถรŸer als Dimensionstabellen.

Eigenschaften des Sternschemas

  • Jede Dimension in einem Sternschema wird durch die einzige eindimensionale Tabelle dargestellt.
  • Die Dimensionstabelle sollte den Satz von Attributen enthalten.
  • Die Dimensionstabelle wird รผber einen Fremdschlรผssel mit der Faktentabelle verknรผpft
  • Die Dimensionstabellen sind nicht miteinander verbunden
  • Die Faktentabelle wรผrde Schlรผssel und MaรŸ enthalten
  • Das Star-Schema ist leicht zu verstehen und bietet eine optimale Festplattennutzung.
  • Die Dimensionstabellen sind nicht normalisiert. In der obigen Abbildung verfรผgt Country_ID beispielsweise nicht รผber eine Lรคnder-Nachschlagetabelle, wie dies bei einem OLTP-Design der Fall wรคre.
  • Das Schema wird von BI Tools weitgehend unterstรผtzt

Vorteile des Sternschemas

  • Sternschemata verfรผgen im Vergleich zu anderen Schemata รผber eine einfachere Verknรผpfungslogik zum Abrufen von Daten aus stark normalisierten Transaktionsschemata.
  • Im Gegensatz zu stark normalisierten Transaktionsschemata vereinfacht das Sternschema die gรคngige Geschรคftsberichtslogik, wie z. B. Berichterstellung und Periode-รผber-Periode.
  • Sternschemata werden von OLAP-Systemen hรคufig zum effizienten Entwerfen von Cubes verwendet. In den meisten groรŸen OLAP-Systemen kann ein Sternschema als Quelle verwendet werden, ohne dass eine Wรผrfelstruktur entworfen werden muss.
  • Durch die Aktivierung spezifischer Leistungsschemata, die auf Abfragen angewendet werden kรถnnen, kann die Abfrageprozessorsoftware in Star Schema bessere Ausfรผhrungsplรคne bieten.

Nachteil des Star-Schemas

  • Da das Schema stark denormalisiert ist, wird die Datenintegritรคt nicht gut durchgesetzt.
  • Nicht flexibel in Bezug auf analytische Bedรผrfnisse.
  • Sternschemata verstรคrken keine Viele-zu-Viele-Beziehungen innerhalb von Geschรคftseinheiten.

Fassen Sie diesen Beitrag mit folgenden Worten zusammen: