Ce este Star Schema în modelarea Data Warehouse?

Ce este o schemă stelară?

Schema stelelor în depozitul de date, este o schemă în care centrul stelei poate avea un tabel de fapte și un număr de tabele de dimensiuni asociate. Este cunoscută sub numele de schemă stelară, deoarece structura sa seamănă cu o stea. Modelul de date Star Schema este cel mai simplu tip de schemă Data Warehouse. Este, de asemenea, cunoscut sub numele de Star Join Schema și este optimizat pentru interogare de seturi mari de date.

Ce este schema multidimensională?

Schema multidimensionala este special conceput pentru modelarea sistemelor de depozit de date. Schemele sunt concepute pentru a răspunde nevoilor unice ale bazelor de date foarte mari concepute în scop analitic (OLAP).

Tipuri de schemă de depozit de date:

Următoarele sunt 3 tipuri principale de scheme multidimensionale, fiecare având avantajele sale unice.

Exemplu de modelare a datelor cu schema stelară

În următorul exemplu de schemă stea, tabelul de fapte se află în centru, care conține cheile pentru fiecare tabel de dimensiuni, cum ar fi Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID și alte atribute precum Unitățile vândute și venitul.

Modelarea datelor cu schema stelară
Exemplu de diagramă a stelei

Tabele de fapte

Un tabel de fapte într-o schemă stea conține fapte și este conectat la dimensiuni. Un tabel de fapte are două tipuri de coloane:

  • O coloană care include Fapte
  • Cheie străină pentru tabelul dimensiuni

În general, cheia primară a unui tabel de fapte este o cheie compusă care este alcătuită din toate cheile externe care alcătuiesc tabelul.

Tabelele cu fapte pot conține fapte la nivel de detaliu sau fapte agregate. Tabelele cu fapte care includ fapte agregate sunt adesea numite tabele rezumative. Tabelele cu fapte conțin de obicei fapte care au fost agregate la un anumit nivel.

Tabelele de dimensiuni

O dimensiune este o arhitectură care clasifică datele într-o ierarhie. O dimensiune fără ierarhii și niveluri se numește dimensiune sau listă plată. Cheia primară a fiecărui tabel de dimensiuni face parte din cheia primară compusă a tabelului de fapte. Un atribut de dimensiune este un atribut descriptiv, textual, care ajută la descrierea unei valori dimensionale. Tabelele cu fapte sunt de obicei mai mari decât tabelele cu dimensiuni.

Caracteristicile Schemei Stelare

  • Fiecare dimensiune dintr-o schemă stea este reprezentată cu singurul tabel cu o singură dimensiune.
  • Tabelul de dimensiuni ar trebui să conțină setul de atribute.
  • Tabelul de dimensiuni este alăturat tabelului de fapte folosind o cheie străină
  • Tabelul de dimensiuni nu sunt unite între ele
  • Tabelul de fapte ar conține cheia și măsura
  • Schema Star este ușor de înțeles și oferă o utilizare optimă a discului.
  • Tabelele de dimensiuni nu sunt normalizate. De exemplu, în figura de mai sus, Country_ID nu are tabel de căutare Țară așa cum ar avea un design OLTP.
  • Schema este acceptată pe scară largă de Instrumentele BI

Avantajele Schemei Stelare

  • Schemele stea au o logică de unire mai simplă în comparație cu alte scheme pentru preluarea datelor din scheme tranzacționale extrem de normalizate.
  • Spre deosebire de schemele tranzacționale extrem de normalizate, schema stea simplifică logica obișnuită de raportare a afacerii, cum ar fi raportarea și perioada peste perioadă.
  • Schemele în stea sunt utilizate pe scară largă de sistemele OLAP pentru a proiecta cuburi în mod eficient. O schemă stea poate fi utilizată ca sursă fără a proiecta o structură cub în majoritatea sistemelor OLAP majore.
  • Prin activarea unor scheme de performanță specifice care pot fi aplicate interogărilor, software-ul procesorului de interogări din Star Schema poate oferi planuri de execuție mai bune.

Dezavantajul Schemei Stelare

  • Deoarece schema este foarte denormalizată, integritatea datelor nu este bine aplicată.
  • Nu este flexibil în ceea ce privește nevoile analitice.
  • Schemele stelelor nu consolidează relațiile de la mai multe la multe dintre entitățile de afaceri.