Co je hvězdné schéma v modelování datového skladu?

Co je hvězdné schéma?

Hvězdné schéma v datovém skladu je schéma, ve kterém může mít střed hvězdy jednu tabulku faktů a řadu přidružených tabulek dimenzí. Je známé jako hvězdné schéma, protože jeho struktura připomíná hvězdu. Datový model Star Schema je nejjednodušším typem schématu Data Warehouse. Je také známý jako Star Join Schema a je optimalizován pro dotazování velkých souborů dat.

Co je vícerozměrné schéma?

Vícerozměrné schéma je speciálně navržen pro modelování systémů datových skladů. Schémata jsou navržena tak, aby řešila jedinečné potřeby velmi rozsáhlých databází navržených pro analytické účely (OLAP).

Typy schématu datového skladu:

Následují 3 hlavní typy vícerozměrných schémat, z nichž každý má své jedinečné výhody.

Příklad datového modelování hvězdicového schématu

V následujícím příkladu hvězdného schématu je uprostřed tabulka faktů, která obsahuje klíče ke každé tabulce dimenzí, jako je ID prodejce, ID modelu, ID data, ID produktu, ID pobočky a další atributy, jako jsou prodané jednotky a výnosy.

Modelování dat hvězdného schématu
Příklad schématu hvězdy

Tabulky faktů

Tabulka faktů ve hvězdicovém schématu obsahuje fakta a je spojena s dimenzemi. Tabulka faktů má dva typy sloupců:

  • Sloupec, který obsahuje Fakta
  • Cizí klíč k tabulce dimenzí

Obecně je primární klíč tabulky faktů složený klíč, který se skládá ze všech cizích klíčů, které tvoří tabulku.

Tabulky faktů mohou obsahovat fakta na úrovni podrobností nebo agregovaná fakta. Tabulky faktů, které obsahují agregovaná fakta, se často nazývají souhrnné tabulky. Tabulky faktů obvykle obsahují fakta, která byla agregována na určitou úroveň.

Tabulky rozměrů

Dimenze je architektura, která kategorizuje data do hierarchie. Dimenze bez hierarchií a úrovní se nazývá plochá dimenze nebo seznam. Primární klíč každé tabulky dimenzí je součástí složeného primárního klíče tabulky faktů. Atribut dimenze je popisný textový atribut, který pomáhá popsat hodnotu dimenze. Tabulky faktů jsou obvykle větší než tabulky dimenzí.

Charakteristika hvězdného schématu

  • Každá dimenze ve hvězdicovém schématu je reprezentována jedinou tabulkou jedné dimenze.
  • Tabulka dimenzí by měla obsahovat sadu atributů.
  • Tabulka dimenzí je spojena s tabulkou faktů pomocí cizího klíče
  • Tabulky rozměrů nejsou vzájemně spojeny
  • Tabulka faktů by obsahovala klíč a míru
  • Schéma Star je snadno pochopitelné a poskytuje optimální využití disku.
  • Tabulky rozměrů nejsou normalizovány. Například na výše uvedeném obrázku Country_ID nemá vyhledávací tabulku země, jako by měl návrh OLTP.
  • Schéma je široce podporováno nástroji BI Tools

Výhody hvězdicového schématu

  • Hvězdicová schémata mají ve srovnání s jinými schématy pro načítání dat z vysoce normalizovaných transakčních schémat přímočařejší logiku spojení.
  • Na rozdíl od vysoce normalizovaných transakčních schémat hvězdicové schéma zjednodušuje běžnou obchodní logiku výkaznictví, jako je výkaznictví a období přes období.
  • Hvězdicová schémata jsou široce používána systémy OLAP k efektivnímu navrhování kostek. Hvězdicové schéma lze použít jako zdroj bez navrhování struktury krychle ve většině hlavních systémů OLAP.
  • Povolením konkrétních schémat výkonu, která lze použít na dotazy, může software procesoru dotazů ve Star Schema nabídnout lepší plány provádění.

Nevýhoda hvězdného schématu

  • Vzhledem k tomu, že schéma je vysoce denormalizované, integrita dat není dobře vynucována.
  • Není flexibilní z hlediska analytických potřeb.
  • Hvězdicová schémata neposilují vztahy many-to-many v rámci podnikatelských subjektů.