Schéma sněhové vločky v modelu datového skladu

Co je schéma sněhové vločky?

Schéma sněhové vločky v datovém skladu je logické uspořádání tabulek ve vícerozměrné databázi tak, že ER diagram připomíná tvar sněhové vločky. Schéma sněhové vločky je rozšířením hvězdného schématu a přidává další rozměry. Tabulky dimenzí jsou normalizovány, což rozděluje data do dalších tabulek.

Příklad schématu sněhové vločky

V následujícím příkladu schématu sněhové vločky je Země dále normalizována do samostatné tabulky.

Schéma sněhové vločky
Příklad schématu sněhové vločky

Charakteristika schématu sněhové vločky

  • Hlavní výhodou schématu sněhových vloček je využití menšího místa na disku.
  • Do schématu je přidána dimenze, která se snáze implementuje
  • Kvůli více tabulkám se snižuje výkon dotazů
  • Primárním problémem, kterému budete čelit při používání schématu sněhové vločky, je to, že musíte vynaložit větší úsilí na údržbu, protože máte více vyhledávacích tabulek.

Výhoda schématu sněhové vločky

  • Primární výhodou schématu Snowflake je jeho schopnost snížit požadavky na diskové úložiště a spojit menší vyhledávací tabulky, což zlepšuje výkon dotazů.
  • Poskytuje větší škálovatelnost ve vzájemném vztahu mezi komponentami a úrovněmi dimenzí.
  • Neexistuje žádná redundance, takže se snadněji udržuje.

Nevýhoda schématu sněhové vločky

  • Významnou nevýhodou schématu sněhových vloček je zvýšená potřeba údržby.
  • Složité dotazy jsou náročné na pochopení.
  • Větší počet tabulek znamená více spojení, takže delší doba provádění dotazu.

Co je to schéma galaxie?

A schéma galaxie obsahuje dvě tabulky faktů, které mezi sebou sdílejí tabulky dimenzí. Říká se mu také Fact Constellation Schema. Na schéma se pohlíží jako na sbírku hvězd, odtud název Galaxy Schema.

schéma galaxie
Příklad schématu galaxie

Jak můžete vidět na výše uvedeném příkladu, existují dvě tabulky faktů

  1. Revenue
  2. Produkt.

Ve sdílení schématu Galaxy se dimenze nazývají Conformed Dimensions.

Charakteristika schématu galaxií

  • Dimenze v tomto schématu jsou rozděleny do samostatných dimenzí na základě různých úrovní hierarchie.
  • Pokud má geografie například čtyři úrovně hierarchie, jako je region, země, stát a město, pak by schéma galaxie mělo mít čtyři dimenze.
  • Navíc je možné sestavit tento typ schématu rozdělením jednohvězdičkového schématu do více hvězdicových schémat.
  • Dimenze jsou v tomto schématu velké, což je potřeba k sestavení na základě úrovní hierarchie.
  • Toto schéma je užitečné pro agregaci tabulek faktů pro lepší pochopení.

Co je Star Cluster Schéma?

Schéma Snowflake obsahuje plně rozšířené hierarchie. To však může schéma zkomplikovat a vyžaduje další spojení. Na druhé straně, hvězdné schéma obsahuje plně zhroucené hierarchie, což může vést k redundanci. Takže nejlepším řešením může být rovnováha mezi těmito dvěma schématy, což je hvězda Cluster Návrh schématu.

star Cluster Schéma
Příklad hvězdy Cluster Schéma

Překrývající se dimenze lze nalézt jako rozvětvení v hierarchiích. K rozvětvení dochází, když entita působí jako rodič ve dvou různých dimenzionálních hierarchiích. Rozvětvené entity pak identifikované jako klasifikace se vztahy jedna k mnoha.