Mi az a Star Schema az adattárház modellezésben?

Mi az a Star Schema?

Csillag séma Az adattárházban egy olyan séma, amelyben a csillag közepén egy ténytábla és számos kapcsolódó dimenziótábla lehet. Csillagsémaként ismert, mivel szerkezete csillagra hasonlít. A Star Schema adatmodell a Data Warehouse séma legegyszerűbb típusa. Star Join Schema néven is ismert, és nagy adathalmazok lekérdezésére van optimalizálva.

Mi az a többdimenziós séma?

Többdimenziós séma kifejezetten adattárházi rendszerek modellezésére szolgál. A sémákat úgy tervezték, hogy megfeleljenek az elemzési célra tervezett nagyon nagy adatbázisok egyedi igényeinek (OLAP).

Az adattárház-séma típusai:

Az alábbiakban a többdimenziós sémák 3 fő típusát mutatjuk be, amelyek mindegyikének megvannak a maga egyedi előnyei.

Példa a csillagséma adatmodellezésére

A következő csillagséma-példában a ténytábla van a közepén, amely tartalmazza az összes dimenziótáblázat kulcsait, például a Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID és egyéb attribútumokat, például az eladott egységek és a bevételt.

Star Schema adatmodellezés
Példa a csillagséma diagramra

Ténytáblázatok

A csillagsémában lévő ténytáblázat tényeket tartalmaz, és dimenziókhoz kapcsolódik. A ténytáblázatnak kétféle oszlopa van:

  • Tényeket tartalmazó oszlop
  • Idegenkulcs a méretekhez táblázat

Általában a ténytáblázat elsődleges kulcsa egy összetett kulcs, amely a táblát alkotó összes idegen kulcsból áll.

A ténytáblázatok részletszintű tényeket vagy összesített tényeket tartalmazhatnak. Az összesített tényeket tartalmazó ténytáblákat gyakran összefoglaló táblázatoknak nevezik. A ténytáblázatok általában olyan tényeket tartalmaznak, amelyeket valamilyen szinten összesítettek.

Mérettáblázatok

A dimenzió egy olyan architektúra, amely az adatokat hierarchiában kategorizálja. A hierarchiák és szintek nélküli dimenziókat lapos dimenziónak vagy listának nevezzük. Minden dimenziótábla elsődleges kulcsa a ténytábla összetett elsődleges kulcsának része. A dimenzióattribútum egy leíró, szöveges attribútum, amely segít a méretérték leírásában. A ténytáblázatok általában nagyobbak, mint a mérettáblázatok.

A Star Schema jellemzői

  • A csillagséma minden dimenziója az egyetlen egydimenziós táblázattal van ábrázolva.
  • A dimenziótáblának tartalmaznia kell az attribútumkészletet.
  • A dimenziótábla egy idegen kulccsal csatlakozik a ténytáblához
  • A mérettáblázatok nincsenek egymással összekötve
  • A ténytáblázat kulcsot és mértéket tartalmazna
  • A Star séma könnyen érthető, és optimális lemezhasználatot biztosít.
  • A mérettáblázatok nincsenek normalizálva. Például a fenti ábrán az Country_ID nem rendelkezik országkereső táblázattal, mint egy OLTP-tervben.
  • A sémát a BI Tools széles körben támogatja

A Star Schema előnyei

  • A csillagsémák egyszerűbb csatlakozási logikával rendelkeznek, mint más sémák, amelyek segítségével lekérhetők az adatok erősen normalizált tranzakciós sémákból.
  • A nagymértékben normalizált tranzakciós sémákkal szemben a csillagséma leegyszerűsíti az általános üzleti jelentési logikát, például a jelentéskészítést és a perióduson átívelő sémákat.
  • A csillagsémákat széles körben használják az OLAP rendszerek a kockák hatékony tervezésére. A legtöbb fő OLAP rendszerben egy csillagséma használható forrásként kockastruktúra tervezése nélkül.
  • A lekérdezésekre alkalmazható speciális teljesítménysémák engedélyezésével a Star Schema lekérdezésfeldolgozó szoftvere jobb végrehajtási terveket kínál.

A Star Schema hátránya

  • Mivel a séma erősen denormalizált, az adatintegritás nem érvényesül megfelelően.
  • Nem rugalmas az elemzési igények szempontjából.
  • A csillagsémák nem erősítik meg a sok-sok kapcsolatokat az üzleti entitásokon belül.