Mi az a Star Schema az adattárház modellezésben?
Mi az a Star Schema?
Csillag séma Az adattárházban egy olyan séma, amelyben a csillag közepén egy ténytábla és számos kapcsolódó dimenziótábla lehet. Csillagsémaként ismert, mivel szerkezete csillagra hasonlít. A Star Schema adatmodell a Data Warehouse séma legegyszerűbb típusa. Star Join Schema néven is ismert, és nagy adathalmazok lekérdezésére van optimalizálva.
Mi az a többdimenziós séma?
Többdimenziós séma kifejezetten adattárházi rendszerek modellezésére szolgál. A sémákat úgy tervezték, hogy megfeleljenek az elemzési célra tervezett nagyon nagy adatbázisok egyedi igényeinek (OLAP).
Az adattárház-séma típusai:
Az alábbiakban a többdimenziós sémák 3 fő típusát mutatjuk be, amelyek mindegyikének megvannak a maga egyedi előnyei.
- Csillag séma
- Hópehely séma
- Galaxy Schema
Példa a csillagséma adatmodellezésére
A következő csillagséma-példában a ténytábla van a közepén, amely tartalmazza az összes dimenziótáblázat kulcsait, például a Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID és egyéb attribútumokat, például az eladott egységek és a bevételt.
Ténytáblázatok
A csillagsémában lévő ténytáblázat tényeket tartalmaz, és dimenziókhoz kapcsolódik. A ténytáblázatnak kétféle oszlopa van:
- Tényeket tartalmazó oszlop
- Idegenkulcs a méretekhez táblázat
Általában a ténytáblázat elsődleges kulcsa egy összetett kulcs, amely a táblát alkotó összes idegen kulcsból áll.
A ténytáblázatok részletszintű tényeket vagy összesített tényeket tartalmazhatnak. Az összesített tényeket tartalmazó ténytáblákat gyakran összefoglaló táblázatoknak nevezik. A ténytáblázatok általában olyan tényeket tartalmaznak, amelyeket valamilyen szinten összesítettek.
Mérettáblázatok
A dimenzió egy olyan architektúra, amely az adatokat hierarchiában kategorizálja. A hierarchiák és szintek nélküli dimenziókat lapos dimenziónak vagy listának nevezzük. Minden dimenziótábla elsődleges kulcsa a ténytábla összetett elsődleges kulcsának része. A dimenzióattribútum egy leíró, szöveges attribútum, amely segít a méretérték leírásában. A ténytáblázatok általában nagyobbak, mint a mérettáblázatok.
A Star Schema jellemzői
- A csillagséma minden dimenziója az egyetlen egydimenziós táblázattal van ábrázolva.
- A dimenziótáblának tartalmaznia kell az attribútumkészletet.
- A dimenziótábla egy idegen kulccsal csatlakozik a ténytáblához
- A mérettáblázatok nincsenek egymással összekötve
- A ténytáblázat kulcsot és mértéket tartalmazna
- A Star séma könnyen érthető, és optimális lemezhasználatot biztosít.
- A mérettáblázatok nincsenek normalizálva. Például a fenti ábrán az Country_ID nem rendelkezik országkereső táblázattal, mint egy OLTP-tervben.
- A sémát a BI Tools széles körben támogatja
A Star Schema előnyei
- A csillagsémák egyszerűbb csatlakozási logikával rendelkeznek, mint más sémák, amelyek segítségével lekérhetők az adatok erősen normalizált tranzakciós sémákból.
- A nagymértékben normalizált tranzakciós sémákkal szemben a csillagséma leegyszerűsíti az általános üzleti jelentési logikát, például a jelentéskészítést és a perióduson átívelő sémákat.
- A csillagsémákat széles körben használják az OLAP rendszerek a kockák hatékony tervezésére. A legtöbb fő OLAP rendszerben egy csillagséma használható forrásként kockastruktúra tervezése nélkül.
- A lekérdezésekre alkalmazható speciális teljesítménysémák engedélyezésével a Star Schema lekérdezésfeldolgozó szoftvere jobb végrehajtási terveket kínál.
A Star Schema hátránya
- Mivel a séma erősen denormalizált, az adatintegritás nem érvényesül megfelelően.
- Nem rugalmas az elemzési igények szempontjából.
- A csillagsémák nem erősítik meg a sok-sok kapcsolatokat az üzleti entitásokon belül.