Što je zvjezdana shema u modeliranju skladišta podataka?
Što je zvjezdana shema?
Shema zvijezda u skladištu podataka, je shema u kojoj središte zvijezde može imati jednu tablicu činjenica i niz pridruženih dimenzijskih tablica. Poznata je kao zvjezdana shema jer njena struktura podsjeća na zvijezdu. Model podataka Star Schema je najjednostavniji tip sheme skladišta podataka. Također je poznata kao shema zvjezdanog pridruživanja i optimizirana je za postavljanje upita velikim skupovima podataka.
Što je višedimenzionalna shema?
Višedimenzionalna shema je posebno dizajniran za modeliranje sustava skladišta podataka. Sheme su osmišljene kako bi odgovorile na jedinstvene potrebe vrlo velikih baza podataka dizajniranih za analitičku svrhu (OLAP).
Vrste sheme skladišta podataka:
Slijede 3 glavne vrste višedimenzionalnih shema od kojih svaka ima svoje jedinstvene prednosti.
- Shema zvijezda
- Shema snježne pahulje
- Shema galaksije
Primjer modeliranja podataka zvjezdanom shemom
U sljedećem primjeru zvjezdane sheme, tablica činjenica je u središtu koja sadrži ključeve svake tablice dimenzija kao što su Dealer_ID, ID modela, Date_ID, Product_ID, Branch_ID i druge atribute kao što su prodane jedinice i prihod.
Tablice činjenica
Tablica činjenica u zvjezdastoj shemi sadrži činjenice i povezana je s dimenzijama. Tablica činjenica ima dvije vrste stupaca:
- Stupac koji uključuje činjenice
- Strani ključ za tablicu dimenzija
Općenito, primarni ključ tablice činjenica je složeni ključ koji se sastoji od svih stranih ključeva koji čine tablicu.
Tablice činjenica mogu sadržavati činjenice na razini pojedinosti ili skupne činjenice. Tablice činjenica koje uključuju agregirane činjenice često se nazivaju tablicama sažetka. Tablice činjenica obično sadrže činjenice koje su agregirane do određene razine.
Tablice dimenzija
Dimenzija je arhitektura koja kategorizira podatke u hijerarhiji. Dimenzija bez hijerarhija i razina naziva se ravnom dimenzijom ili popisom. Primarni ključ svake dimenzijske tablice dio je složenog primarnog ključa tablice činjenica. Atribut dimenzije je opisni, tekstualni atribut koji pomaže u opisivanju dimenzijske vrijednosti. Tablice činjenica obično su veće od tablica dimenzija.
Karakteristike zvjezdane sheme
- Svaka dimenzija u zvjezdastoj shemi predstavljena je jedinom jednodimenzionalnom tablicom.
- Tablica dimenzija treba sadržavati skup atributa.
- Tablica dimenzija pridružuje se tablici činjenica pomoću stranog ključa
- Tablice dimenzija nisu međusobno spojene
- Tablica činjenica sadržavala bi ključ i mjeru
- Star shema je jednostavna za razumijevanje i pruža optimalnu upotrebu diska.
- Tablice dimenzija nisu normalizirane. Na primjer, na gornjoj slici Country_ID nema tablicu za pretraživanje zemlje kao što bi to imao OLTP dizajn.
- Shema je široko podržana od strane BI alata
Prednosti zvjezdane sheme
- Zvjezdaste sheme imaju jednostavniju logiku spajanja u usporedbi s drugim shemama za dohvaćanje podataka iz visoko normaliziranih transakcijskih shema.
- Za razliku od visoko normaliziranih transakcijskih shema, shema zvijezda pojednostavljuje uobičajenu logiku poslovnog izvješćivanja, kao što je izvješćivanje i razdoblje u odnosu na razdoblje.
- Zvjezdane sheme naširoko koriste OLAP sustavi za učinkovito dizajniranje kocki. Zvjezdasta shema može se koristiti kao izvor bez dizajniranja strukture kocke u većini glavnih OLAP sustava.
- Omogućavanjem specifičnih shema izvedbe koje se mogu primijeniti na upite, softver procesora upita u Star Schemi može ponuditi bolje planove izvršenja.
Nedostatak zvjezdane sheme
- Budući da je shema vrlo denormalizirana, integritet podataka nije dobro nametnut.
- Nije fleksibilan u smislu analitičkih potreba.
- Sheme zvijezda ne jačaju odnose više-prema-više unutar poslovnih subjekata.