Mis on Star Schema andmelao modelleerimisel?
Mis on täheskeem?
Täheskeem andmelaos on skeem, mille tähe keskel võib olla üks faktitabel ja mitu seotud dimensioonitabelit. Seda tuntakse täheskeemina, kuna selle struktuur sarnaneb tähega. Star Schema andmemudel on andmelao skeemi kõige lihtsam tüüp. Seda tuntakse ka kui Star Join Schema ja see on optimeeritud suurte andmekogumite päringute tegemiseks.
Mis on mitmemõõtmeline skeem?
Mitmemõõtmeline skeem on spetsiaalselt loodud andmelaosüsteemide modelleerimiseks. Skeemid on loodud analüütiliseks otstarbeks loodud väga suurte andmebaaside ainulaadsete vajaduste rahuldamiseks (OLAP).
Andmehoidla skeemi tüübid:
Järgnevalt on toodud 3 peamist tüüpi mitmemõõtmelisi skeeme, millest igaühel on ainulaadsed eelised.
- Täheskeem
- Lumehelbe skeem
- Galaxy skeem
Star Schema andmete modelleerimise näide
Järgmises täheskeemi näites on faktitabel keskel, mis sisaldab võtmeid iga dimensioonitabeli jaoks, nagu edasimüüja_ID, mudeli ID, kuupäeva_ID, toote_ID, haru_ID ja muid atribuute, nagu müüdud ühikud ja tulu.
Faktitabelid
Tärniskeemis olev faktitabel sisaldab fakte ja on ühendatud dimensioonidega. Faktitabelis on kahte tüüpi veerge.
- Veerg, mis sisaldab fakte
- Mõõtmete võõrvõtmetabel
Üldiselt on faktitabeli primaarvõti liitvõti, mis koosneb kõigist tabeli moodustavatest võõrvõtmetest.
Faktitabelid võivad sisaldada detailitaseme fakte või koondatud fakte. Faktitabeleid, mis sisaldavad koondatud fakte, nimetatakse sageli koondtabeliteks. Faktitabelid sisaldavad tavaliselt fakte, mis on mingil tasemel koondatud.
Mõõtmete tabelid
Dimensioon on arhitektuur, mis liigitab andmed hierarhiasse. Hierarhiate ja tasemeteta dimensiooni nimetatakse tasaseks dimensiooniks või loendiks. Iga dimensioonitabeli primaarvõti on osa faktitabeli liitprimaarvõtmest. Dimensiooniatribuut on kirjeldav tekstiline atribuut, mis aitab kirjeldada mõõtmete väärtust. Faktitabelid on tavaliselt suuremad kui mõõtmete tabelid.
Star Schema omadused
- Iga täheskeemi dimensioon on esindatud ainsa ühemõõtmelise tabeliga.
- Dimensioonitabel peaks sisaldama atribuutide komplekti.
- Dimensioonitabel ühendatakse faktitabeliga võõrvõtme abil
- Mõõtmistabelid ei ole omavahel ühendatud
- Faktitabel sisaldab võtit ja mõõdet
- Skeemi Star on lihtne mõista ja see tagab optimaalse ketta kasutamise.
- Mõõtmistabeleid ei ole normaliseeritud. Näiteks ülaltoodud joonisel pole riigi ID-l riigi otsingutabelit, nagu oleks OLTP-kujundusel.
- Skeemi toetab laialdaselt BI tööriistad
Star Schema eelised
- Tärniskeemidel on teiste skeemidega võrreldes arusaadavam liitumisloogika kõrgelt normaliseeritud tehinguskeemidelt andmete toomiseks.
- Erinevalt väga normaliseeritud tehinguskeemidest lihtsustab tärniskeem tavalist äriaruandluse loogikat, nagu aruandlus ja perioodide lõikes.
- OLAP-süsteemid kasutavad kuubikute tõhusaks kujundamiseks laialdaselt täheskeeme. Tärniskeemi saab enamikus suuremates OLAP-süsteemides kasutada allikana ilma kuubistruktuuri kujundamata.
- Lubades konkreetsed jõudlusskeemid, mida saab päringutele rakendada, võib Star Schema päringuprotsessori tarkvara pakkuda paremaid täitmisplaane.
Star Schema puudus
- Kuna skeem on suurel määral denormaliseeritud, ei jõustata andmete terviklikkust hästi.
- Pole analüütiliste vajaduste osas paindlik.
- Täheskeemid ei tugevda palju-palju suhteid äriüksuste sees.