Mitä on ulottuvuusmallinnus tietovarastossa? Opi tyypit
Dimensiomallinnus
Dimensiomallinnus (DM) on tietorakennetekniikka, joka on optimoitu tietojen tallentamiseen tietovarastossa. Dimensiomallinnuksen tarkoituksena on optimoida tietokanta tiedon nopeampaa hakua varten. Ralph Kimball on kehittänyt Dimensional Modeling -konseptin, joka koostuu "fakta"- ja "ulottuvuus"taulukoista.
Tietovaraston dimensiomalli on suunniteltu lukemaan, tiivistämään ja analysoimaan tietovarastossa olevia numeerisia tietoja, kuten arvoja, saldoja, laskelmia, painoja jne. Sitä vastoin relaatiomallit on optimoitu tietojen lisäämistä, päivittämistä ja poistamista varten reaaliaikaisessa online-tapahtumajärjestelmässä.
Näillä dimensio- ja relaatiomalleilla on ainutlaatuinen tapa tallentaa tietoja, jolla on erityisiä etuja.
Esimerkiksi relaatiomoodissa normalisointi- ja ER-mallit vähentävät datan redundanssia. Päinvastoin, tietovaraston dimensiomalli järjestää tiedot siten, että tiedon hakeminen ja raporttien luominen on helpompaa.
Siksi dimensiomalleja käytetään tietovarastojärjestelmät eikä se sovi hyvin relaatiojärjestelmiin.
Dimensiotietomallin elementit
tosiasia
Faktat ovat mittauksia/mittareita tai faktoja liiketoimintaprosessistasi. Myynnin liiketoimintaprosessissa mittaus olisi neljännesvuosittainen myyntiluku
Ulottuvuus
Dimension tarjoaa liiketoimintaprosessitapahtumaa ympäröivän kontekstin. Yksinkertaisesti sanottuna ne kertovat tosiasian kuka, mitä, missä. Myynti-liiketoimintaprosessissa neljännesvuosittaisen myyntimäärän mitat olisivat
- Kuka – asiakkaiden nimet
- Missä - Sijainti
- Mitä - Tuotteen nimi
Toisin sanoen ulottuvuus on ikkuna, josta voit tarkastella faktatietoja.
Ominaisuudet
Attribuutit ovat dimensioiden erilaisia ominaisuuksia ulottuvuustietomallinnuksen yhteydessä.
Sijainti-ulottuvuuden attribuutit voivat olla
- Osavaltio
- Maa
- Postinumero jne.
Attribuutteja käytetään etsimään, suodattamaan tai luokittelemaan tosiasioita. Mittataulukot sisältävät attribuutteja
Faktataulukko
Faktataulukko on ensisijainen taulukko ulottuvuusmallinnuksessa.
Faktataulukko sisältää
- Mittoja/faktoja
- Ulkoavain mittataulukkoon
Mittataulukko
- Dimensiotaulukko sisältää tosiasian mitat.
- Ne liitetään faktataulukkoon vieraalla avaimella.
- Mittataulukot ovat denormalisoituja taulukoita.
- Dimensioattribuutit ovat ulottuvuustaulukon eri sarakkeita
- Dimensions tarjoaa tosiasioita kuvaavia ominaisuuksia niiden attribuuttien avulla
- Mittojen lukumäärälle ei ole asetettu asetettua rajaa
- Dimensio voi sisältää myös yhden tai useamman hierarkkisen suhteen
Tietovaraston mittatyypit
Seuraavat ovat Tietovaraston mittatyypit:
- Mukautettu mitta
- Tukijalkin mitat
- Kutistettu mitta
- Roolipeliulottuvuus
- Mitat mittataulukkoon
- Roskapostin ulottuvuus
- Degeneroitunut ulottuvuus
- Vaihdettava koko
- Vaiheen mitta
Dimensiomallinnuksen vaiheet
Mittamallinnuksen luonnin tarkkuus määrää tietovarastoasi toteutuksen onnistumisen. Tässä on vaiheet ulottuvuusmallin luomiseen
- Tunnista liiketoimintaprosessi
- Tunnista rakeisuus (yksityiskohtaisuus)
- Tunnista mitat
- Tunnista tosiasiat
- Rakenna Tähti
Mallin tulee kuvata liiketoimintaprosessisi Miksi, Kuinka paljon, Milloin/Missä/Kuka ja Mitä
Vaihe 1) Tunnista liiketoimintaprosessi
Varsinaisen liiketoimintaprosessin tunnistaminen datarehousen tulisi kattaa. Tämä voi olla markkinointi, myynti, HR jne tietojen analysointi organisaation tarpeisiin. Liiketoimintaprosessin valinta riippuu myös prosessia varten saatavilla olevan tiedon laadusta. Se on tietomallinnusprosessin tärkein vaihe, ja tässä epäonnistumisella olisi peräkkäisiä ja korjaamattomia puutteita.
Liiketoimintaprosessin kuvaamiseen voit käyttää pelkkää tekstiä tai perusliiketoimintaprosessien mallinnusmerkintää (BPMN) tai yhtenäistä mallinnuskieltä (UML).
Vaihe 2) Tunnista vilja
Grain kuvaa liiketoiminnan ongelman/ratkaisun yksityiskohtaisuuden. Se on prosessi, jolla tunnistetaan tietovarastosi minkä tahansa taulukon alhaisin tietotaso. Jos taulukko sisältää jokaisen päivän myyntitiedot, sen tulee olla päivittäistä tarkkuutta. Jos taulukko sisältää kunkin kuukauden kokonaismyyntitiedot, se on kuukausittainen.
Tässä vaiheessa vastaat kysymyksiin, kuten
- Pitääkö meidän varastoida kaikki saatavilla olevat tuotteet vai vain muutama tuotetyyppi? Tämä päätös perustuu Datawarehouselle valittuihin liiketoimintaprosesseihin
- Tallennammeko tuotemyyntitiedot kuukausittain, viikoittain, päivittäin vai tunneittain? Tämä päätös riippuu johtajien pyytämien raporttien luonteesta
- Miten yllä olevat kaksi vaihtoehtoa vaikuttavat tietokannan kokoon?
Esimerkki viljasta:
MNC:n toimitusjohtaja haluaa löytää tiettyjen tuotteiden myynnin eri paikoista päivittäin.
Joten vilja on "tuotemyyntitiedot sijainnin mukaan päiväkohtaisesti".
Vaihe 3) Tunnista mitat
Mitat ovat substantiivit, kuten päivämäärä, varasto, varasto jne. Näihin ulottuvuuksiin kaikki tiedot tulee tallentaa. Päivämäärä-ulottuvuus voi esimerkiksi sisältää tietoja, kuten vuosi, kuukausi ja viikonpäivä.
Esimerkki mitoista:
MNC:n toimitusjohtaja haluaa löytää tiettyjen tuotteiden myynnin eri paikoista päivittäin.
Mitat: Tuote, sijainti ja aika
Ominaisuudet: Tuotteelle: Tuoteavain (vieraan avain), nimi, tyyppi, tekniset tiedot
Hierarkiat: Sijainti: Maa, osavaltio, kaupunki, katuosoite, nimi
Vaihe 4) Tunnista tosiasia
Tämä vaihe on yhdistetty järjestelmän yrityskäyttäjiin, koska he saavat pääsyn tietovarastoon tallennettuihin tietoihin. Suurin osa tietotaulukon riveistä on numeerisia arvoja, kuten hinta tai yksikköhinta jne.
Esimerkki faktoista:
MNC:n toimitusjohtaja haluaa löytää tiettyjen tuotteiden myynnin eri paikoista päivittäin.
Tässä on myynnin summa tuotteiden mukaan sijainnin ja ajan mukaan.
Vaihe 5) Rakenna kaavio
Tässä vaiheessa otat käyttöön ulottuvuusmallin. Kaava ei ole muuta kuin tietokantarakenne (taulukkojen järjestely). On olemassa kaksi suosittua mallia
- Tähtiohjelma
Tähtiskeeman arkkitehtuuri on helppo suunnitella. Sitä kutsutaan tähtiskeemaksi, koska kaavio muistuttaa tähteä, jonka pisteet säteilevät keskustasta. Tähden keskipiste koostuu faktataulukosta ja tähden pisteet mittataulukoista.
Faktataulukot tähtiskeemassa, joka on kolmas normaalimuoto, kun taas mittataulukot on denormalisoitu.
- Lumihiutaleohjelma
Lumihiutaleskeema on tähtikaavion laajennus. Lumihiutaleskeemassa jokainen ulottuvuus normalisoidaan ja liitetään useampaan ulottuvuustaulukkoon.
Tarkista myös: - Tähti- ja lumihiutalekaavio tietovarastossa malliesimerkeillä
Mittamallinnuksen säännöt
Seuraavat ovat mittamallinnuksen säännöt ja periaatteet:
- Lataa atomidataa ulottuvuusrakenteisiin.
- Rakenna ulottuvuusmalleja liiketoimintaprosessien ympärille.
- On varmistettava, että jokaiseen tietotaulukkoon liittyy päivämääräulottuvuustaulukko.
- Varmista, että kaikki yksittäisen tietotaulukon faktat ovat samalla tarkkuudella tai tarkkuudella.
- On tärkeää tallentaa raporttitunnisteet ja suodatinverkkotunnuksen arvot ulottuvuustaulukoihin
- On varmistettava, että mittataulukot käyttävät sijaisavainta
- Tasapainottaa jatkuvasti vaatimuksia ja todellisuutta tarjotakseen liiketoimintaratkaisuja päätöksenteon tueksi
Mittamallinnuksen edut
- Mittojen standardointi mahdollistaa helpon raportoinnin eri liiketoiminta-alueilla.
- Mittataulukot tallentavat mittatietojen historian.
- Sen avulla voidaan ottaa käyttöön täysin uusi ulottuvuus ilman suuria häiriöitä tietotaulukkoon.
- Ulottuvana myös tallentaa tietoja siten, että tiedoista on helpompi hakea tietoa, kun tiedot on tallennettu tietokantaan.
- Normalisoituun malliin verrattuna mittataulukko on helpompi ymmärtää.
- Tiedot on ryhmitelty selkeisiin ja yksinkertaisiin liiketoimintakategorioihin.
- Dimensiomalli on yritykselle hyvin ymmärrettävä. Tämä malli perustuu liiketoimintatermeihin, jotta yritys tietää, mitä kukin tosiasia, ulottuvuus tai attribuutti tarkoittaa.
- Dimensionaaliset mallit on muotoiltu ja optimoitu nopeaa tiedon kyselyä varten. Monet relaatiotietokanta-alustat tunnistavat tämän mallin ja optimoivat kyselyn suoritussuunnitelmat suorituskyvyn parantamiseksi.
- Tietovaraston ulottuvuusmallinnus luo skeeman, joka on optimoitu korkeaa suorituskykyä varten. Se tarkoittaa vähemmän liittymiä ja auttaa minimoimaan tietojen redundanssin.
- Dimensiomalli auttaa myös parantamaan kyselyn suorituskykyä. Se on denormalisoitunut, joten se on optimoitu kyselyä varten.
- Mittamallit mukautuvat mukavasti muutokseen. Ulottuvuustaulukoihin voidaan lisätä enemmän sarakkeita vaikuttamatta olemassa oleviin liiketoimintatiedon sovelluksiin, jotka käyttävät näitä taulukoita.
Mikä on moniulotteinen tietomalli tietovarastossa?
Moniulotteinen tietomalli tietovarastossa on malli, joka esittää dataa tietokuutioiden muodossa. Sen avulla voidaan mallintaa ja tarkastella tietoja useissa ulottuvuuksissa ja se määritellään ulottuvuuksien ja tosiasioiden mukaan. Moniulotteinen tietomalli luokitellaan yleensä keskeisen teeman ympärille ja sitä edustaa faktataulukko.
Yhteenveto
- Dimensiomalli on tietorakennetekniikka, joka on optimoitu Tietovaraston työkalut.
- Faktat ovat mittauksia/mittareita tai faktoja liiketoimintaprosessistasi.
- Dimension tarjoaa liiketoimintaprosessitapahtumaa ympäröivän kontekstin.
- Attribuutit ovat mittamallinnuksen erilaisia ominaisuuksia.
- Faktataulukko on ensisijainen taulukko ulottuvuusmallissa.
- Dimensiotaulukko sisältää tosiasian mitat.
- Faktoja on kolmenlaisia: 1. Additiiviset 2. Ei-additiiviset 3. Puolilisäiset.
- Mitat ovat mukautettuja, tukijalkoja, kutistettuja, roolileikkejä, mitoista ulottuvuuksiin taulukossa, roskapostissa, rappeutuneessa, vaihdettavissa ja askelmitat.
- Mittamallinnuksen viisi vaihetta ovat 1. Tunnista liiketoimintaprosessi 2. Tunnista Grain (yksityiskohtaisuus) 3. Tunnista mitat 4. Tunnista tosiasiat 5. Rakenna tähti
- Tietovaraston ulottuvuusmallinnuksessa on varmistettava, että jokaiseen tietotaulukkoon on liitetty päivämääräulottuvuustaulukko.