Hva er OLAP? Kube, analytisk Operasjoner i Data Warehouse
Hva er OLAP?
Online analytisk prosessering (OLAP) er en programvarekategori som lar brukere analysere informasjon fra flere databasesystemer samtidig. Det er en teknologi som gjør det mulig for analytikere å trekke ut og se forretningsdata fra forskjellige synsvinkler.
Analytikere trenger ofte å gruppere, samle og slå sammen data. Disse OLAP-operasjonene innen datautvinning er ressurskrevende. Med OLAP kan data forhåndsberegnes og pre-aggregeres, noe som gjør analysen raskere.
OLAP-databaser er delt inn i én eller flere kuber. Kubene er utformet på en slik måte at det blir enkelt å lage og vise rapporter. OLAP står for Online Analytical Processing.
OLAP kube

Kjernen i OLAP-konseptet er en OLAP-kube. OLAP-kuben er en datastruktur optimalisert for svært rask dataanalyse.
OLAP-kuben består av numeriske fakta kalt mål som er kategorisert etter dimensjoner. OLAP Cube kalles også hyperkube.
Vanligvis utføres dataoperasjoner og analyse ved hjelp av det enkle regnearket, der dataverdier er ordnet i rad- og kolonneformat. Dette er ideelt for todimensjonale data. Imidlertid inneholder OLAP flerdimensjonale data, med data som vanligvis er hentet fra en annen og ikke-relatert kilde. Å bruke et regneark er ikke et optimalt alternativ. Kuben kan lagre og analysere flerdimensjonale data på en logisk og ryddig måte.
Hvordan virker det?
Et datavarehus vil trekke ut informasjon fra flere datakilder og formater som tekstfiler, excel-ark, multimediafiler, etc.
De utpakkede dataene renses og transformeres. Data lastes inn i en OLAP-server (eller OLAP-kube) hvor informasjon er forhåndsberegnet på forhånd for videre analyse.
Grunnleggende analytiske operasjoner av OLAP
Fire typer analytiske OLAP-operasjoner er:
- Rull opp
- Bore ned
- Skjære og kutte
- Pivot (roter)
1) Roll-up:
Sammendrag er også kjent som «konsolidering» eller «aggregering». Roll-up-operasjonen kan utføres på 2 måter
- Redusere dimensjoner
- Klatring opp i konsepthierarkiet. Konsepthierarki er et system for å gruppere ting basert på deres rekkefølge eller nivå.
Tenk på følgende diagram
- I dette eksemplet, byer New jersey og Lost Angles og rullet opp til landet USA
- Salgstallene til New Jersey og Los Angeles er henholdsvis 440 og 1560. De blir 2000 etter roll-up
- I denne aggregeringsprosessen beveger data stedshierarkiet opp fra by til land.
- I opprullingsprosessen må minst én eller flere dimensjoner fjernes. I dette eksemplet er By-dimensjonen fjernet.
2) Drill-down
I drill-down er data fragmentert i mindre deler. Det er det motsatte av rollup-prosessen. Det kan gjøres via
- Flytte ned i konsepthierarkiet
- Å øke en dimensjon
Tenk på diagrammet ovenfor
- Kvartal Q1 er boret ned til månedene januar, februar og mars. Tilsvarende salg er også registre.
- I dette eksemplet legges dimensjonsmåneder til.
3) Skjær:
Her velges én dimensjon, og en ny underkube lages.
Følgende diagram forklarer hvordan skiveoperasjonen utførte:
- Dimensjonstid deles med Q1 som filter.
- En ny kube opprettes helt.
Den sier:
Denne operasjonen ligner på en skive. Forskjellen i terninger er at du velger 2 eller flere dimensjoner som resulterer i opprettelsen av en underkube.
4) Pivot
I Pivot roterer du dataaksene for å gi en erstatningspresentasjon av data.
I følgende eksempel er pivoten basert på varetyper.
Typer OLAP-systemer
OLAP hierarkisk struktur
Type OLAP | Forklaring |
---|---|
Relasjonell OLAP(ROLAP): | ROLAP er et utvidet RDBMS sammen med flerdimensjonal datakartlegging for å utføre standard relasjonsoperasjon. |
Flerdimensjonal OLAP (MOLAP) | MOLAP Implementerer operasjon i flerdimensjonale data. |
Hybrid OnlineAnalytical Processing (HOLAP) | I HOLAP-tilnærmingen lagres de aggregerte totalene i en flerdimensjonal database mens de detaljerte dataene lagres i relasjonsdatabasen. Dette gir både dataeffektivitet til ROLAP-modellen og ytelsen til MOLAP-modellen. |
Desktop OLAP (DOLAP) | I Desktop OLAP laster en bruker ned en del av dataene fra databasen lokalt eller på skrivebordet og analyserer det.
DOLAP er relativt billigere å distribuere siden det tilbyr svært få funksjoner sammenlignet med andre OLAP-systemer. |
Web OLAP (WOLAP) | Web OLAP som er OLAP-systemet tilgjengelig via nettleseren. WOLAP er en tre-lags arkitektur. Den består av tre komponenter: klient, mellomvare og en databaseserver. |
Mobil OLAP: | Mobile OLAP hjelper brukere med å få tilgang til og analysere OLAP-data ved å bruke sine mobile enheter |
Romlig OLAP: | SOLAP er laget for å lette håndteringen av både romlige og ikke-romlige data i et geografisk informasjonssystem (GIS) |
ROLAP
ROLAP arbeider med data som finnes i en relasjonsdatabase. Fakta- og dimensjonstabeller lagres som relasjonstabeller. Den tillater også flerdimensjonal analyse av data og er den raskest voksende OLAP.
Fordeler med ROLAP-modellen:
- Høy dataeffektivitet. Det tilbyr høy dataeffektivitet fordi spørringsytelse og tilgangsspråk er optimalisert spesielt for flerdimensjonal dataanalyse.
- Skalerbarhet. Denne typen OLAP-system tilbyr skalerbarhet for å håndtere store datamengder, og selv når dataene øker jevnt.
Ulemper med ROLAP-modellen:
- Etterspørsel etter høyere ressurser: ROLAP trenger høy utnyttelse av arbeidskraft, programvare og maskinvareressurser.
- Samlet databegrensninger. Bruk av ROLAP-verktøy SQL for all beregning av aggregerte data. Det er imidlertid ingen fastsatte grenser for håndtering av beregninger.
- Treg søkeytelse. Spørringsytelsen i denne modellen er treg sammenlignet med MOLAP
MOLAP
MOLAP bruker array-baserte flerdimensjonale lagringsmotorer for å vise flerdimensjonale visninger av data. I utgangspunktet bruker de en OLAP-kube.
Lær mer om MOLAP her.
Hybrid OLAP
Hybrid OLAP er en blanding av både ROLAP og MOLAP. Den tilbyr rask beregning av MOLAP og høyere skalerbarhet av ROLAP. HOLAP bruker to databaser.
- Aggregerte eller beregnede data lagres i en flerdimensjonal OLAP-kube
- Detaljert informasjon lagres i en relasjonsdatabase.
Fordeler med Hybrid OLAP:
- Denne typen OLAP bidrar til å spare diskplass, og den forblir også kompakt, noe som bidrar til å unngå problemer knyttet til tilgangshastighet og bekvemmelighet.
- Hybrid HOLAP bruker kubeteknologi som gir raskere ytelse for alle typer data.
- ROLAP oppdateres umiddelbart og HOLAP-brukere har tilgang til disse øyeblikkelig oppdaterte sanntidsdataene. MOLAP bringer rensing og konvertering av data og forbedrer dermed datarelevansen. Dette gir det beste fra begge verdener.
Ulemper med Hybrid OLAP:
- Større kompleksitetsnivå: Den største ulempen med HOLAP-systemer er at den støtter både ROLAP- og MOLAP-verktøy og -applikasjoner. Dermed er det veldig komplisert.
- Potensielle overlappinger: Det er større sjanser for overlapping, spesielt i funksjonene deres.
Fordeler med OLAP
- OLAP er en plattform for alle typer virksomhet, inkludert planlegging, budsjettering, rapportering og analyse.
- Informasjon og beregninger er konsistente i en OLAP-kube. Dette er en avgjørende fordel.
- Lag og analyser raskt «Hva om»-scenarier
- Søk enkelt i OLAP-databasen etter brede eller spesifikke termer.
- OLAP gir byggesteinene for forretningsmodelleringsverktøy, datautvinningsverktøy, ytelsesrapporteringsverktøy.
- Lar brukere gjøre skjære- og terninger-data alt etter forskjellige dimensjoner, mål og filtre.
- Det er bra for å analysere tidsserier.
- Det er enkelt å finne noen klynger og uteliggere med OLAP.
- Det er et kraftig visualisering online analytisk prosesssystem som gir raskere responstider
Ulemper med OLAP
- OLAP krever organisering av data i et stjerne- eller snøfnuggskjema. Disse skjemaene er kompliserte å implementere og administrere
- Du kan ikke ha et stort antall dimensjoner i en enkelt OLAP-kube
- Transaksjonsdata kan ikke nås med OLAP-systemet.
- Enhver endring i en OLAP-kube trenger en full oppdatering av kuben. Dette er en tidkrevende prosess
Sammendrag
- OLAP inn datalager er en teknologi som gjør det mulig for analytikere å trekke ut og se forretningsdata fra forskjellige synsvinkler.
- Kjernen i OLAP-konseptet er en OLAP-kube.
- Ulike forretningsapplikasjoner og andre dataoperasjoner krever bruk av OLAP Cube.
- Det er primære fem typer analytiske OLAP-operasjoner i datavarehus: 1) Roll-up 2) Drill-down 3) Slice 4) Terninger og 5) Pivot
- Tre typer mye brukte OLAP-systemer er MOLAP, ROLAP og Hybrid OLAP.
- Desktop OLAP, Web OLAP og Mobile OLAP er noen andre typer OLAP-systemer.