Hvad er OLAP? Terning, analytisk Operationer i Data Warehouse
Hvad er OLAP?
Online analytisk behandling (OLAP) er en kategori af software, der giver brugerne mulighed for at analysere information fra flere databasesystemer på samme tid. Det er en teknologi, der gør det muligt for analytikere at udtrække og se forretningsdata fra forskellige synsvinkler.
Analytikere har ofte behov for at gruppere, aggregere og samle data. Disse OLAP-operationer i datamining er ressourcekrævende. Med OLAP kan data forudberegnes og pre-aggregeres, hvilket gør analysen hurtigere.
OLAP-databaser er opdelt i en eller flere kuber. Kuberne er designet på en sådan måde, at det bliver nemt at oprette og se rapporter. OLAP står for Online Analytical Processing.
OLAP terning
Kernen i OLAP-konceptet er en OLAP-terning. OLAP-terningen er en datastruktur optimeret til meget hurtig dataanalyse.
OLAP-kuben består af numeriske fakta kaldet mål, som er kategoriseret efter dimensioner. OLAP Cube kaldes også hyperkubus.
Normalt udføres dataoperationer og analyse ved hjælp af det simple regneark, hvor dataværdier er arrangeret i række- og kolonneformat. Dette er ideelt til todimensionelle data. OLAP indeholder imidlertid multidimensionelle data, hvor data normalt er hentet fra en anden og ikke-relateret kilde. Brug af et regneark er ikke en optimal mulighed. Terningen kan lagre og analysere multidimensionelle data på en logisk og overskuelig måde.
Hvordan virker det?
Et datavarehus vil udtrække information fra flere datakilder og formater som tekstfiler, excel-ark, multimediefiler osv.
De udtrukne data renses og transformeres. Data indlæses i en OLAP-server (eller OLAP-kube), hvor information er forudberegnet på forhånd til yderligere analyse.
Grundlæggende analytiske operationer af OLAP
Fire typer af analytiske OLAP-operationer er:
- Rul op
- Bore ned
- Skær og skær i tern
- Drej (drej)
1) Roll-up:
Oprulning er også kendt som "konsolidering" eller "sammenlægning". Roll-up operationen kan udføres på 2 måder
- Reducerende dimensioner
- Klatring op i begrebshierarkiet. Begrebshierarki er et system til at gruppere ting baseret på deres rækkefølge eller niveau.
Overvej følgende diagram
- I dette eksempel, byer New jersey og Lost Angles og rullet op i landet USA
- Salgstallet for New Jersey og Los Angeles er henholdsvis 440 og 1560. De bliver 2000 efter roll-up
- I denne aggregeringsproces bevæger data stedhierarki op fra by til land.
- I oprulningsprocessen skal mindst en eller flere dimensioner fjernes. I dette eksempel er dimensionen Byer fjernet.
2) Drill-down
I drill-down er data fragmenteret i mindre dele. Det er det modsatte af rollup-processen. Det kan gøres via
- Bevægelse ned i begrebshierarkiet
- At øge en dimension
Overvej diagrammet ovenfor
- Kvartal Q1 er boret ned til månederne januar, februar og marts. Tilsvarende salg er også registre.
- I dette eksempel tilføjes dimensionsmåneder.
3) Skive:
Her vælges én dimension, og der oprettes en ny underkube.
Følgende diagram forklarer, hvordan skiveoperationen udførte:
- Dimension Time skæres med Q1 som filter.
- En ny terning oprettes helt.
Terninger:
Denne operation ligner en skive. Forskellen i terninger er, at du vælger 2 eller flere dimensioner, der resulterer i oprettelsen af en underterning.
4) Drej
I Pivot roterer du dataakserne for at give en erstatningspræsentation af data.
I det følgende eksempel er pivoten baseret på varetyper.
Typer af OLAP-systemer
OLAP hierarkisk struktur
Type OLAP | Forklaring |
---|---|
Relationel OLAP(ROLAP): | ROLAP er en udvidet RDBMS sammen med multidimensionel datamapping for at udføre standard relationsoperationen. |
Multidimensional OLAP (MOLAP) | MOLAP Implementerer operation i multidimensionelle data. |
Hybrid OnlineAnalytical Processing (HOLAP) | I HOLAP-tilgangen gemmes de aggregerede totaler i en multidimensionel database, mens de detaljerede data gemmes i relationsdatabasen. Dette giver både dataeffektivitet af ROLAP-modellen og ydeevnen af MOLAP-modellen. |
Desktop OLAP (DOLAP) | I Desktop OLAP downloader en bruger en del af dataene fra databasen lokalt eller på sit skrivebord og analyserer det.
DOLAP er relativt billigere at implementere, da det tilbyder meget få funktionaliteter sammenlignet med andre OLAP-systemer. |
Web OLAP (WOLAP) | Web OLAP som er OLAP-system tilgængeligt via webbrowseren. WOLAP er en tre-lags arkitektur. Den består af tre komponenter: klient, middleware og en databaseserver. |
Mobil OLAP: | Mobile OLAP hjælper brugere med at få adgang til og analysere OLAP-data ved hjælp af deres mobile enheder |
Rumlig OLAP: | SOLAP er skabt for at lette håndteringen af både geografiske og ikke-rumlige data i et geografisk informationssystem (GIS) |
ROLAP
ROLAP arbejder med data, der findes i en relationsdatabase. Fakta- og dimensionstabeller gemmes som relationelle tabeller. Det tillader også multidimensionel analyse af data og er den hurtigst voksende OLAP.
Fordele ved ROLAP-modellen:
- Høj dataeffektivitet. Det giver høj dataeffektivitet, fordi forespørgselsydeevne og adgangssprog er optimeret specielt til den multidimensionelle dataanalyse.
- Skalerbarhed. Denne type OLAP-system tilbyder skalerbarhed til håndtering af store mængder data, og selv når dataene er støt stigende.
Ulemper ved ROLAP-modellen:
- Efterspørgsel efter større ressourcer: ROLAP har brug for høj udnyttelse af arbejdskraft, software og hardwareressourcer.
- Samlet databegrænsninger. Brug af ROLAP værktøjer SQL til al beregning af aggregerede data. Der er dog ingen faste grænser for håndtering af beregninger.
- Langsom forespørgselsydeevne. Forespørgselsydeevne i denne model er langsom sammenlignet med MOLAP
MOLAP
MOLAP bruger array-baserede multidimensionelle lagringsmotorer til at vise multidimensionelle visninger af data. Grundlæggende bruger de en OLAP-terning.
Lær mere om MOLAP link.
Hybrid OLAP
Hybrid OLAP er en blanding af både ROLAP og MOLAP. Det giver hurtig beregning af MOLAP og højere skalerbarhed af ROLAP. HOLAP bruger to databaser.
- Aggregerede eller beregnede data gemmes i en flerdimensionel OLAP-terning
- Detaljerede oplysninger gemmes i en relationsdatabase.
Fordele ved Hybrid OLAP:
- Denne form for OLAP hjælper med at spare på diskpladsen, og den forbliver også kompakt, hvilket hjælper med at undgå problemer relateret til adgangshastighed og bekvemmelighed.
- Hybrid HOLAP's bruger kubeteknologi, som tillader hurtigere ydeevne for alle typer data.
- ROLAP opdateres øjeblikkeligt, og HOLAP-brugere har adgang til disse øjeblikkeligt opdaterede data i realtid. MOLAP bringer rensning og konvertering af data og forbedrer dermed datarelevansen. Dette bringer det bedste fra begge verdener.
Ulemper ved Hybrid OLAP:
- Større kompleksitetsniveau: Den største ulempe ved HOLAP-systemer er, at den understøtter både ROLAP- og MOLAP-værktøjer og -applikationer. Det er således meget kompliceret.
- Potentielle overlapninger: Der er større chancer for at overlappe, især i deres funktionaliteter.
Fordele ved OLAP
- OLAP er en platform for alle typer virksomheder, herunder planlægning, budgettering, rapportering og analyse.
- Information og beregninger er konsistente i en OLAP-terning. Dette er en afgørende fordel.
- Opret og analyser hurtigt "Hvad nu hvis"-scenarier
- Søg nemt i OLAP-databasen efter brede eller specifikke termer.
- OLAP leverer byggestenene til forretningsmodelleringsværktøjer, dataminingværktøjer og præstationsrapporteringsværktøjer.
- Giver brugere mulighed for at lave skive- og terningsdata alt efter forskellige dimensioner, mål og filtre.
- Den er god til at analysere tidsserier.
- Det er nemt at finde nogle klynger og outliers med OLAP.
- Det er et kraftfuldt visualisering online analytisk processystem, som giver hurtigere svartider
Ulemper ved OLAP
- OLAP kræver organisering af data i et stjerne- eller snefnugskema. Disse skemaer er komplicerede at implementere og administrere
- Du kan ikke have et stort antal dimensioner i en enkelt OLAP-terning
- Transaktionsdata kan ikke tilgås med OLAP-systemet.
- Enhver ændring i en OLAP-terning kræver en fuld opdatering af kuben. Dette er en tidskrævende proces
Resumé
- OLAP ind datalager er en teknologi, der gør det muligt for analytikere at udtrække og se forretningsdata fra forskellige synsvinkler.
- Kernen i OLAP-konceptet er en OLAP-terning.
- Forskellige forretningsapplikationer og andre dataoperationer kræver brug af OLAP Cube.
- Der er primære fem typer af analytiske OLAP-operationer i datavarehus: 1) Roll-up 2) Drill-down 3) Slice 4) Terninger og 5) Pivot
- Tre typer udbredte OLAP-systemer er MOLAP, ROLAP og Hybrid OLAP.
- Desktop OLAP, Web OLAP og Mobile OLAP er nogle andre typer OLAP-systemer.