Hvad er OLAP? Terning, analytisk Operationer i Data Warehouse

Hvad er OLAP?

Online analytisk behandling (OLAP) er en kategori af software, der giver brugerne mulighed for at analysere information fra flere databasesystemer på samme tid. Det er en teknologi, der gør det muligt for analytikere at udtrække og se forretningsdata fra forskellige synsvinkler.

Analytikere har ofte behov for at gruppere, aggregere og samle data. Disse OLAP operationer i data mining er ressourcekrævende. Med OLAP kan data forudberegnes og pre-aggregeres, hvilket gør analysen hurtigere.

OLAP-databaser er opdelt i en eller flere kuber. Terningerne er designet på en sådan måde, at skabe og viewing rapporter bliver nemme. OLAP står for Online Analytical Processing.

OLAP terning

OLAP terning
OLAP terning

Kernen i OLAP-konceptet er en OLAP-terning. OLAP-terningen er en datastruktur optimeret til meget hurtig dataanalyse.

OLAP-kuben består af numeriske fakta kaldet mål, som er kategoriseret efter dimensioner. OLAP Cube kaldes også hyperkubus.

Normalt data operationer og analyser udføres ved hjælp af det simple regneark, hvor dataværdier er arrangeret i række- og kolonneformat. Dette er ideelt til todimensionelle data. OLAP indeholder imidlertid multidimensionelle data, hvor data normalt er hentet fra en anden og ikke-relateret kilde. Brug af et regneark er ikke en optimal mulighed. Terningen kan lagre og analysere multidimensionelle data på en logisk og overskuelig måde.

Hvordan virker det?

Et datavarehus vil udtrække information fra flere datakilder og formater som tekstfiler, excel-ark, multimediefiler osv.

De udtrukne data renses og transformeres. Data indlæses i en OLAP-server (eller OLAP-kube), hvor information er forudberegnet på forhånd til yderligere analyse.

Grundlæggende analytisk operadele af OLAP

Fire typer analytisk OLAP operationer er:

  1. Rul op
  2. Bore ned
  3. Skær og skær i tern
  4. Drej (drej)

1) Roll-up:

Oprulning er også kendt som "konsolidering" eller "sammenlægning". Roll-up'en operation kan udføres på 2 måder

  1. Reducerende dimensioner
  2. Klatring op i begrebshierarkiet. Begrebshierarki er et system til at gruppere ting baseret på deres rækkefølge eller niveau.

Overvej folloenwing diagram

Rul op operation i OLAP
Rul op operation i OLAP
  • I dette eksempel, byer New jersey og Lost Angles og rullet op i landet USA
  • Salgstallet for New Jersey og Los Angeles er henholdsvis 440 og 1560. De bliver 2000 efter roll-up
  • I denne aggregeringsproces bevæger data stedhierarki op fra by til land.
  • I oprulningsprocessen skal mindst en eller flere dimensioner fjernes. I dette eksempel er dimensionen Byer fjernet.

2) Drill-down

I drill-down er data fragmenteret i mindre dele. Det er det modsatte af rollup-processen. Det kan gøres via

  • Bevægelse ned i begrebshierarkiet
  • At øge en dimension
Bore ned operation i OLAP
Bore ned operation i OLAP

Overvej diagrammet ovenfor

  • Kvartal Q1 er boret ned til månederne januar, februar og marts. Tilsvarende salg er også registre.
  • I dette eksempel tilføjes dimensionsmåneder.

3) Skive:

Her vælges én dimension, og der oprettes en ny underkube.

Following diagram forklare hvordan skive operation udført:

Slice operation i OLAP
Slice operation i OLAP
  • Dimension Time skæres med Q1 som filter.
  • En ny terning oprettes helt.

Terninger:

Denne operation ligner en skive. Forskellen i terninger er, at du vælger 2 eller flere dimensioner, der resulterer i oprettelsen af ​​en underterning.

Dice operation i OLAP
Dice operation i OLAP

4) Drej

I Pivot roterer du dataakserne for at give en erstatningspræsentation af data.

I folloenwing for eksempel er pivoten baseret på varetyper.

Pivot operation i OLAP
Pivot operation i OLAP

Typer af OLAP-systemer

OLAP Hierarchical Struktur

Typer af OLAP-systemer
Typer af OLAP-systemer
Type OLAP Forklaring
Relationel OLAP(ROLAP): ROLAP er en udvidet RDBMS sammen med multidimensionel datamapping for at udføre standard relationelle operation.
Multidimensional OLAP (MOLAP) MOLAP implementerer operation i multidimensionelle data.
Hybrid OnlineAnalytical Processing (HOLAP) I HOLAP-tilgangen gemmes de aggregerede totaler i en multidimensionel database, mens de detaljerede data gemmes i relationsdatabasen. Dette giver både dataeffektivitet af ROLAP-modellen og ydeevnen af ​​MOLAP-modellen.
Desktop OLAP (DOLAP) I Desktop OLAP downloader en bruger en del af dataene fra databasen lokalt eller på sit skrivebord og analyserer det.

DOLAP er relativt billigere at implementere, da det tilbyder meget få funktionaliteterares til andre OLAP-systemer.

Web OLAP (WOLAP) Web OLAP som er OLAP-system tilgængeligt via webbrowseren. WOLAP er en tre-trins architecture. Den består af tre komponenter: klient, middleware og en databaseserver.
Mobil OLAP: Mobile OLAP hjælper brugere med at få adgang til og analysere OLAP-data ved hjælp af deres mobile enheder
Rumlig OLAP: SOLAP er skabt for at lette håndteringen af ​​både geografiske og ikke-rumlige data i et geografisk informationssystem (GIS)

ROLAP

ROLAP arbejder med data, der findes i en relationsdatabase. Fakta- og dimensionstabeller gemmes som relationelle tabeller. Det tillader også multidimensionel analyse af data og er den hurtigste growing OLAP.

Fordele ved ROLAP-modellen:

  • Høj dataeffektivitet. Det giver høj dataeffektivitet, fordi forespørgselsydeevne og adgangssprog er optimeret specielt til den multidimensionelle dataanalyse.
  • Skalerbarhed. Denne type OLAP-system tilbyder skalerbarhed til håndtering af store mængder data, og selv når dataene er støt stigende.

Ulemper ved ROLAP-modellen:

  • Efterspørgsel efter større ressourcer: ROLAP har brug for høj udnyttelse af arbejdskraft, software og hardwareressourcer.
  • Samlet databegrænsninger. Brug af ROLAP værktøjer SQL til al beregning af aggregerede data. Der er dog ingen faste grænser for håndtering af beregninger.
  • Langsom forespørgselsydeevne. Forespørgselsydeevne i denne model er langsom sammenlignet med MOLAP

MOLAP

MOLAP bruger array-baserede multidimensionelle lagringsmotorer til at vise multidimensionelle visninger af data. Grundlæggende bruger de en OLAP-terning.

Lær mere om MOLAP link.

Hybrid OLAP

Hybrid OLAP er en blanding af både ROLAP og MOLAP. Det giver hurtig beregning af MOLAP og højere skalerbarhed af ROLAP. HOLAP bruger to databaser.

  1. Aggregerede eller beregnede data gemmes i en flerdimensionel OLAP-terning
  2. Detaljerede oplysninger gemmes i en relationsdatabase.

Fordele ved Hybrid OLAP:

  • Denne form for OLAP hjælper med at spare på diskpladsen, og den forbliver også kompakt, hvilket hjælper med at undgå problemer relateret til adgangshastighed og bekvemmelighed.
  • Hybrid HOLAP's bruger kubeteknologi, som tillader hurtigere ydeevne for alle typer data.
  • ROLAP opdateres øjeblikkeligt, og HOLAP-brugere har adgang til disse øjeblikkeligt opdaterede data i realtid. MOLAP bringer rensning og konvertering af data og forbedrer dermed datarelevansen. Dette bringer det bedste fra begge verdener.

Ulemper ved Hybrid OLAP:

  • Større complexniveau: Den største ulempe ved HOLAP-systemer er, at den understøtter både ROLAP- og MOLAP-værktøjer og -applikationer. Det er således meget kompliceret.
  • Potentielle overlapninger: Der er større chancer for at overlappe, især i deres funktionaliteter.

Fordele ved OLAP

  • OLAP er en platform for alle typer virksomheder, herunder planlægning, budgettering, rapportering og analyse.
  • Information og beregninger er konsistente i en OLAP-terning. Dette er en afgørende fordel.
  • Opret og analyser hurtigt "Hvad nu hvis"-scenarier
  • Søg nemt i OLAP-databasen efter brede eller specifikke termer.
  • OLAP leverer byggestenene til forretningsmodelleringsværktøjer, dataminingværktøjer og præstationsrapporteringsværktøjer.
  • Giver brugere mulighed for at lave skive- og terningsdata alt efter forskellige dimensioner, mål og filtre.
  • Den er god til at analysere tidsserier.
  • At finde nogle clusters og outliers er nemt med OLAP.
  • Det er et kraftfuldt visualisering online analytisk processystem, som giver hurtigere svartider

Ulemper ved OLAP

  • OLAP kræver organisering af data i et stjerne- eller snefnugskema. Disse skemaer er komplicerede at implementere og administrere
  • Du kan ikke have et stort antal dimensioner i en enkelt OLAP-terning
  • Transaktionsdata kan ikke tilgås med OLAP-systemet.
  • Enhver ændring i en OLAP-terning kræver en fuld opdatering af kuben. Dette er en tidskrævende proces

Resumé

  • OLAP ind datalager er en teknologi, der gør det muligt for analytikere at udtrække og se forretningsdata fra forskellige synsvinkler.
  • Kernen i OLAP-konceptet er en OLAP-terning.
  • Forskellige forretningsapplikationer og andre data operationer kræver brug af OLAP Cube.
  • Der er primære fem typer af analytisk OLAP operationer i datavarehus: 1) Roll-up 2) Drill-down 3) Slice 4) Terninger og 5) Pivot
  • Tre typer udbredte OLAP-systemer er MOLAP, ROLAP og Hybrid OLAP.
  • Desktop OLAP, Web OLAP og Mobile OLAP er nogle andre typer OLAP-systemer.