Wat is OLAP? Kubus, analytisch Operain Data Warehouse

Wat is OLAP?

Online analytische verwerking (OLAP) is een categorie software waarmee gebruikers tegelijkertijd informatie uit meerdere databasesystemen kunnen analyseren. Het is een technologie waarmee analisten bedrijfsgegevens vanuit verschillende gezichtspunten kunnen extraheren en bekijken.

Analisten moeten vaak gegevens groeperen, aggregeren en samenvoegen. Deze OLAP operaties in datamining zijn hulpbronnenintensief. Met OLAP kunnen gegevens vooraf worden berekend en geaggregeerd, waardoor de analyse sneller gaat.

OLAP-databases zijn onderverdeeld in een of meer kubussen. De kubussen zijn zo ontworpen dat creëren en wedijverenwing rapporten worden eenvoudig. OLAP staat voor Online Analytische Verwerking.

OLAP-kubus

OLAP-kubus
OLAP-kubus

De kern van het OLAP-concept is een OLAP-kubus. De OLAP-kubus is een datastructuur die is geoptimaliseerd voor zeer snel gegevensanalyse.

De OLAP-kubus bestaat uit numerieke feiten, metingen genoemd, die zijn gecategoriseerd op basis van dimensies. OLAP-kubus wordt ook wel de hypercube.

Meestal gegevens operaties en analyses worden uitgevoerd met behulp van het eenvoudige spreadsheet, waarbij de gegevenswaarden in rij- en kolomformaat zijn gerangschikt. Dit is ideaal voor tweedimensionale gegevens. OLAP bevat echter multidimensionale gegevens, waarbij gegevens meestal uit een andere en niet-gerelateerde bron worden verkregen. Het gebruik van een spreadsheet is geen optimale optie. De kubus kan multidimensionale gegevens op een logische en overzichtelijke manier opslaan en analyseren.

Hoe werkt het?

Een datawarehouse zou informatie uit meerdere gegevensbronnen en formaten halen, zoals tekstbestanden, Excel-bladen, multimediabestanden, enz.

De geëxtraheerde gegevens worden opgeschoond en getransformeerd. Gegevens worden in een OLAP-server (of OLAP-kubus) geladen, waar de informatie vooraf wordt berekend voor verdere analyse.

Fundamenteel analytisch operavan OLAP

Vier soorten analytische OLAP operaties zijn:

  1. Oprollen
  2. Uitzoomen
  3. Snijd en dobbelsteen
  4. Draaien (roteren)

1) Oprollen:

Roll-up wordt ook wel 'consolidatie' of 'aggregatie' genoemd. De oprol operakan op 2 manieren worden uitgevoerd

  1. Afmetingen verkleinen
  2. Concepthiërarchie beklimmen. Concepthiërarchie is een systeem waarin dingen worden gegroepeerd op basis van hun volgorde of niveau.

Denk eens aan het volgendewing diagram

Oprollen operain OLAP
Oprollen operain OLAP
  • In dit voorbeeld zijn de steden New Jersey en Lost Angles opgerold naar het land VS
  • Het verkoopcijfer van New Jersey en Los Angeles bedraagt ​​respectievelijk 440 en 1560. Na oprollen worden ze 2000
  • Bij dit aggregatieproces verplaatst de locatiehiërarchie van gegevens zich van stad naar land.
  • Bij het oprollen moeten minimaal één of meerdere afmetingen worden verwijderd. In dit voorbeeld wordt de dimensie Steden verwijderd.

2) Inzoomen

Bij drill-down worden gegevens gefragmenteerd in kleinere delen. Het is het tegenovergestelde van het oprolproces. Het kan via

  • Naar beneden gaan in de concepthiërarchie
  • Een dimensie vergroten
Uitzoomen operain OLAP
Uitzoomen operain OLAP

Beschouw het bovenstaande diagram

  • Het eerste kwartaal wordt uitgesplitst naar de maanden januari, februari en maart. Overeenkomstige verkopen zijn ook registers.
  • In dit voorbeeld worden dimensiemaanden toegevoegd.

3) Plak:

Hier wordt één dimensie geselecteerd en wordt een nieuwe subkubus gemaakt.

Following diagram legt uit hoe segmenteren operauitgevoerd:

Plak operain OLAP
Plak operain OLAP
  • Dimension Time is Sliced ​​met Q1 als filter.
  • Er wordt een geheel nieuwe kubus gemaakt.

Er staat:

Deze operaHet is vergelijkbaar met een slice. Het verschil bij dobbelstenen is dat je 2 of meer dimensies selecteert die resulteren in de creatie van een subkubus.

Dobbelstenen operain OLAP
Dobbelstenen operain OLAP

4) Draaien

In Pivot roteert u de gegevensassen om een ​​vervangende presentatie van gegevens te bieden.

In het vervolgwing De spil is bijvoorbeeld gebaseerd op itemtypen.

Spil operain OLAP
Spil operain OLAP

Soorten OLAP-systemen

OLAP Hierarchical Structuur

Soorten OLAP-systemen
Soorten OLAP-systemen
Type OLAP Uitleg
Relationele OLAP(ROLAP): ROLAP is een uitgebreid RDBMS samen met multidimensionale data mapping om de standaard relationele gegevens uit te voeren operatie.
Multidimensionale OLAP (MOLAP) MOLAP-implementaties operain multidimensionale data.
Hybride online analytische verwerking (HOLAP) Bij de HOLAP-aanpak worden de geaggregeerde totalen opgeslagen in een multidimensionale database, terwijl de gedetailleerde gegevens worden opgeslagen in de relationele database. Dit biedt zowel data-efficiëntie van het ROLAP-model als de prestaties van het MOLAP-model.
Desktop-OLAP (DOLAP) In Desktop OLAP downloadt een gebruiker een deel van de gegevens lokaal of op zijn bureaublad uit de database en analyseert deze.

DOLAP is relatief goedkoper in gebruik omdat het zeer weinig functionaliteiten biedtares naar andere OLAP-systemen.

Web-OLAP (WOLAP) Web OLAP, een OLAP-systeem dat toegankelijk is via de webbrowser. WOLAP heeft drie niveaus archistructuur. Het bestaat uit drie componenten: client, middleware en een databaseserver.
Mobiel OLAP: Met Mobile OLAP kunnen gebruikers OLAP-gegevens openen en analyseren met behulp van hun mobiele apparaten
Ruimtelijke OLAP: SOLAP is gemaakt om het beheer van zowel ruimtelijke als niet-ruimtelijke gegevens in een geografisch informatiesysteem (GIS) te vergemakkelijken

ROLAP

ROLAP werkt met gegevens die in een relationele database voorkomen. Feiten en dimensietabellen worden opgeslagen als relationele tabellen. Het maakt ook multidimensionale analyse van gegevens mogelijk en is de snelste growing OLAP.

Voordelen van het ROLAP-model:

  • Hoge data-efficiëntie. Het biedt een hoge data-efficiëntie omdat de queryprestaties en de toegangstaal speciaal zijn geoptimaliseerd voor de multidimensionale data-analyse.
  • Schaalbaarheid. Dit type OLAP-systeem biedt schaalbaarheid voor het beheren van grote hoeveelheden gegevens, zelfs wanneer de gegevens gestaag toenemen.

Nadelen van het ROLAP-model:

  • Vraag naar hogere hulpbronnen: ROLAP heeft een hoge benutting van mankracht, software en hardware nodig.
  • Geaggregeerde gegevensbeperkingen. ROLAP-tools gebruiken SQL voor alle berekeningen van geaggregeerde gegevens. Er zijn echter geen vaste limieten voor het verwerken van berekeningen.
  • Trage queryprestaties. Queryprestaties in dit model zijn traag in vergelijking met MOLAP

MOLAP

MOLAP maakt gebruik van array-gebaseerde multidimensionale opslagengines om multidimensionale weergaven van gegevens weer te geven. Kortom, ze gebruiken een OLAP-kubus.

Meer informatie over MOLAP hier

Hybride OLAP

Hybride OLAP is een combinatie van zowel ROLAP als MOLAP. Het biedt een snelle berekening van MOLAP en een hogere schaalbaarheid van ROLAP. HOLAP maakt gebruik van twee databases.

  1. Geaggregeerde of berekende gegevens worden opgeslagen in een multidimensionale OLAP-kubus
  2. Gedetailleerde informatie wordt opgeslagen in een relationele database.

Voordelen van hybride OLAP:

  • Dit soort OLAP helpt de schijfruimte te besparen en blijft ook compact, waardoor problemen met betrekking tot toegangssnelheid en gemak worden voorkomen.
  • Hybride HOLAP's maakt gebruik van kubustechnologie die snellere prestaties voor alle soorten gegevens mogelijk maakt.
  • ROLAP wordt onmiddellijk bijgewerkt en HOLAP-gebruikers hebben toegang tot deze realtime, direct bijgewerkte gegevens. MOLAP zorgt voor het opschonen en converteren van gegevens, waardoor de gegevensrelevantie wordt verbeterd. Dit brengt het beste van twee werelden met zich mee.

Nadelen van hybride OLAP:

  • Grotere complexniveau: Het grootste nadeel van HOLAP-systemen is dat het zowel ROLAP- als MOLAP-tools en -applicaties ondersteunt. Het is dus erg ingewikkeld.
  • Mogelijke overlappingen: Er is een grotere kans op overlapping, vooral wat betreft hun functionaliteiten.

Voordelen van OLAP

  • OLAP is een platform voor alle soorten bedrijven, inclusief planning, budgettering, rapportage en analyse.
  • Informatie en berekeningen zijn consistent in een OLAP-kubus. Dit is een cruciaal voordeel.
  • Creëer en analyseer snel ‘Wat als’-scenario’s
  • Zoek eenvoudig in de OLAP-database naar brede of specifieke termen.
  • OLAP levert de bouwstenen voor tools voor bedrijfsmodellering, dataminingtools en tools voor prestatierapportage.
  • Hiermee kunnen gebruikers kubusgegevens opsplitsen en in blokjes snijden, allemaal volgens verschillende dimensies, metingen en filters.
  • Het is goed voor het analyseren van tijdreeksen.
  • Sommigen vinden clusters en uitschieters is eenvoudig met OLAP.
  • Het is een krachtig online analytisch processysteem voor visualisatie dat snellere responstijden biedt

Nadelen van OLAP

  • OLAP vereist het organiseren van gegevens in een ster- of sneeuwvlokschema. Deze schema's zijn ingewikkeld om te implementeren en te beheren
  • U kunt geen groot aantal dimensies in één OLAP-kubus hebben
  • Transactiegegevens zijn niet toegankelijk via het OLAP-systeem.
  • Voor elke wijziging in een OLAP-kubus is een volledige update van de kubus nodig. Dit is een tijdrovend proces

Samengevat

  • OLAP-in datawarehouse is een technologie waarmee analisten bedrijfsgegevens vanuit verschillende gezichtspunten kunnen extraheren en bekijken.
  • De kern van het OLAP-concept is een OLAP-kubus.
  • Diverse bedrijfsapplicaties en andere data operaVoor deze toepassingen is het gebruik van OLAP Cube vereist.
  • Er zijn vijf primaire soorten analytische OLAP operain het datawarehouse: 1) Roll-up 2) Drill-down 3) Slice 4) Dobbelsteen en 5) Pivot
  • Drie soorten veelgebruikte OLAP-systemen zijn MOLAP, ROLAP en Hybrid OLAP.
  • Desktop OLAP, Web OLAP en Mobile OLAP zijn enkele andere typen OLAP-systemen.