Wat is OLAP? Kubus, analytisch Operain Data Warehouse
Wat is OLAP?
Online analytische verwerking (OLAP) is een categorie software waarmee gebruikers tegelijkertijd informatie uit meerdere databasesystemen kunnen analyseren. Het is een technologie waarmee analisten bedrijfsgegevens vanuit verschillende gezichtspunten kunnen extraheren en bekijken.
Analisten moeten vaak data groeperen, aggregeren en samenvoegen. Deze OLAP-bewerkingen in data mining zijn resource-intensief. Met OLAP kunnen data vooraf worden berekend en geaggregeerd, waardoor analyse sneller verloopt.
OLAP-databases zijn verdeeld in één of meerdere kubussen. De kubussen zijn zo ontworpen dat het maken en bekijken van rapporten eenvoudig wordt. OLAP staat voor Online Analytical Processing.
OLAP-kubus

De kern van het OLAP-concept is een OLAP-kubus. De OLAP-kubus is een datastructuur die is geoptimaliseerd voor zeer snel gegevensanalyse.
De OLAP-kubus bestaat uit numerieke feiten, metingen genoemd, die zijn gecategoriseerd op basis van dimensies. OLAP-kubus wordt ook wel de hypercube.
Meestal worden gegevensbewerkingen en -analyses uitgevoerd met behulp van een eenvoudig spreadsheet, waarbij gegevenswaarden in rij- en kolomformaat worden gerangschikt. Dit is ideaal voor tweedimensionale gegevens. OLAP bevat echter multidimensionale gegevens, waarbij gegevens meestal uit een andere en niet-gerelateerde bron worden verkregen. Het gebruik van een spreadsheet is geen optimale optie. De kubus kan multidimensionale gegevens op een logische en ordelijke manier opslaan en analyseren.
Hoe werkt het?
Een datawarehouse zou informatie uit meerdere gegevensbronnen en formaten halen, zoals tekstbestanden, Excel-bladen, multimediabestanden, enz.
De geëxtraheerde gegevens worden opgeschoond en getransformeerd. Gegevens worden in een OLAP-server (of OLAP-kubus) geladen, waar de informatie vooraf wordt berekend voor verdere analyse.
Basis analytische bewerkingen van OLAP
Er zijn vier typen analytische OLAP-bewerkingen:
- Oprollen
- Uitzoomen
- Snijd en dobbelsteen
- Draaien (roteren)
1) Oprollen:
Roll-up wordt ook wel 'consolidatie' of 'aggregatie' genoemd. De roll-up-bewerking kan op twee manieren worden uitgevoerd
- Afmetingen verkleinen
- Concepthiërarchie beklimmen. Concepthiërarchie is een systeem waarin dingen worden gegroepeerd op basis van hun volgorde of niveau.
Beschouw het volgende diagram
- In dit voorbeeld zijn de steden New Jersey en Lost Angles opgerold naar het land VS
- Het verkoopcijfer van New Jersey en Los Angeles bedraagt respectievelijk 440 en 1560. Na oprollen worden ze 2000
- Bij dit aggregatieproces verplaatst de locatiehiërarchie van gegevens zich van stad naar land.
- Bij het oprollen moeten minimaal één of meerdere afmetingen worden verwijderd. In dit voorbeeld wordt de dimensie Steden verwijderd.
2) Inzoomen
Bij drill-down worden gegevens gefragmenteerd in kleinere delen. Het is het tegenovergestelde van het oprolproces. Het kan via
- Naar beneden gaan in de concepthiërarchie
- Een dimensie vergroten
Beschouw het bovenstaande diagram
- Het eerste kwartaal wordt uitgesplitst naar de maanden januari, februari en maart. Overeenkomstige verkopen zijn ook registers.
- In dit voorbeeld worden dimensiemaanden toegevoegd.
3) Plak:
Hier wordt één dimensie geselecteerd en wordt een nieuwe subkubus gemaakt.
Het volgende diagram legt uit hoe de slice-bewerking wordt uitgevoerd:
- Dimension Time is Sliced met Q1 als filter.
- Er wordt een geheel nieuwe kubus gemaakt.
Er staat:
Deze bewerking is vergelijkbaar met een slice. Het verschil met dobbelstenen is dat je 2 of meer dimensies selecteert die resulteren in de creatie van een sub-kubus.
4) Draaien
In Pivot roteert u de gegevensassen om een vervangende presentatie van gegevens te bieden.
In het volgende voorbeeld is de draai gebaseerd op itemtypen.
Soorten OLAP-systemen
Hiërarchische OLAP-structuur
Type OLAP | Uitleg |
---|---|
Relationele OLAP(ROLAP): | ROLAP is een uitgebreid RDBMS met multidimensionale datamapping om de standaard relationele bewerking uit te voeren. |
Multidimensionale OLAP (MOLAP) | MOLAP implementeert bewerkingen in multidimensionale gegevens. |
Hybride online analytische verwerking (HOLAP) | Bij de HOLAP-aanpak worden de geaggregeerde totalen opgeslagen in een multidimensionale database, terwijl de gedetailleerde gegevens worden opgeslagen in de relationele database. Dit biedt zowel data-efficiëntie van het ROLAP-model als de prestaties van het MOLAP-model. |
Desktop-OLAP (DOLAP) | In Desktop OLAP downloadt een gebruiker een deel van de gegevens lokaal of op zijn bureaublad uit de database en analyseert deze.
DOLAP is relatief goedkoper om te implementeren, omdat het vergeleken met andere OLAP-systemen weinig functionaliteiten biedt. |
Web-OLAP (WOLAP) | Web OLAP, een OLAP-systeem dat toegankelijk is via de webbrowser. WOLAP is een drielaagse architectuur. Het bestaat uit drie componenten: client, middleware en een databaseserver. |
Mobiel OLAP: | Met Mobile OLAP kunnen gebruikers OLAP-gegevens openen en analyseren met behulp van hun mobiele apparaten |
Ruimtelijke OLAP: | SOLAP is gemaakt om het beheer van zowel ruimtelijke als niet-ruimtelijke gegevens in een geografisch informatiesysteem (GIS) te vergemakkelijken |
ROLAP
ROLAP werkt met data die in een relationele database staan. Feiten en dimensietabellen worden opgeslagen als relationele tabellen. Het staat ook multidimensionale analyse van data toe en is de snelst groeiende OLAP.
Voordelen van het ROLAP-model:
- Hoge data-efficiëntie. Het biedt een hoge data-efficiëntie omdat de queryprestaties en de toegangstaal speciaal zijn geoptimaliseerd voor de multidimensionale data-analyse.
- Schaalbaarheid. Dit type OLAP-systeem biedt schaalbaarheid voor het beheren van grote hoeveelheden gegevens, zelfs wanneer de gegevens gestaag toenemen.
Nadelen van het ROLAP-model:
- Vraag naar hogere hulpbronnen: ROLAP heeft een hoge benutting van mankracht, software en hardware nodig.
- Geaggregeerde gegevensbeperkingen. ROLAP-tools gebruiken SQL voor alle berekeningen van geaggregeerde gegevens. Er zijn echter geen vaste limieten voor het verwerken van berekeningen.
- Trage queryprestaties. Queryprestaties in dit model zijn traag in vergelijking met MOLAP
MOLAP
MOLAP maakt gebruik van array-gebaseerde multidimensionale opslagengines om multidimensionale weergaven van gegevens weer te geven. Kortom, ze gebruiken een OLAP-kubus.
Meer informatie over MOLAP hier
Hybride OLAP
Hybride OLAP is een combinatie van zowel ROLAP als MOLAP. Het biedt een snelle berekening van MOLAP en een hogere schaalbaarheid van ROLAP. HOLAP maakt gebruik van twee databases.
- Geaggregeerde of berekende gegevens worden opgeslagen in een multidimensionale OLAP-kubus
- Gedetailleerde informatie wordt opgeslagen in een relationele database.
Voordelen van hybride OLAP:
- Dit soort OLAP helpt de schijfruimte te besparen en blijft ook compact, waardoor problemen met betrekking tot toegangssnelheid en gemak worden voorkomen.
- Hybride HOLAP's maakt gebruik van kubustechnologie die snellere prestaties voor alle soorten gegevens mogelijk maakt.
- ROLAP wordt onmiddellijk bijgewerkt en HOLAP-gebruikers hebben toegang tot deze realtime, direct bijgewerkte gegevens. MOLAP zorgt voor het opschonen en converteren van gegevens, waardoor de gegevensrelevantie wordt verbeterd. Dit brengt het beste van twee werelden met zich mee.
Nadelen van hybride OLAP:
- Hogere complexiteitsniveau: Het grootste nadeel van HOLAP-systemen is dat het zowel ROLAP- als MOLAP-tools en -applicaties ondersteunt. Het is dus erg ingewikkeld.
- Mogelijke overlappingen: Er is een grotere kans op overlapping, vooral wat betreft hun functionaliteiten.
Voordelen van OLAP
- OLAP is een platform voor alle soorten bedrijven, inclusief planning, budgettering, rapportage en analyse.
- Informatie en berekeningen zijn consistent in een OLAP-kubus. Dit is een cruciaal voordeel.
- Creëer en analyseer snel ‘Wat als’-scenario’s
- Zoek eenvoudig in de OLAP-database naar brede of specifieke termen.
- OLAP levert de bouwstenen voor tools voor bedrijfsmodellering, dataminingtools en tools voor prestatierapportage.
- Hiermee kunnen gebruikers kubusgegevens opsplitsen en in blokjes snijden, allemaal volgens verschillende dimensies, metingen en filters.
- Het is goed voor het analyseren van tijdreeksen.
- Met OLAP kunt u eenvoudig clusters en uitschieters vinden.
- Het is een krachtig online analytisch processysteem voor visualisatie dat snellere responstijden biedt
Nadelen van OLAP
- OLAP vereist het organiseren van gegevens in een ster- of sneeuwvlokschema. Deze schema's zijn ingewikkeld om te implementeren en te beheren
- U kunt geen groot aantal dimensies in één OLAP-kubus hebben
- Transactiegegevens zijn niet toegankelijk via het OLAP-systeem.
- Voor elke wijziging in een OLAP-kubus is een volledige update van de kubus nodig. Dit is een tijdrovend proces
Samenvatting
- OLAP-in datawarehouse is een technologie waarmee analisten bedrijfsgegevens vanuit verschillende gezichtspunten kunnen extraheren en bekijken.
- De kern van het OLAP-concept is een OLAP-kubus.
- Verschillende zakelijke toepassingen en andere gegevensbewerkingen vereisen het gebruik van OLAP Cube.
- Er zijn vijf primaire typen analytische OLAP-bewerkingen in een datawarehouse: 1) Roll-up 2) Drill-down 3) Slice 4) Dice en 5) Pivot
- Drie soorten veelgebruikte OLAP-systemen zijn MOLAP, ROLAP en Hybrid OLAP.
- Desktop OLAP, Web OLAP en Mobile OLAP zijn enkele andere typen OLAP-systemen.