Vad är OLAP? Kub, analytisk Operai Data Warehouse
Vad är OLAP?
Online analytisk bearbetning (OLAP) är en kategori av programvara som låter användare analysera information från flera databassystem samtidigt. Det är en teknik som gör det möjligt för analytiker att extrahera och se affärsdata från olika synvinklar.
Analytiker behöver ofta gruppera, aggregera och sammanfoga data. Dessa OLAP-operationer inom datautvinning är resurskrävande. Med OLAP kan data förberäknas och pre-aggregeras, vilket gör analysen snabbare.
OLAP-databaser är uppdelade i en eller flera kuber. Kuberna är designade på ett sådant sätt att det blir enkelt att skapa och visa rapporter. OLAP står för Online Analytical Processing.
OLAP kub

Kärnan i OLAP-konceptet är en OLAP-kub. OLAP-kuben är en datastruktur optimerad för mycket snabb dataanalys.
OLAP-kuben består av numeriska fakta som kallas mått och som kategoriseras efter dimensioner. OLAP Cube kallas också hyperkub.
Vanligtvis utförs dataoperationer och analys med hjälp av det enkla kalkylbladet, där datavärdena är ordnade i rad- och kolumnformat. Detta är idealiskt för tvådimensionell data. OLAP innehåller dock flerdimensionell data, med data som vanligtvis erhålls från en annan och orelaterade källa. Att använda ett kalkylblad är inte ett optimalt alternativ. Kuben kan lagra och analysera flerdimensionell data på ett logiskt och överskådligt sätt.
Hur fungerar det?
Ett datalager skulle extrahera information från flera datakällor och format som textfiler, excelark, multimediafiler, etc.
Den extraherade informationen rensas och transformeras. Data laddas in i en OLAP-server (eller OLAP-kub) där informationen förberäknas i förväg för vidare analys.
Grundläggande analytiska operationer för OLAP
Fyra typer av analytiska OLAP-operationer är:
- Rulla upp
- Borra ner
- Skiva och tärna
- Pivotera (rotera)
1) Roll-up:
Sammandragning kallas också "konsolidering" eller "aggregation". Roll-up-operationen kan utföras på två sätt
- Minska dimensioner
- Klättra upp begreppshierarkin. Begreppshierarki är ett system för att gruppera saker baserat på deras ordning eller nivå.
Betrakta följande diagram
- I detta exempel, städer New jersey och Lost Angles och rullade upp till landet USA
- Försäljningssiffran för New Jersey och Los Angeles är 440 respektive 1560. De blir 2000 efter roll-up
- I denna aggregeringsprocess flyttas data upp från stad till land.
- I roll-up-processen måste minst en eller flera dimensioner tas bort. I det här exemplet tas dimensionen Städer bort.
2) Drill-down
I drill-down data fragmenteras i mindre delar. Det är motsatsen till rollup-processen. Det kan göras via
- Flytta ner i begreppshierarkin
- Att öka en dimension
Tänk på diagrammet ovan
- Kvartal Q1 borras ner till månaderna januari, februari och mars. Motsvarande försäljning är också register.
- I det här exemplet läggs dimensionsmånader till.
3) Skiva:
Här väljs en dimension och en ny underkub skapas.
Följande diagram förklarar hur skivoperationen utfördes:
- Dimension Time är skivad med Q1 som filter.
- En ny kub skapas helt och hållet.
Tärningar:
Denna operation liknar en skiva. Skillnaden i tärningar är att du väljer 2 eller fler dimensioner som resulterar i skapandet av en underkub.
4) Pivot
I Pivot roterar du dataaxlarna för att ge en ersättningspresentation av data.
I följande exempel är pivoten baserad på objekttyper.
Typer av OLAP-system
OLAP hierarkisk struktur
Typ av OLAP | Förklaring |
---|---|
Relationell OLAP(ROLAP): | ROLAP är ett utökat RDBMS tillsammans med multidimensionell datamappning för att utföra standardrelationsoperationen. |
Flerdimensionell OLAP (MOLAP) | MOLAP Implementerar operation i flerdimensionell data. |
Hybrid OnlineAnalytical Processing (HOLAP) | I HOLAP-metoden lagras de aggregerade totalerna i en flerdimensionell databas medan detaljerad data lagras i relationsdatabasen. Detta erbjuder både dataeffektivitet för ROLAP-modellen och prestanda för MOLAP-modellen. |
Desktop OLAP (DOLAP) | I Desktop OLAP laddar en användare ned en del av data från databasen lokalt eller på sitt skrivbord och analyserar den.
DOLAP är relativt billigare att distribuera eftersom det erbjuder mycket få funktioner jämfört med andra OLAP-system. |
Web OLAP (WOLAP) | Web OLAP som är OLAP-system tillgängligt via webbläsaren. WOLAP är en arkitektur i tre nivåer. Den består av tre komponenter: klient, mellanprogram och en databasserver. |
Mobil OLAP: | Mobile OLAP hjälper användare att komma åt och analysera OLAP-data med sina mobila enheter |
Spatial OLAP: | SOLAP är skapat för att underlätta hanteringen av både rumslig och icke-rumslig data i ett geografiskt informationssystem (GIS) |
ROLAP
ROLAP arbetar med data som finns i en relationsdatabas. Fakta- och dimensionstabeller lagras som relationstabeller. Det tillåter också multidimensionell analys av data och är den snabbast växande OLAP.
Fördelar med ROLAP-modellen:
- Hög dataeffektivitet. Det erbjuder hög dataeffektivitet eftersom frågeprestanda och åtkomstspråk är optimerade speciellt för multidimensionell dataanalys.
- Skalbarhet. Den här typen av OLAP-system erbjuder skalbarhet för att hantera stora datamängder, och även när datan stadigt ökar.
Nackdelar med ROLAP-modellen:
- Efterfrågan på högre resurser: ROLAP behöver högt utnyttjande av arbetskraft, mjukvara och hårdvara.
- Sammanlagt databegränsningar. ROLAP-verktyg används SQL för all beräkning av aggregerade data. Det finns dock inga fasta gränser för hantering av beräkningar.
- Långsam frågeprestanda. Frågeprestanda i denna modell är långsam jämfört med MOLAP
MOLAP
MOLAP använder array-baserade flerdimensionella lagringsmotorer för att visa flerdimensionella vyer av data. I grund och botten använder de en OLAP-kub.
Lär dig mer om MOLAP här.
Hybrid OLAP
Hybrid OLAP är en blandning av både ROLAP och MOLAP. Den erbjuder snabb beräkning av MOLAP och högre skalbarhet av ROLAP. HOLAP använder två databaser.
- Aggregerad eller beräknad data lagras i en flerdimensionell OLAP-kub
- Detaljerad information lagras i en relationsdatabas.
Fördelar med Hybrid OLAP:
- Denna typ av OLAP hjälper till att spara på diskutrymmet, och den förblir också kompakt vilket hjälper till att undvika problem relaterade till åtkomsthastighet och bekvämlighet.
- Hybrid HOLAP använder kubteknologi som möjliggör snabbare prestanda för alla typer av data.
- ROLAP uppdateras omedelbart och HOLAP-användare har tillgång till denna omedelbart uppdaterade realtidsdata. MOLAP ger rensning och konvertering av data och förbättrar därmed datarelevansen. Detta ger det bästa av två världar.
Nackdelar med Hybrid OLAP:
- Högre komplexitetsnivå: Den stora nackdelen med HOLAP-system är att det stöder både ROLAP- och MOLAP-verktyg och applikationer. Alltså är det väldigt komplicerat.
- Potentiella överlappningar: Det finns större chanser att överlappa, särskilt vad gäller deras funktioner.
Fördelar med OLAP
- OLAP är en plattform för alla typer av verksamhet inklusive planering, budgetering, rapportering och analys.
- Information och beräkningar är konsekventa i en OLAP-kub. Detta är en avgörande fördel.
- Skapa och analysera snabbt "Tänk om"-scenarier
- Sök enkelt i OLAP-databasen efter breda eller specifika termer.
- OLAP tillhandahåller byggstenarna för affärsmodelleringsverktyg, datautvinningsverktyg, prestandarapporteringsverktyg.
- Tillåter användare att göra segment- och tärningsdata allt med olika dimensioner, mått och filter.
- Det är bra för att analysera tidsserier.
- Att hitta några kluster och extremvärden är lätt med OLAP.
- Det är ett kraftfullt visualiseringssystem för analytiska processer online som ger snabbare svarstider
Nackdelar med OLAP
- OLAP kräver att data organiseras i ett stjärn- eller snöflingaschema. Dessa scheman är komplicerade att implementera och administrera
- Du kan inte ha ett stort antal dimensioner i en enda OLAP-kub
- Transaktionsdata kan inte nås med OLAP-systemet.
- Alla ändringar i en OLAP-kub kräver en fullständig uppdatering av kuben. Detta är en tidskrävande process
Sammanfattning
- OLAP in datalagret är en teknik som gör det möjligt för analytiker att extrahera och se affärsdata från olika synvinklar.
- Kärnan i OLAP-konceptet är en OLAP-kub.
- Olika affärsapplikationer och andra dataoperationer kräver användning av OLAP Cube.
- Det finns primära fem typer av analytiska OLAP-operationer i datalager: 1) Roll-up 2) Drill-down 3) Slice 4) Dice och 5) Pivot
- Tre typer av allmänt använda OLAP-system är MOLAP, ROLAP och Hybrid OLAP.
- Desktop OLAP, Web OLAP och Mobile OLAP är några andra typer av OLAP-system.