Was ist OLAP? Würfel, analytisch OperaFunktionen im Data Warehouse
Was ist OLAP?
Online Analytical Processing (OLAP) ist eine Softwarekategorie, die es Benutzern ermöglicht, Informationen aus mehreren Datenbanksystemen gleichzeitig zu analysieren. Dabei handelt es sich um eine Technologie, die es Analysten ermöglicht, Geschäftsdaten aus verschiedenen Blickwinkeln zu extrahieren und zu betrachten.
Analysten müssen häufig Daten gruppieren, aggregieren und verknüpfen. Diese OLAP-Operationen im Data Mining sind ressourcenintensiv. Mit OLAP können Daten vorberechnet und voraggregiert werden, was die Analyse beschleunigt.
OLAP-Datenbanken sind in einen oder mehrere Würfel unterteilt. Die Würfel sind so gestaltet, dass das Erstellen und Anzeigen von Berichten einfach ist. OLAP steht für Online Analytical Processing.
OLAP-Würfel
Das Herzstück des OLAP-Konzepts ist ein OLAP-Cube. Der OLAP-Cube ist eine für sehr schnelle Daten optimierte Datenstruktur Datenanalyse.
Der OLAP-Würfel besteht aus numerischen Fakten, sogenannten Kennzahlen, die nach Dimensionen kategorisiert sind. OLAP Cube wird auch als OLAP Cube bezeichnet Hyperwürfel.
Normalerweise werden Datenoperationen und Analysen mithilfe einer einfachen Tabellenkalkulation durchgeführt, in der die Datenwerte in Zeilen- und Spaltenformat angeordnet sind. Dies ist ideal für zweidimensionale Daten. OLAP enthält jedoch mehrdimensionale Daten, wobei die Daten normalerweise aus einer anderen und unabhängigen Quelle stammen. Die Verwendung einer Tabellenkalkulation ist keine optimale Option. Der Würfel kann mehrdimensionale Daten auf logische und geordnete Weise speichern und analysieren.
Wie funktioniert es?
Ein Data Warehouse würde Informationen aus mehreren Datenquellen und Formaten wie Textdateien, Excel-Tabellen, Multimediadateien usw. extrahieren.
Die extrahierten Daten werden bereinigt und transformiert. Die Daten werden in einen OLAP-Server (oder OLAP-Cube) geladen, wo die Informationen vorab für die weitere Analyse berechnet werden.
Grundlegende analytische Operationen von OLAP
Es gibt vier Arten analytischer OLAP-Operationen:
- Aufrollen
- Aufreißen
- In Würfel schneiden
- Pivot (drehen)
1) Aufrollen:
Roll-up wird auch als „Konsolidierung“ oder „Aggregation“ bezeichnet. Der Roll-up-Vorgang kann auf zwei Arten durchgeführt werden
- Abmessungen reduzieren
- Aufstieg in der Konzepthierarchie. Konzepthierarchie ist ein System zur Gruppierung von Dingen basierend auf ihrer Reihenfolge oder Ebene.
Betrachten Sie das folgende Diagramm
- In diesem Beispiel werden die Städte New Jersey und Lost Angles zum Land USA zusammengefasst
- Die Verkaufszahlen in New Jersey und Los Angeles liegen bei 440 bzw. 1560. Nach dem Rollup werden sie 2000
- Bei diesem Aggregationsprozess werden die Daten in der Standorthierarchie von der Stadt zum Land nach oben verschoben.
- Beim Aufrollen müssen mindestens ein oder mehrere Maße entfernt werden. In diesem Beispiel wurde die Dimension „Städte“ entfernt.
2) Drilldown
Beim Drilldown werden Daten in kleinere Teile fragmentiert. Es ist das Gegenteil des Rollup-Prozesses. Dies kann über erfolgen
- In der Konzepthierarchie nach unten bewegen
- Eine Dimension vergrößern
Betrachten Sie das Diagramm oben
- Das erste Quartal wird auf die Monate Januar, Februar und März aufgeschlüsselt. Entsprechende Umsätze liegen ebenfalls vor.
- In diesem Beispiel werden die Dimensionsmonate hinzugefügt.
3) Scheibe:
Hier wird eine Dimension ausgewählt und ein neuer Unterwürfel erstellt.
Das folgende Diagramm erläutert, wie die Slice-Operation durchgeführt wird:
- Dimension Time wird mit Q1 als Filter aufgeteilt.
- Es entsteht insgesamt ein neuer Würfel.
er sagt:
Dieser Vorgang ähnelt einem Slice. Der Unterschied beim Würfeln besteht darin, dass Sie zwei oder mehr Dimensionen auswählen, die zur Erstellung eines Unterwürfels führen.
4) Drehpunkt
In Pivot drehen Sie die Datenachsen, um eine Ersatzdarstellung der Daten bereitzustellen.
Im folgenden Beispiel basiert die Pivot-Tabelle auf Artikeltypen.
Arten von OLAP-Systemen
Hierarchische OLAP-Struktur
OLAP-Typ | Erläuterung |
---|---|
Relationales OLAP (ROLAP): | ROLAP ist ein erweitertes RDBMS mit mehrdimensionaler Datenzuordnung zur Durchführung standardmäßiger relationaler Operationen. |
Mehrdimensionales OLAP (MOLAP) | MOLAP implementiert Operationen in mehrdimensionalen Daten. |
Hybride Online-Analyseverarbeitung (HOLAP) | Beim HOLAP-Ansatz werden die aggregierten Gesamtsummen in einer mehrdimensionalen Datenbank gespeichert, während die detaillierten Daten in der relationalen Datenbank gespeichert werden. Dies bietet sowohl die Dateneffizienz des ROLAP-Modells als auch die Leistung des MOLAP-Modells. |
Desktop-OLAP (DOLAP) | Bei Desktop-OLAP lädt ein Benutzer einen Teil der Daten lokal oder auf seinem Desktop aus der Datenbank herunter und analysiert sie.
Die Bereitstellung von DOLAP ist relativ kostengünstig, da es im Vergleich zu anderen OLAP-Systemen nur sehr wenige Funktionen bietet. |
Web-OLAP (WOLAP) | Web-OLAP ist ein OLAP-System, auf das über den Webbrowser zugegriffen werden kann. WOLAP ist eine dreistufige Architektur. Es besteht aus drei Komponenten: Client, Middleware und Datenbankserver. |
Mobiles OLAP: | Mobile OLAP hilft Benutzern, mit ihren Mobilgeräten auf OLAP-Daten zuzugreifen und diese zu analysieren |
Räumliches OLAP: | SOLAP wurde entwickelt, um die Verwaltung sowohl räumlicher als auch nichträumlicher Daten in einem geografischen Informationssystem (GIS) zu erleichtern. |
ROLAP
ROLAP arbeitet mit Daten, die in einer relationalen Datenbank vorhanden sind. Fakten und Dimensionstabellen werden als relationale Tabellen gespeichert. Es ermöglicht auch die mehrdimensionale Analyse von Daten und ist das am schnellsten wachsende OLAP.
Vorteile des ROLAP-Modells:
- Hohe Dateneffizienz. Es bietet eine hohe Dateneffizienz, da Abfrageleistung und Zugriffssprache insbesondere für die mehrdimensionale Datenanalyse optimiert sind.
- Skalierbarkeit Diese Art von OLAP-System bietet Skalierbarkeit für die Verwaltung großer Datenmengen, selbst wenn die Datenmenge stetig wächst.
Nachteile des ROLAP-Modells:
- Nachfrage nach höheren Ressourcen: ROLAP erfordert eine hohe Auslastung von Arbeitskräften, Software- und Hardwareressourcen.
- Aggregierte Datenbeschränkungen. Verwendung von ROLAP-Tools SQL für alle Berechnungen aggregierter Daten. Der Handhabung von Berechnungen sind jedoch keine Grenzen gesetzt.
- Langsame Abfrageleistung. Die Abfrageleistung in diesem Modell ist im Vergleich zu MOLAP langsam
MOLAP
MOLAP verwendet Array-basierte mehrdimensionale Speicher-Engines, um mehrdimensionale Ansichten von Daten anzuzeigen. Grundsätzlich verwenden sie einen OLAP-Cube.
Erfahren Sie mehr über MOLAP HIER
Hybrid-OLAP
Hybrid OLAP ist eine Mischung aus ROLAP und MOLAP. Es bietet eine schnelle Berechnung von MOLAP und eine höhere Skalierbarkeit von ROLAP. HOLAP nutzt zwei Datenbanken.
- Aggregierte oder berechnete Daten werden in einem mehrdimensionalen OLAP-Cube gespeichert
- Detaillierte Informationen werden in einer relationalen Datenbank gespeichert.
Vorteile von Hybrid-OLAP:
- Diese Art von OLAP trägt dazu bei, Speicherplatz zu sparen und bleibt außerdem kompakt, wodurch Probleme im Zusammenhang mit der Zugriffsgeschwindigkeit und dem Komfort vermieden werden.
- Hybrid-HOLAPs nutzen die Cube-Technologie, die eine schnellere Leistung für alle Datentypen ermöglicht.
- ROLAP werden sofort aktualisiert und HOLAP-Benutzer haben Zugriff auf diese in Echtzeit aktualisierten Daten. MOLAP ermöglicht die Bereinigung und Konvertierung von Daten und verbessert so die Datenrelevanz. Dies bringt das Beste aus beiden Welten mit sich.
Nachteile von Hybrid-OLAP:
- Höhere Komplexität: Der größte Nachteil von HOLAP-Systemen besteht darin, dass sie sowohl ROLAP- als auch MOLAP-Tools und -Anwendungen unterstützen. Daher ist es sehr kompliziert.
- Mögliche Überschneidungen: Es besteht eine höhere Wahrscheinlichkeit von Überschneidungen, insbesondere hinsichtlich ihrer Funktionalitäten.
Vorteile von OLAP
- OLAP ist eine Plattform für alle Arten von Unternehmen, einschließlich Planung, Budgetierung, Berichterstattung und Analyse.
- Informationen und Berechnungen sind in einem OLAP-Cube konsistent. Dies ist ein entscheidender Vorteil.
- Erstellen und analysieren Sie schnell „Was wäre wenn“-Szenarien
- Durchsuchen Sie die OLAP-Datenbank ganz einfach nach allgemeinen oder spezifischen Begriffen.
- OLAP stellt die Bausteine für Geschäftsmodellierungstools, Data-Mining-Tools und Leistungsberichtstools bereit.
- Ermöglicht Benutzern das Schneiden und Würfeln von Würfeldaten nach verschiedenen Dimensionen, Maßen und Filtern.
- Es eignet sich gut zur Analyse von Zeitreihen.
- Mit OLAP lassen sich einige Cluster und Ausreißer leicht finden.
- Es handelt sich um ein leistungsstarkes Online-Analyseprozesssystem zur Visualisierung, das schnellere Reaktionszeiten bietet
Nachteile von OLAP
- OLAP erfordert die Organisation von Daten in einem Stern- oder Schneeflockenschema. Diese Schemata sind kompliziert zu implementieren und zu verwalten
- Ein einzelner OLAP-Cube kann keine große Anzahl von Dimensionen enthalten
- Auf Transaktionsdaten kann mit dem OLAP-System nicht zugegriffen werden.
- Jede Änderung an einem OLAP-Cube erfordert eine vollständige Aktualisierung des Cubes. Dies ist ein zeitaufwändiger Prozess
Zusammenfassung
- OLAP in Data Warehouse ist eine Technologie, die es Analysten ermöglicht, Geschäftsdaten aus verschiedenen Blickwinkeln zu extrahieren und zu betrachten.
- Das Herzstück des OLAP-Konzepts ist ein OLAP-Cube.
- Verschiedene Geschäftsanwendungen und andere Datenoperationen erfordern die Verwendung von OLAP Cube.
- Es gibt fünf primäre Arten analytischer OLAP-Operationen im Data Warehouse: 1) Roll-up 2) Drill-down 3) Slice 4) Dice und 5) Pivot
- Drei Arten weit verbreiteter OLAP-Systeme sind MOLAP, ROLAP und Hybrid OLAP.
- Desktop-OLAP, Web-OLAP und Mobile-OLAP sind einige andere Arten von OLAP-Systemen.