Co to jest OLAP? Sześcian, analityczny Operaw hurtowni danych
Co to jest OLAP?
Przetwarzanie analityczne online (OLAP) to kategoria oprogramowania, która pozwala użytkownikom analizować informacje z wielu systemów baz danych jednocześnie. Jest to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.
Analitycy często muszą grupować, agregować i łączyć dane. Te operacje OLAP w eksploracji danych są zasobochłonne. Dzięki OLAP dane mogą być wstępnie obliczone i wstępnie zagregowane, co przyspiesza analizę.
Bazy danych OLAP są podzielone na jedną lub więcej kostek. Kostki są zaprojektowane w taki sposób, aby tworzenie i przeglądanie raportów stało się łatwe. OLAP oznacza Online Analytical Processing.
kostka OLAP

U podstaw koncepcji OLAP leży kostka OLAP. Kostka OLAP to struktura danych zoptymalizowana pod kątem bardzo szybkiej operacji analiza danych.
Kostka OLAP składa się z faktów liczbowych zwanych miarami, które są podzielone na kategorie według wymiarów. Kostka OLAP jest również nazywana hipersześcian.
Zwykle operacje na danych i analiza są wykonywane przy użyciu prostego arkusza kalkulacyjnego, w którym wartości danych są uporządkowane w formacie wierszy i kolumn. Jest to idealne rozwiązanie dla danych dwuwymiarowych. Jednak OLAP zawiera dane wielowymiarowe, które są zazwyczaj uzyskiwane z innego i niezwiązanego źródła. Korzystanie z arkusza kalkulacyjnego nie jest optymalną opcją. Kostka może przechowywać i analizować dane wielowymiarowe w logiczny i uporządkowany sposób.
Jak to działa?
Hurtownia danych wyodrębnia informacje z wielu źródeł danych i formatów, takich jak pliki tekstowe, arkusz Excel, pliki multimedialne itp.
Wyodrębnione dane są czyszczone i przekształcane. Dane są ładowane na serwer OLAP (lub kostkę OLAP), gdzie informacje są wstępnie obliczane w celu dalszej analizy.
Podstawowe operacje analityczne OLAP
Istnieją cztery typy operacji analitycznych OLAP:
- zakasać
- Drążyć
- Plasterek i kości
- Obróć (obróć)
1) Roll-up:
Roll-up jest również znany jako „konsolidacja” lub „agregacja”. Operację roll-up można wykonać na 2 sposoby
- Zmniejszenie wymiarów
- Wspinaczka w górę hierarchii koncepcji. Hierarchia pojęć to system grupowania rzeczy na podstawie ich kolejności lub poziomu.
Rozważ poniższy diagram
- W tym przykładzie miasta New Jersey i Lost Angles zostały zwinięte w kraju USA
- Wielkość sprzedaży w New Jersey i Los Angeles wynosi odpowiednio 440 i 1560. Po roll-upie stają się 2000
- W tym procesie agregacji dane to hierarchia lokalizacji przesuwająca się z miasta do kraju.
- W procesie roll-upu należy usunąć co najmniej jeden lub więcej wymiarów. W tym przykładzie wymiar Miasta został usunięty.
2) Szczegółowy opis
Podczas drążenia dane są dzielone na mniejsze części. Jest to przeciwieństwo procesu rollup. Można to zrobić poprzez
- Przechodzenie w dół hierarchii koncepcji
- Zwiększanie wymiaru
Rozważ powyższy diagram
- I kwartał jest podzielony na miesiące styczeń, luty i marzec. Odpowiednią sprzedażą są również rejestry.
- W tym przykładzie dodane zostały miesiące wymiarowe.
3) Kawałek:
Tutaj wybierany jest jeden wymiar i tworzony jest nowy podsześcian.
Poniższy diagram wyjaśnia, jak przebiega operacja podziału:
- Czas wymiaru jest dzielony za pomocą Q1 jako filtra.
- W całości powstaje nowa kostka.
Kostka do gry:
Ta operacja jest podobna do cięcia. Różnica w kostkach polega na tym, że wybierasz 2 lub więcej wymiarów, co skutkuje utworzeniem podkostki.
4) Obrót
W Pivot obracasz osie danych, aby zapewnić zastępczą prezentację danych.
W poniższym przykładzie tabela przestawna opiera się na typach elementów.
Rodzaje systemów OLAP
Struktura hierarchiczna OLAP
Rodzaj OLAP-u | Wyjaśnienie |
---|---|
Relacyjny OLAP(ROLAP): | ROLAP to rozbudowany system RDBMS wyposażony w wielowymiarowe mapowanie danych, umożliwiający wykonywanie standardowych operacji relacyjnych. |
Wielowymiarowy OLAP (MOLAP) | MOLAP Implementuje operacje na danych wielowymiarowych. |
Hybrydowe przetwarzanie analityczne online (HOLAP) | W podejściu HOLAP zagregowane sumy są przechowywane w wielowymiarowej bazie danych, natomiast szczegółowe dane są przechowywane w relacyjnej bazie danych. Zapewnia to zarówno wydajność danych modelu ROLAP, jak i wydajność modelu MOLAP. |
Pulpit OLAP (DOLAP) | W Desktop OLAP użytkownik pobiera część danych z bazy danych lokalnie lub na swój komputer i analizuje je.
DOLAP jest stosunkowo tańszy we wdrożeniu, ponieważ oferuje bardzo mało funkcji w porównaniu z innymi systemami OLAP. |
Internetowy OLAP (WOLAP) | Web OLAP, czyli system OLAP dostępny za pośrednictwem przeglądarki internetowej. WOLAP to architektura trójwarstwowa. Składa się z trzech komponentów: klienta, middleware i serwera bazy danych. |
Mobilny OLAP: | Mobilny OLAP pomaga użytkownikom uzyskiwać dostęp do danych OLAP i analizować je za pomocą urządzeń mobilnych |
Przestrzenny OLAP: | SOLAP powstał, aby ułatwić zarządzanie danymi przestrzennymi i nieprzestrzennymi w systemie informacji geograficznej (GIS) |
ROLAP
ROLAP działa z danymi, które istnieją w relacyjnej bazie danych. Fakty i tabele wymiarów są przechowywane jako tabele relacyjne. Umożliwia również wielowymiarową analizę danych i jest najszybciej rozwijającym się OLAP.
Zalety modelu ROLAP:
- Wysoka wydajność danych. Oferuje wysoką wydajność danych, ponieważ wydajność zapytań i język dostępu są zoptymalizowane szczególnie pod kątem wielowymiarowej analizy danych.
- Skalowalność. Ten typ systemu OLAP oferuje skalowalność w celu zarządzania dużymi wolumenami danych, nawet gdy ich ilość stale rośnie.
Wady modelu ROLAP:
- Zapotrzebowanie na wyższe zasoby: ROLAP wymaga wysokiego wykorzystania zasobów ludzkich, oprogramowania i sprzętu.
- Łączne ograniczenia danych. Używanie narzędzi ROLAP SQL dla wszelkich obliczeń danych zbiorczych. Nie ma jednak ustalonych ograniczeń dotyczących obsługi obliczeń.
- Niska wydajność zapytań. Wydajność zapytań w tym modelu jest niska w porównaniu z MOLAP
MOLAP
MOLAP wykorzystuje wielowymiarowe silniki pamięci oparte na tablicach do wyświetlania wielowymiarowych widoków danych. Zasadniczo używają kostki OLAP.
Dowiedz się więcej o MOLAP-ie w tym miejscu
Hybrydowy OLAP
Hybrydowy OLAP jest mieszanką ROLAP i MOLAP. Oferuje szybkie obliczenia MOLAP i większą skalowalność ROLAP. HOLAP korzysta z dwóch baz danych.
- Zagregowane lub obliczone dane są przechowywane w wielowymiarowej kostce OLAP
- Szczegółowe informacje przechowywane są w relacyjnej bazie danych.
Korzyści z hybrydowego OLAP-u:
- Ten rodzaj OLAP pomaga zaoszczędzić miejsce na dysku, a także pozostaje kompaktowy, co pomaga uniknąć problemów związanych z szybkością i wygodą dostępu.
- Hybrydowe HOLAPy wykorzystują technologię kostek, która umożliwia szybsze działanie dla wszystkich typów danych.
- ROLAP są natychmiast aktualizowane, a użytkownicy HOLAP mają dostęp do tych natychmiast aktualizowanych danych w czasie rzeczywistym. MOLAP zapewnia czyszczenie i konwersję danych, poprawiając w ten sposób ich przydatność. To łączy w sobie to, co najlepsze z obu światów.
Wady hybrydowego OLAP-u:
- Większy poziom złożoności: Główną wadą systemów HOLAP jest to, że obsługują one zarówno narzędzia i aplikacje ROLAP, jak i MOLAP. Jest to zatem bardzo skomplikowane.
- Potencjalne nakładanie się: Istnieje większe ryzyko nakładania się, szczególnie w zakresie ich funkcjonalności.
Zalety OLAP-u
- OLAP to platforma dla każdego rodzaju działalności, obejmująca planowanie, budżetowanie, raportowanie i analizy.
- Informacje i obliczenia są spójne w kostce OLAP. To kluczowa korzyść.
- Szybko twórz i analizuj scenariusze „co jeśli”.
- Z łatwością przeszukuj bazę danych OLAP pod kątem ogólnych lub szczegółowych terminów.
- OLAP zapewnia elementy składowe narzędzi do modelowania biznesowego, narzędzi do eksploracji danych i narzędzi do raportowania wydajności.
- Umożliwia użytkownikom wycinanie kostek według różnych wymiarów, miar i filtrów.
- Dobrze jest analizować szeregi czasowe.
- Znajdowanie skupisk i wartości odstających jest łatwe dzięki OLAP.
- Jest to potężny system wizualizacji procesów analitycznych online, który zapewnia szybszy czas reakcji
Wady OLAP-u
- OLAP wymaga uporządkowania danych w schemat gwiazdy lub płatka śniegu. Schematy te są skomplikowane we wdrażaniu i administrowaniu
- W jednej kostce OLAP nie można umieścić dużej liczby wymiarów
- Za pomocą systemu OLAP nie można uzyskać dostępu do danych transakcyjnych.
- Wszelkie modyfikacje w kostce OLAP wymagają pełnej aktualizacji kostki. Jest to proces czasochłonny
Podsumowanie
- OLAP w hurtownia danych to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.
- U podstaw koncepcji OLAP leży kostka OLAP.
- Różne aplikacje biznesowe i inne operacje na danych wymagają użycia OLAP Cube.
- W magazynie danych wyróżnia się pięć podstawowych typów operacji analitycznych OLAP: 1) Agregacja, 2) Analiza szczegółowa, 3) Wycinek, 4) Kostka i 5) Obrót.
- Trzy typy powszechnie stosowanych systemów OLAP to MOLAP, ROLAP i Hybrid OLAP.
- Desktop OLAP, Web OLAP i Mobile OLAP to kilka innych typów systemów OLAP.