Co to jest OLAP? Sześcian, analityczny Operaw hurtowni danych

Co to jest OLAP?

Przetwarzanie analityczne online (OLAP) to kategoria oprogramowania, która pozwala użytkownikom analizować informacje z wielu systemów baz danych jednocześnie. Jest to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.

Analitycy często muszą grupować, agregować i łączyć dane. Te operacje OLAP w eksploracji danych są zasobochłonne. Dzięki OLAP dane mogą być wstępnie obliczone i wstępnie zagregowane, co przyspiesza analizę.

Bazy danych OLAP są podzielone na jedną lub więcej kostek. Kostki są zaprojektowane w taki sposób, aby tworzenie i przeglądanie raportów stało się łatwe. OLAP oznacza Online Analytical Processing.

kostka OLAP

Kostka OLAP
Kostka OLAP

U podstaw koncepcji OLAP leży kostka OLAP. Kostka OLAP to struktura danych zoptymalizowana pod kątem bardzo szybkiej operacji analiza danych.

Kostka OLAP składa się z faktów liczbowych zwanych miarami, które są podzielone na kategorie według wymiarów. Kostka OLAP jest również nazywana hipersześcian.

Zwykle operacje na danych i analiza są wykonywane przy użyciu prostego arkusza kalkulacyjnego, w którym wartości danych są uporządkowane w formacie wierszy i kolumn. Jest to idealne rozwiązanie dla danych dwuwymiarowych. Jednak OLAP zawiera dane wielowymiarowe, które są zazwyczaj uzyskiwane z innego i niezwiązanego źródła. Korzystanie z arkusza kalkulacyjnego nie jest optymalną opcją. Kostka może przechowywać i analizować dane wielowymiarowe w logiczny i uporządkowany sposób.

Jak to działa?

Hurtownia danych wyodrębnia informacje z wielu źródeł danych i formatów, takich jak pliki tekstowe, arkusz Excel, pliki multimedialne itp.

Wyodrębnione dane są czyszczone i przekształcane. Dane są ładowane na serwer OLAP (lub kostkę OLAP), gdzie informacje są wstępnie obliczane w celu dalszej analizy.

Podstawowe operacje analityczne OLAP

Istnieją cztery typy operacji analitycznych OLAP:

  1. zakasać
  2. Drążyć
  3. Plasterek i kości
  4. Obróć (obróć)

1) Roll-up:

Roll-up jest również znany jako „konsolidacja” lub „agregacja”. Operację roll-up można wykonać na 2 sposoby

  1. Zmniejszenie wymiarów
  2. Wspinaczka w górę hierarchii koncepcji. Hierarchia pojęć to system grupowania rzeczy na podstawie ich kolejności lub poziomu.

Rozważ poniższy diagram

Operacja roll-up w OLAP
Operacja roll-up w OLAP
  • W tym przykładzie miasta New Jersey i Lost Angles zostały zwinięte w kraju USA
  • Wielkość sprzedaży w New Jersey i Los Angeles wynosi odpowiednio 440 i 1560. Po roll-upie stają się 2000
  • W tym procesie agregacji dane to hierarchia lokalizacji przesuwająca się z miasta do kraju.
  • W procesie roll-upu należy usunąć co najmniej jeden lub więcej wymiarów. W tym przykładzie wymiar Miasta został usunięty.

2) Szczegółowy opis

Podczas drążenia dane są dzielone na mniejsze części. Jest to przeciwieństwo procesu rollup. Można to zrobić poprzez

  • Przechodzenie w dół hierarchii koncepcji
  • Zwiększanie wymiaru
Operacja drążenia w dół w OLAP
Operacja drążenia w dół w OLAP

Rozważ powyższy diagram

  • I kwartał jest podzielony na miesiące styczeń, luty i marzec. Odpowiednią sprzedażą są również rejestry.
  • W tym przykładzie dodane zostały miesiące wymiarowe.

3) Kawałek:

Tutaj wybierany jest jeden wymiar i tworzony jest nowy podsześcian.

Poniższy diagram wyjaśnia, jak przebiega operacja podziału:

Operacja podziału w OLAP
Operacja podziału w OLAP
  • Czas wymiaru jest dzielony za pomocą Q1 jako filtra.
  • W całości powstaje nowa kostka.

Kostka do gry:

Ta operacja jest podobna do cięcia. Różnica w kostkach polega na tym, że wybierasz 2 lub więcej wymiarów, co skutkuje utworzeniem podkostki.

Operacja na kostkach w OLAP
Operacja na kostkach w OLAP

4) Obrót

W Pivot obracasz osie danych, aby zapewnić zastępczą prezentację danych.

W poniższym przykładzie tabela przestawna opiera się na typach elementów.

Operacja Pivot w OLAP
Operacja Pivot w OLAP

Rodzaje systemów OLAP

Struktura hierarchiczna OLAP

Rodzaje systemów OLAP
Rodzaje systemów OLAP
Rodzaj OLAP-u Wyjaśnienie
Relacyjny OLAP(ROLAP): ROLAP to rozbudowany system RDBMS wyposażony w wielowymiarowe mapowanie danych, umożliwiający wykonywanie standardowych operacji relacyjnych.
Wielowymiarowy OLAP (MOLAP) MOLAP Implementuje operacje na danych wielowymiarowych.
Hybrydowe przetwarzanie analityczne online (HOLAP) W podejściu HOLAP zagregowane sumy są przechowywane w wielowymiarowej bazie danych, natomiast szczegółowe dane są przechowywane w relacyjnej bazie danych. Zapewnia to zarówno wydajność danych modelu ROLAP, jak i wydajność modelu MOLAP.
Pulpit OLAP (DOLAP) W Desktop OLAP użytkownik pobiera część danych z bazy danych lokalnie lub na swój komputer i analizuje je.

DOLAP jest stosunkowo tańszy we wdrożeniu, ponieważ oferuje bardzo mało funkcji w porównaniu z innymi systemami OLAP.

Internetowy OLAP (WOLAP) Web OLAP, czyli system OLAP dostępny za pośrednictwem przeglądarki internetowej. WOLAP to architektura trójwarstwowa. Składa się z trzech komponentów: klienta, middleware i serwera bazy danych.
Mobilny OLAP: Mobilny OLAP pomaga użytkownikom uzyskiwać dostęp do danych OLAP i analizować je za pomocą urządzeń mobilnych
Przestrzenny OLAP: SOLAP powstał, aby ułatwić zarządzanie danymi przestrzennymi i nieprzestrzennymi w systemie informacji geograficznej (GIS)

ROLAP

ROLAP działa z danymi, które istnieją w relacyjnej bazie danych. Fakty i tabele wymiarów są przechowywane jako tabele relacyjne. Umożliwia również wielowymiarową analizę danych i jest najszybciej rozwijającym się OLAP.

Zalety modelu ROLAP:

  • Wysoka wydajność danych. Oferuje wysoką wydajność danych, ponieważ wydajność zapytań i język dostępu są zoptymalizowane szczególnie pod kątem wielowymiarowej analizy danych.
  • Skalowalność. Ten typ systemu OLAP oferuje skalowalność w celu zarządzania dużymi wolumenami danych, nawet gdy ich ilość stale rośnie.

Wady modelu ROLAP:

  • Zapotrzebowanie na wyższe zasoby: ROLAP wymaga wysokiego wykorzystania zasobów ludzkich, oprogramowania i sprzętu.
  • Łączne ograniczenia danych. Używanie narzędzi ROLAP SQL dla wszelkich obliczeń danych zbiorczych. Nie ma jednak ustalonych ograniczeń dotyczących obsługi obliczeń.
  • Niska wydajność zapytań. Wydajność zapytań w tym modelu jest niska w porównaniu z MOLAP

MOLAP

MOLAP wykorzystuje wielowymiarowe silniki pamięci oparte na tablicach do wyświetlania wielowymiarowych widoków danych. Zasadniczo używają kostki OLAP.

Dowiedz się więcej o MOLAP-ie w tym miejscu

Hybrydowy OLAP

Hybrydowy OLAP jest mieszanką ROLAP i MOLAP. Oferuje szybkie obliczenia MOLAP i większą skalowalność ROLAP. HOLAP korzysta z dwóch baz danych.

  1. Zagregowane lub obliczone dane są przechowywane w wielowymiarowej kostce OLAP
  2. Szczegółowe informacje przechowywane są w relacyjnej bazie danych.

Korzyści z hybrydowego OLAP-u:

  • Ten rodzaj OLAP pomaga zaoszczędzić miejsce na dysku, a także pozostaje kompaktowy, co pomaga uniknąć problemów związanych z szybkością i wygodą dostępu.
  • Hybrydowe HOLAPy wykorzystują technologię kostek, która umożliwia szybsze działanie dla wszystkich typów danych.
  • ROLAP są natychmiast aktualizowane, a użytkownicy HOLAP mają dostęp do tych natychmiast aktualizowanych danych w czasie rzeczywistym. MOLAP zapewnia czyszczenie i konwersję danych, poprawiając w ten sposób ich przydatność. To łączy w sobie to, co najlepsze z obu światów.

Wady hybrydowego OLAP-u:

  • Większy poziom złożoności: Główną wadą systemów HOLAP jest to, że obsługują one zarówno narzędzia i aplikacje ROLAP, jak i MOLAP. Jest to zatem bardzo skomplikowane.
  • Potencjalne nakładanie się: Istnieje większe ryzyko nakładania się, szczególnie w zakresie ich funkcjonalności.

Zalety OLAP-u

  • OLAP to platforma dla każdego rodzaju działalności, obejmująca planowanie, budżetowanie, raportowanie i analizy.
  • Informacje i obliczenia są spójne w kostce OLAP. To kluczowa korzyść.
  • Szybko twórz i analizuj scenariusze „co jeśli”.
  • Z łatwością przeszukuj bazę danych OLAP pod kątem ogólnych lub szczegółowych terminów.
  • OLAP zapewnia elementy składowe narzędzi do modelowania biznesowego, narzędzi do eksploracji danych i narzędzi do raportowania wydajności.
  • Umożliwia użytkownikom wycinanie kostek według różnych wymiarów, miar i filtrów.
  • Dobrze jest analizować szeregi czasowe.
  • Znajdowanie skupisk i wartości odstających jest łatwe dzięki OLAP.
  • Jest to potężny system wizualizacji procesów analitycznych online, który zapewnia szybszy czas reakcji

Wady OLAP-u

  • OLAP wymaga uporządkowania danych w schemat gwiazdy lub płatka śniegu. Schematy te są skomplikowane we wdrażaniu i administrowaniu
  • W jednej kostce OLAP nie można umieścić dużej liczby wymiarów
  • Za pomocą systemu OLAP nie można uzyskać dostępu do danych transakcyjnych.
  • Wszelkie modyfikacje w kostce OLAP wymagają pełnej aktualizacji kostki. Jest to proces czasochłonny

Podsumowanie

  • OLAP w hurtownia danych to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.
  • U podstaw koncepcji OLAP leży kostka OLAP.
  • Różne aplikacje biznesowe i inne operacje na danych wymagają użycia OLAP Cube.
  • W magazynie danych wyróżnia się pięć podstawowych typów operacji analitycznych OLAP: 1) Agregacja, 2) Analiza szczegółowa, 3) Wycinek, 4) Kostka i 5) Obrót.
  • Trzy typy powszechnie stosowanych systemów OLAP to MOLAP, ROLAP i Hybrid OLAP.
  • Desktop OLAP, Web OLAP i Mobile OLAP to kilka innych typów systemów OLAP.