Co to jest modelowanie wymiarowe w hurtowni danych? Naucz się typów

Modelowanie wymiarowe

Modelowanie wymiarowe (DM) to technika struktury danych zoptymalizowana pod kątem przechowywania danych w hurtowni danych. Celem modelowania wymiarowego jest optymalizacja bazy danych w celu szybszego wyszukiwania danych. Koncepcja modelowania wymiarowego została opracowana przez Ralpha Kimballa i składa się z tabel „faktów” i „wymiarów”.

Model wymiarowy w magazynie danych jest przeznaczony do odczytywania, podsumowywania, analizowania informacji liczbowych, takich jak wartości, salda, liczby, wagi itp. w magazynie danych. Natomiast modele relacyjne są zoptymalizowane pod kątem dodawania, aktualizowania i usuwania danych w systemie transakcji online w czasie rzeczywistym.

Te modele wymiarowe i relacyjne mają swój unikalny sposób przechowywania danych, który ma określone zalety.

Na przykład w trybie relacyjnym modele normalizacyjne i ER zmniejszają redundancję danych. Wprost przeciwnie, model wymiarowy w hurtowni danych porządkuje dane w taki sposób, że łatwiej jest wyszukać informacje i wygenerować raporty.

Dlatego też stosuje się modele wymiarowe systemy hurtowni danych i nie pasuje dobrze do systemów relacyjnych.

Elementy wymiarowego modelu danych

Fakt

Fakty to pomiary/metryki lub fakty z Twojego procesu biznesowego. W przypadku procesu biznesowego sprzedaży miarą będzie kwartalna liczba sprzedaży

Wymiary

Wymiar zapewnia kontekst otaczający zdarzenie procesu biznesowego. Krótko mówiąc, podają fakt, kto, co, gdzie. W procesie biznesowym sprzedaży, w przypadku kwartalnej liczby sprzedaży, wymiary będą wynosić

  • Kto – Nazwy klientów
  • Gdzie – lokalizacja
  • Co – nazwa produktu

Innymi słowy, wymiar jest oknem umożliwiającym przeglądanie informacji zawartych w faktach.

Atrybuty

Atrybuty to różne cechy wymiaru w modelowaniu danych wymiarowych.

W wymiarze Lokalizacja atrybuty mogą być

  • Miasto
  • kraj
  • Kod pocztowy itp.

Atrybuty służą do wyszukiwania, filtrowania i klasyfikowania faktów. Tabele wymiarów zawierają atrybuty

Tabela faktów

Tabela faktów jest podstawową tabelą w modelowaniu wymiarowym.

Tabela faktów zawiera

  1. Pomiary/fakty
  2. Klucz obcy do tabeli wymiarów

Tabela wymiarów

  • Tabela wymiarów zawiera wymiary faktu.
  • Są one łączone z tabelą faktów za pomocą klucza obcego.
  • Tabele wymiarów są tabelami zdenormalizowanymi.
  • Atrybuty wymiaru to różne kolumny w tabeli wymiarów
  • Wymiary oferują opisową charakterystykę faktów za pomocą ich atrybutów
  • Nie ustalono limitu dla podanej liczby wymiarów
  • Wymiar może również zawierać jedną lub więcej relacji hierarchicznych

Typy wymiarów w hurtowni danych

Poniżej znajdują się pliki Typy wymiarów w hurtowni danych:

  • Zgodny wymiar
  • Wymiar wysięgnika
  • Skurczony wymiar
  • Wymiar odgrywania ról
  • Wymiar do tabeli wymiarów
  • Śmieciowy wymiar
  • zdegenerowany wymiar
  • Wymienny wymiar
  • Wymiar kroku

Etapy modelowania wymiarowego

Dokładność tworzenia modelu wymiarowego decyduje o powodzeniu wdrożenia hurtowni danych. Poniżej przedstawiono kroki tworzenia modelu wymiarowego

  1. Zidentyfikuj proces biznesowy
  2. Identyfikacja ziarna (poziom szczegółowości)
  3. Identyfikacja wymiarów
  4. Identyfikuj fakty
  5. Zbuduj gwiazdę

Model powinien opisywać dlaczego, ile, kiedy/gdzie/kto i co obejmuje proces biznesowy

Etapy modelowania wymiarowego

Krok 1) Zidentyfikuj proces biznesowy

Identyfikacja rzeczywistego procesu biznesowego, który powinna obejmować hurtownia danych. Może to być marketing, sprzedaż, HR itp. zgodnie z art analiza danych potrzeb organizacji. Wybór procesu biznesowego zależy także od jakości danych dostępnych dla tego procesu. Jest to najważniejszy etap procesu modelowania danych, a awaria w tym miejscu spowodowałaby kaskadowe i nieodwracalne defekty.

Aby opisać proces biznesowy, możesz użyć zwykłego tekstu lub użyć podstawowej notacji modelowania procesów biznesowych (BPMN) lub ujednoliconego języka modelowania (UML).

Krok 2) Zidentyfikuj ziarno

Ziarno opisuje poziom szczegółowości problemu/rozwiązania biznesowego. Jest to proces identyfikowania najniższego poziomu informacji dla dowolnej tabeli w hurtowni danych. Jeśli tabela zawiera dane sprzedażowe dla każdego dnia, powinna to być szczegółowość dzienna. Jeśli tabela zawiera dane dotyczące łącznej sprzedaży w każdym miesiącu, wówczas ma ona miesięczną szczegółowość.

Na tym etapie odpowiadasz na pytania takie jak

  1. Czy musimy przechowywać wszystkie dostępne produkty, czy tylko kilka rodzajów produktów? Decyzja ta opiera się na procesach biznesowych wybranych dla Datawarehouse
  2. Czy przechowujemy informacje o sprzedaży produktów w trybie miesięcznym, tygodniowym, dziennym czy godzinowym? Decyzja ta zależy od charakteru raportów wymaganych przez kadrę kierowniczą
  3. Jak powyższe dwie opcje wpływają na rozmiar bazy danych?

Przykład zboża:

Dyrektor generalny korporacji międzynarodowej chce codziennie sprawdzać sprzedaż określonych produktów w różnych lokalizacjach.

Zatem ziarno to „informacje o sprzedaży produktów według lokalizacji w ciągu dnia”.

Krok 3) Określ wymiary

Wymiary to rzeczowniki, takie jak data, sklep, inwentarz itp. W tych wymiarach powinny być przechowywane wszystkie dane. Na przykład wymiar daty może zawierać dane takie jak rok, miesiąc i dzień tygodnia.

Przykład wymiarów:

Dyrektor generalny korporacji międzynarodowej chce codziennie sprawdzać sprzedaż określonych produktów w różnych lokalizacjach.

Wymiary: produkt, lokalizacja i czas

Atrybuty: Dla produktu: Klucz produktu (klucz obcy), nazwa, typ, specyfikacje

Hierarchie: Dla lokalizacji: Kraj, Województwo, Miasto, Adres Ulicy, Nazwa

Krok 4) Ustal fakt

Z tym krokiem współpracujemy z biznesowymi użytkownikami systemu, gdyż to właśnie oni uzyskują dostęp do danych zgromadzonych w hurtowni danych. Większość wierszy tabeli faktów to wartości liczbowe, takie jak cena lub koszt jednostkowy itp.

Przykład faktów:

Dyrektor generalny korporacji międzynarodowej chce codziennie sprawdzać sprzedaż określonych produktów w różnych lokalizacjach.

Faktem jest tutaj Suma sprzedaży według produktu, lokalizacji i czasu.

Krok 5) Zbuduj schemat

W tym kroku zaimplementujesz Model wymiarowania. Schemat to nic innego jak struktura bazy danych (układ tabel). Istnieją dwa popularne schematy

  1. Schemat gwiazdy

Architektura schematu gwiazdy jest łatwa do zaprojektowania. Nazywa się go schematem gwiazdy, ponieważ diagram przypomina gwiazdę, z punktami rozchodzącymi się promieniście od środka. Środek gwiazdy składa się z tabeli faktów, a punkty gwiazdy to tabele wymiarów.

Tabele faktów w schemacie gwiaździstym będącym trzecią postacią normalną, natomiast tablice wymiarowe są zdenormalizowane.

  1. Schemat płatka śniegu

Schemat płatka śniegu jest rozwinięciem schematu gwiazdy. W schemacie płatka śniegu każdy wymiar jest znormalizowany i połączony z większą liczbą tabel wymiarów.

Sprawdź również: - Schemat gwiazdy i płatka śniegu w hurtowni danych z przykładami modeli

Zasady modelowania wymiarowego

Poniżej przedstawiono zasady i reguły modelowania wymiarowego:

  • Załaduj dane atomowe do struktur wymiarowych.
  • Twórz modele wymiarowe wokół procesów biznesowych.
  • Należy upewnić się, że każda tabela faktów ma powiązaną tabelę wymiarów dat.
  • Upewnij się, że wszystkie fakty w pojedynczej tabeli faktów mają ten sam poziom szczegółowości.
  • Niezbędne jest przechowywanie etykiet raportów i wartości domen filtrowania w tabelach wymiarów
  • Należy upewnić się, że tabele wymiarów używają klucza zastępczego
  • Stale równoważ wymagania i realia, aby dostarczać rozwiązania biznesowe wspierające proces decyzyjny

Korzyści z modelowania wymiarowego

  • Standaryzacja wymiarów umożliwia łatwe raportowanie w różnych obszarach działalności.
  • Tabele wymiarów przechowują historię informacji o wymiarach.
  • Pozwala na wprowadzenie zupełnie nowego wymiaru bez większych zakłóceń w tabeli faktów.
  • Wymiarowy również do przechowywania danych w taki sposób, że łatwiej jest odzyskać informacje z danych, gdy dane są przechowywane w bazie danych.
  • W porównaniu do znormalizowanego modelu tabela wymiarów jest łatwiejsza do zrozumienia.
  • Informacje pogrupowane są w przejrzyste i proste kategorie biznesowe.
  • Model wymiarowy jest bardzo zrozumiały dla biznesu. Model ten opiera się na warunkach biznesowych, dzięki czemu firma wie, co oznacza każdy fakt, wymiar lub atrybut.
  • Modele wymiarowe są zdeformowane i zoptymalizowane pod kątem szybkiego wykonywania zapytań o dane. Wiele platform relacyjnych baz danych rozpoznaje ten model i optymalizuje plany wykonywania zapytań, aby zwiększyć wydajność.
  • Modelowanie wymiarowe w hurtowni danych tworzy schemat zoptymalizowany pod kątem wysokiej wydajności. Oznacza to mniej połączeń i pomaga zminimalizować nadmiarowość danych.
  • Model wymiarowy pomaga również zwiększyć wydajność zapytań. Jest bardziej zdenormalizowany, dlatego jest zoptymalizowany pod kątem zapytań.
  • Modele wymiarowe mogą wygodnie dostosowywać się do zmian. Do tabel wymiarów można dodać więcej kolumn bez wpływu na istniejące aplikacje analizy biznesowej korzystające z tych tabel.

Co to jest wielowymiarowy model danych w hurtowni danych?

Wielowymiarowy model danych w hurtowni danych to model reprezentujący dane w postaci kostek danych. Pozwala modelować i przeglądać dane w wielu wymiarach i jest definiowany przez wymiary i fakty. Wielowymiarowy model danych jest ogólnie podzielony na kategorie wokół głównego tematu i reprezentowany przez tabelę faktów.

Podsumowanie

  • Model wymiarowy to technika struktury danych zoptymalizowana pod kątem Narzędzia do hurtowni danych.
  • Fakty to pomiary/metryki lub fakty z Twojego procesu biznesowego.
  • Wymiar zapewnia kontekst otaczający zdarzenie procesu biznesowego.
  • Atrybuty to różne cechy modelowania wymiarowego.
  • Tabela faktów jest tabelą podstawową w modelu wymiarowym.
  • Tabela wymiarów zawiera wymiary faktu.
  • Istnieją trzy rodzaje faktów: 1. Dodatek 2. Nieaddytywność 3. Póładdytywność.
  • Typy wymiarów to wymiary zgodne, wysięgnikowe, skurczone, odgrywanie ról, tabela wymiarów do wymiarów, śmieciowe, zdegenerowane, wymienne i schodkowe.
  • Pięć kroków modelowania wymiarowego to 1. Zidentyfikuj proces biznesowy 2. Zidentyfikuj ziarno (poziom szczegółowości) 3. Zidentyfikuj wymiary 4. Zidentyfikuj fakty 5. Zbuduj gwiazdę
  • W przypadku modelowania wymiarowego w hurtowni danych należy upewnić się, że każda tabela faktów ma powiązaną tabelę wymiarów dat.