Co to jest schemat gwiaździsty w modelowaniu hurtowni danych?

Co to jest schemat gwiazdy?

Schemat gwiazdy w hurtowni danych to schemat, w którym środek gwiazdy może mieć jedną tabelę faktów i wiele powiązanych tabel wymiarów. Nazywa się go schematem gwiazdy, ponieważ jego struktura przypomina gwiazdę. Model danych Star Schema jest najprostszym typem schematu hurtowni danych. Jest również znany jako schemat łączenia gwiazd i jest zoptymalizowany do wykonywania zapytań o duże zbiory danych.

Co to jest schemat wielowymiarowy?

Schemat wielowymiarowy jest specjalnie zaprojektowany do modelowania systemów hurtowni danych. Schematy zaprojektowano z myślą o specyficznych potrzebach bardzo dużych baz danych przeznaczonych do celów analitycznych (OLAP).

Rodzaje schematów hurtowni danych:

Poniżej przedstawiono 3 główne typy schematów wielowymiarowych, z których każdy ma swoje unikalne zalety.

Przykład modelowania danych według schematu gwiazdy

W poniższym przykładzie schematu gwiazdy tabela faktów znajduje się w centrum i zawiera klucze do każdej tabeli wymiarów, takiej jak Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID i inne atrybuty, takie jak liczba sprzedanych jednostek i przychód.

Modelowanie danych według schematu gwiazdy
Przykład diagramu schematu gwiazdy

Tabele faktów

Tabela faktów w schemacie gwiaździstym zawiera fakty i jest powiązana z wymiarami. Tabela faktów ma dwa typy kolumn:

  • Kolumna zawierająca fakty
  • Klucz obcy do tabeli wymiarów

Ogólnie rzecz biorąc, klucz podstawowy tabeli faktów jest kluczem złożonym składającym się ze wszystkich kluczy obcych tworzących tabelę.

Tabele faktów mogą zawierać fakty na poziomie szczegółowym lub fakty zagregowane. Tabele faktów zawierające zagregowane fakty są często nazywane tabelami podsumowań. Tabele faktów zazwyczaj zawierają fakty, które zostały zagregowane do pewnego poziomu.

Tabele wymiarów

Wymiar to architektura, która kategoryzuje dane w hierarchii. Wymiar bez hierarchii i poziomów nazywany jest płaskim wymiarem lub listą. Klucz podstawowy każdej tabeli wymiarów jest częścią złożonego klucza podstawowego tabeli faktów. Atrybut wymiaru to opisowy, tekstowy atrybut, który pomaga opisać wartość wymiarową. Tabele faktów są zwykle większe niż tabele wymiarów.

Charakterystyka Schematu Gwiazdy

  • Każdy wymiar w schemacie gwiaździstym jest reprezentowany za pomocą jedynej tabeli jednowymiarowej.
  • Tabela wymiarów powinna zawierać zestaw atrybutów.
  • Tabela wymiarów jest łączona z tabelą faktów za pomocą klucza obcego
  • Tabela wymiarów nie jest ze sobą połączona
  • Tabela faktów zawierałaby klucz i miarę
  • Schemat Star jest łatwy do zrozumienia i zapewnia optymalne wykorzystanie dysku.
  • Tabele wymiarów nie są znormalizowane. Na przykład na powyższym rysunku Country_ID nie ma tabeli wyszukiwania krajów, jak miałby to miejsce w przypadku projektu OLTP.
  • Schemat jest szeroko obsługiwany przez narzędzia BI

Zalety schematu gwiazdy

  • Schematy gwiaździste mają prostszą logikę łączenia w porównaniu z innymi schematami służącą do pobierania danych z wysoce znormalizowanych schematów transakcyjnych.
  • W przeciwieństwie do wysoce znormalizowanych schematów transakcyjnych, schemat gwiazdy upraszcza typową logikę raportowania biznesowego, taką jak raportowanie i okres po okresie.
  • Schematy gwiaździste są szeroko stosowane w systemach OLAP do wydajnego projektowania kostek. W większości głównych systemów OLAP jako źródło można wykorzystać schemat gwiazdy bez konieczności projektowania struktury sześcianu.
  • Włączając określone schematy wydajności, które można zastosować do zapytań, oprogramowanie procesora zapytań w Star Schema może zaoferować lepsze plany wykonania.

Wady schematu gwiazdy

  • Ponieważ schemat jest wysoce zdenormalizowany, integralność danych nie jest dobrze egzekwowana.
  • Brak elastyczności w zakresie potrzeb analitycznych.
  • Schematy gwiaździste nie wzmacniają relacji wiele do wielu w jednostkach biznesowych.