Що таке зіркова схема в моделюванні сховищ даних?
Що таке зіркова схема?
Схема зірок у сховищі даних — це схема, у якій центр зірки може мати одну таблицю фактів і кілька пов’язаних таблиць розмірності. Вона відома як зіркова схема, оскільки її структура нагадує зірку. Модель даних зіркової схеми є найпростішим типом схеми сховища даних. Вона також відома як схема зіркового об’єднання та оптимізована для запитів до великих наборів даних.
Що таке багатовимірна схема?
Багатовимірна схема спеціально розроблений для моделювання систем сховищ даних. Схеми розроблено для задоволення унікальних потреб дуже великих баз даних, призначених для аналітичних цілей (OLAP).
Типи схем сховища даних:
Нижче наведено 3 основних типи багатовимірних схем, кожна з яких має свої унікальні переваги.
- Схема зірок
- Схема сніжинки
- Схема галактики
Приклад моделювання даних зіркової схеми
У наступному прикладі зіркової схеми в центрі знаходиться таблиця фактів, яка містить ключі до кожної таблиці розмірів, як-от Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID та інші атрибути, як-от продані одиниці та дохід.
Таблиці фактів
Таблиця фактів у зірковій схемі містить факти та пов’язана з вимірами. Таблиця фактів має два типи стовпців:
- Колонка, яка містить Факти
- Зовнішній ключ до таблиці розмірів
Як правило, первинний ключ таблиці фактів є складеним ключем, який складається з усіх зовнішніх ключів, які складають таблицю.
Таблиці фактів можуть містити факти на рівні деталізації або зведені факти. Таблиці фактів, які включають зведені факти, часто називають зведеними таблицями. Таблиці фактів зазвичай містять факти, які були агреговані до певного рівня.
Розмірні таблиці
Вимір — це архітектура, яка класифікує дані в ієрархії. Вимір без ієрархій і рівнів називається плоским виміром або списком. Первинний ключ кожної таблиці розмірності є частиною складеного первинного ключа таблиці фактів. Атрибут розміру — це описовий текстовий атрибут, який допомагає описати розмірне значення. Таблиці фактів зазвичай більші за таблиці розмірів.
Характеристики зіркової схеми
- Кожен вимір у зірковій схемі представлено єдиною одновимірною таблицею.
- Таблиця розмірності повинна містити набір атрибутів.
- Таблиця розмірності з’єднується з таблицею фактів за допомогою зовнішнього ключа
- Таблиця розмірів не стикується одна з одною
- Таблиця фактів міститиме ключ і показник
- Схема Star проста для розуміння та забезпечує оптимальне використання диска.
- Таблиці розмірів не нормовані. Наприклад, на наведеному вище малюнку Country_ID не має таблиці пошуку країни, як у дизайні OLTP.
- Схема широко підтримується інструментами BI
Переваги зіркової схеми
- Зіркові схеми мають більш зрозумілу логіку об’єднання порівняно з іншими схемами для отримання даних із високо нормалізованих транзакційних схем.
- На відміну від високо нормалізованих транзакційних схем, зірчаста схема спрощує загальну логіку бізнес-звітності, таку як звітування та період за періодом.
- Зіркові схеми широко використовуються системами OLAP для ефективного проектування кубів. Зіркову схему можна використовувати як джерело без проектування кубічної структури в більшості основних систем OLAP.
- Увімкнувши певні схеми продуктивності, які можна застосовувати до запитів, програмне забезпечення процесора запитів у Star Schema може запропонувати кращі плани виконання.
Недолік зіркової схеми
- Оскільки схема сильно денормалізована, цілісність даних не забезпечується належним чином.
- Не гнучкий з точки зору аналітичних потреб.
- Зіркові схеми не зміцнюють зв’язки «багато-до-багатьох» у бізнес-підрозділах.