Какво е звездна схема в моделирането на Data Warehouse?
Какво е звездна схема?
Звездна схема в склад за данни, е схема, в която центърът на звездата може да има една таблица с факти и няколко свързани таблици с измерения. Известна е като звездна схема, тъй като структурата й наподобява звезда. Моделът на данни Star Schema е най-простият тип схема на Data Warehouse. Известна е още като схема за звездно присъединяване и е оптимизирана за заявки за големи набори от данни.
Какво е многомерна схема?
Многомерна схема е специално проектиран да моделира системи за съхранение на данни. Схемите са предназначени да отговорят на уникалните нужди на много големи бази данни, предназначени за аналитична цел (OLAP).
Типове схема на склад за данни:
Следват 3 основни типа многоизмерни схеми, всяка от които има своите уникални предимства.
- Звездна схема
- Схема на снежинка
- Схема на галактиката
Пример за моделиране на данни със звездна схема
В следния пример за звездна схема таблицата с фактите е в центъра, която съдържа ключове за всяка таблица с измерения като Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID и други атрибути като продадени единици и приходи.
Таблици с факти
Таблица с факти в звездна схема съдържа факти и е свързана с измерения. Таблицата с факти има два типа колони:
- Колона, която включва факти
- Външен ключ към таблицата с размери
Като цяло първичният ключ на таблица с факти е съставен ключ, който се състои от всички външни ключове, съставляващи таблицата.
Таблиците с факти могат да съдържат факти на ниво подробности или обобщени факти. Таблиците с факти, които включват обобщени факти, често се наричат обобщени таблици. Таблиците с факти обикновено съдържат факти, които са обобщени до някакво ниво.
Таблици с размери
Измерението е архитектура, която категоризира данните в йерархия. Измерение без йерархии и нива се нарича плоско измерение или списък. Първичният ключ на всяка таблица с измерения е част от съставния първичен ключ на таблицата с фактите. Атрибутът на измерение е описателен, текстов атрибут, който помага да се опише стойност на измерение. Таблиците с факти обикновено са по-големи от таблиците с размери.
Характеристики на звездната схема
- Всяко измерение в звездна схема е представено с единствената едномерна таблица.
- Таблицата с размери трябва да съдържа набор от атрибути.
- Таблицата с измерения се свързва с таблицата с факти с помощта на външен ключ
- Размерната таблица не е свързана една с друга
- Таблицата с факти ще съдържа ключ и мярка
- Схемата Star е лесна за разбиране и осигурява оптимално използване на диска.
- Таблиците с размери не са нормализирани. Например в горната фигура Country_ID няма справочна таблица за държава, както би имал OLTP дизайн.
- Схемата се поддържа широко от BI Tools
Предимства на Star Schema
- Звездовидните схеми имат по-ясна логика на свързване в сравнение с други схеми за извличане на данни от силно нормализирани транзакционни схеми.
- За разлика от силно нормализираните транзакционни схеми, звездообразната схема опростява общата логика на бизнес отчитане, като например отчитане и период върху период.
- Звездообразните схеми се използват широко от OLAP системите за ефективно проектиране на кубове. Звездна схема може да се използва като източник без проектиране на кубична структура в повечето основни OLAP системи.
- Чрез активиране на специфични схеми за изпълнение, които могат да бъдат приложени към заявки, софтуерът за обработка на заявки в Star Schema може да предложи по-добри планове за изпълнение.
Недостатък на звездната схема
- Тъй като схемата е силно денормализирана, целостта на данните не се прилага добре.
- Не е гъвкав по отношение на аналитичните нужди.
- Звездовидните схеми не укрепват връзките много към много в рамките на бизнес субекти.