Что такое звездообразная схема в моделировании хранилища данных?

Что такое звездообразная схема?

Схема звезды в хранилище данных — это схема, в которой центр звезды может иметь одну таблицу фактов и несколько связанных таблиц измерений. Она известна как звездная схема, поскольку ее структура напоминает звезду. Модель данных Star Schema — это самый простой тип схемы хранилища данных. Она также известна как схема Star Join и оптимизирована для запроса больших наборов данных.

Что такое многомерная схема?

Многомерная схема специально разработан для моделирования систем хранилищ данных. Схемы предназначены для удовлетворения уникальных потребностей очень больших баз данных, предназначенных для аналитических целей (OLAP).

Типы схем хранилища данных:

Ниже приведены три основных типа многомерных схем, каждый из которых имеет свои уникальные преимущества.

Пример моделирования данных звездообразной схемы

В следующем примере звездообразной схемы таблица фактов находится в центре и содержит ключи для каждой таблицы измерений, таких как Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID и другие атрибуты, такие как проданные единицы и доход.

Моделирование данных звездообразной схемы
Пример диаграммы звездообразной схемы

Таблицы фактов

Таблица фактов в звездообразной схеме содержит факты и связана с измерениями. Таблица фактов имеет два типа столбцов:

  • Столбец, содержащий факты
  • Внешний ключ к таблице измерений

Как правило, первичный ключ таблицы фактов представляет собой составной ключ, состоящий из всех внешних ключей, составляющих таблицу.

Таблицы фактов могут содержать факты на уровне детализации или агрегированные факты. Таблицы фактов, включающие агрегированные факты, часто называют сводными таблицами. Таблицы фактов обычно содержат факты, агрегированные до определенного уровня.

Таблицы размеров

Измерение — это архитектура, которая классифицирует данные в иерархии. Измерение без иерархий и уровней называется плоским измерением или списком. Первичный ключ каждой таблицы измерений является частью составного первичного ключа таблицы фактов. Атрибут измерения — это описательный текстовый атрибут, помогающий описать значение измерения. Таблицы фактов обычно больше таблиц измерений.

Характеристики звездообразной схемы

  • Каждое измерение в звездообразной схеме представлено единственной одномерной таблицей.
  • Таблица измерений должна содержать набор атрибутов.
  • Таблица измерений присоединяется к таблице фактов с помощью внешнего ключа.
  • Таблицы измерений не соединены друг с другом
  • Таблица фактов будет содержать ключ и меру.
  • Схема «Звезда» проста для понимания и обеспечивает оптимальное использование диска.
  • Таблицы размерностей не нормализованы. Например, на приведенном выше рисунке Country_ID не имеет таблицы поиска страны, как это было бы в проекте OLTP.
  • Схема широко поддерживается BI Tools.

Преимущества звездообразной схемы

  • Звездообразные схемы имеют более простую логику соединения по сравнению с другими схемами для получения данных из высоконормализованных транзакционных схем.
  • В отличие от высоконормализованных транзакционных схем, звездообразная схема упрощает общую логику бизнес-отчетности, такую ​​как отчетность и отчетность за период.
  • Звездообразные схемы широко используются системами OLAP для эффективного проектирования кубов. Звездообразную схему можно использовать в качестве источника без проектирования структуры куба в большинстве основных систем OLAP.
  • Включив определенные схемы производительности, которые можно применять к запросам, программное обеспечение обработчика запросов в Star Schema может предложить лучшие планы выполнения.

Недостаток звездообразной схемы

  • Поскольку схема сильно денормализована, целостность данных не обеспечивается должным образом.
  • Негибкий с точки зрения аналитических потребностей.
  • Звездообразные схемы не укрепляют отношения «многие ко многим» внутри бизнес-сущностей.