データ ウェアハウス モデリングにおけるスター スキーマとは何ですか?

スタースキーマとは何ですか?

スタースキーマ データ ウェアハウスでは、星の中心に XNUMX つのファクト テーブルと、関連する多数のディメンション テーブルを持つことができるスキーマがあります。 その構造が星に似ているため、スター スキーマとして知られています。 スター スキーマ データ モデルは、最も単純なタイプのデータ ウェアハウス スキーマです。 これはスター結合スキーマとしても知られており、大規模なデータ セットのクエリ用に最適化されています。

多次元スキーマとは何ですか?

多次元スキーマ は、特にデータ ウェアハウス システムをモデル化するように設計されています。 スキーマは、分析目的で設計された非常に大規模なデータベースの固有のニーズに対応するように設計されています (OLAP).

データ ウェアハウス スキーマの種類:

以下は、それぞれ独自の利点を持つ 3 つの主な多次元スキーマの種類です。

スタースキーマデータモデリングの例

次のスター スキーマの例では、ファクト テーブルが中央にあり、Dealer_ID、Model ID、Date_ID、Product_ID、Branch_ID などのすべてのディメンション テーブルと、販売数や収益などのその他の属性へのキーが含まれています。

スタースキーマデータモデリング
スタースキーマ図の例

ファクトテーブル

スター スキーマのファクト テーブルにはファクトが含まれており、ディメンションに接続されています。 ファクト テーブルには XNUMX 種類の列があります。

  • 事実を含むコラム
  • ディメンション テーブルの外部キー

一般に、ファクト テーブルの主キーは、テーブルを構成するすべての外部キーで構成される複合キーです。

ファクト テーブルには、詳細レベルのファクトまたは集計されたファクトを含めることができます。 集約されたファクトを含むファクト テーブルは、多くの場合、サマリー テーブルと呼ばれます。 ファクト テーブルには通常、ある程度のレベルに集約されたファクトが含まれます。

寸法表

ディメンションは、データを階層に分類するアーキテクチャです。階層とレベルのないディメンションは、フラット ディメンションまたはリストと呼ばれます。各ディメンション テーブルの主キーは、ファクト テーブルの複合主キーの一部です。ディメンション属性は、ディメンション値の説明に役立つ説明的なテキスト属性です。ファクト テーブルは通常、ディメンション テーブルよりも大きくなります。

スタースキーマの特徴

  • スター スキーマのすべての次元は、唯一の XNUMX 次元テーブルで表されます。
  • ディメンション テーブルには一連の属性が含まれている必要があります。
  • ディメンション テーブルは外部キーを使用してファクト テーブルに結合されます
  • 寸法テーブルは互いに結合されていません
  • ファクト テーブルにはキーとメジャーが含まれます
  • スター スキーマは理解しやすく、最適なディスク使用量を提供します。
  • ディメンション テーブルは正規化されていません。 たとえば、上の図では、 Country_ID には、OLTP 設計にあるような Country ルックアップ テーブルがありません。
  • スキーマは BI ツールで広くサポートされています

スタースキーマの利点

  • スター スキーマは、高度に正規化されたトランザクション スキーマからデータをフェッチするための他のスキーマと比較して、より単純な結合ロジックを備えています。
  • 高度に正規化されたトランザクション スキーマとは対照的に、スター スキーマは、レポートや前期比などの一般的なビジネス レポート ロジックを簡素化します。
  • スター スキーマは、キューブを効率的に設計するために OLAP システムで広く使用されています。 スター スキーマは、ほとんどの主要な OLAP システムでキューブ構造を設計せずにソースとして使用できます。
  • クエリに適用できる特定のパフォーマンス スキームを有効にすることで、スター スキーマのクエリ プロセッサ ソフトウェアはより適切な実行プランを提供できます。

スタースキーマの欠点

  • スキーマは高度に非正規化されているため、データの整合性は十分に確保されません。
  • 分析ニーズの点で柔軟性がありません。
  • スター スキーマは、ビジネス エンティティ内の多対多の関係を強化しません。