星型模式与雪花模式——它们之间的区别

星型模式和雪花模式之间的主要区别

  • 星型模式是最简单的数据仓库模式类型。它的结构类似于星型,因此被称为星型模式。
  • 雪花模式与星型模式的比较:雪花模式是星型模式的扩展,增加了额外的维度。之所以称为雪花模式,是因为其图表类似于雪花。
  • 在星型模式中,只有单连接定义事实表和任何维度表之间的关系。
  • 星型模式包含一个事实表,周围是维度表。
  • 雪花模式被维度表包围,维度表又被维度表包围
  • 雪花模式需要许多连接来获取数据。
  • 比较星型模式和雪花型模式,星型模式具有简单的数据库设计,而雪花型模式具有非常复杂的数据库设计。

什么是星型模式?

星图 在数据仓库中,星型结构的中心可以有一个事实表和多个关联的维度表。由于其结构类似于星型,因此被称为星型结构。星型结构数据模型是最简单的数据仓库结构类型。它也被称为星型连接结构,并且针对查询大型数据集进行了优化。

在下面的星型模式示例中,事实表位于中心,其中包含每个维度表的键,如 Dealer_ID、Model ID、Date_ID、Product_ID、Branch_ID 以及其他属性,如销售单位和收入。

星型模式图示例
星型模式图示例

什么是雪花模式?

雪花模式 数据仓库是多维数据库中表的逻辑排列,以便 ER 图 形状类似雪花。雪花模式是星型模式的扩展,它添加了额外的维度。维度表经过规范化,将数据拆分到其他表中。

在下面的雪花模式示例中,国家/地区被进一步规范化为单独的表。

雪花模式示例

雪花模式示例

星型模式与雪花模式之间的区别

以下是雪花模式与星型模式之间的主要区别:

星图 雪花模式
维度的层次结构存储在维度表中。 层次结构被划分为单独的表。
它包含一个被维度表包围的事实表。 一个事实表被维度表包围,而维度表又被维度表包围
在星型模式中,只有单连接才能创建事实表和任何维度表之间的关系。 雪花模式需要许多连接来获取数据。
简单的数据库设计。 非常复杂的数据库设计。
非规范化的数据结构和查询也运行得更快。 规范化的数据结构。
高水平的数据冗余 极低级别的数据冗余
单维表包含聚合数据。 数据分成不同的维度表。
立方体处理速度更快。 由于复杂的连接,多维数据集处理可能会很慢。
使用星型连接查询优化提供性能更高的查询。
表可能与多个维度相连。
雪花模式由集中式事实表表示,不太可能与多个维度相关。

每日Guru99新闻简报

通过立即获取最新、最重要的人工智能新闻报道来开始您的一天。