星型模式与雪花模式——它们之间的区别
星型模式和雪花模式之间的主要区别
- 星型模式是最简单的数据仓库模式类型。它的结构类似于星型,因此被称为星型模式。
- 雪花模式与星型模式的比较:雪花模式是星型模式的扩展,增加了额外的维度。之所以称为雪花模式,是因为其图表类似于雪花。
- 在星型模式中,只有单连接定义事实表和任何维度表之间的关系。
- 星型模式包含一个事实表,周围是维度表。
- 雪花模式被维度表包围,维度表又被维度表包围
- 雪花模式需要许多连接来获取数据。
- 比较星型模式和雪花型模式,星型模式具有简单的数据库设计,而雪花型模式具有非常复杂的数据库设计。
什么是星型模式?
星图 在数据仓库中,星型结构的中心可以有一个事实表和多个关联的维度表。由于其结构类似于星型,因此被称为星型结构。星型结构数据模型是最简单的数据仓库结构类型。它也被称为星型连接结构,并且针对查询大型数据集进行了优化。
在下面的星型模式示例中,事实表位于中心,其中包含每个维度表的键,如 Dealer_ID、Model ID、Date_ID、Product_ID、Branch_ID 以及其他属性,如销售单位和收入。
什么是雪花模式?
雪花模式 数据仓库是多维数据库中表的逻辑排列,以便 ER 图 形状类似雪花。雪花模式是星型模式的扩展,它添加了额外的维度。维度表经过规范化,将数据拆分到其他表中。
在下面的雪花模式示例中,国家/地区被进一步规范化为单独的表。
星型模式与雪花模式之间的区别
以下是雪花模式与星型模式之间的主要区别:
星图 | 雪花模式 |
---|---|
维度的层次结构存储在维度表中。 | 层次结构被划分为单独的表。 |
它包含一个被维度表包围的事实表。 | 一个事实表被维度表包围,而维度表又被维度表包围 |
在星型模式中,只有单连接才能创建事实表和任何维度表之间的关系。 | 雪花模式需要许多连接来获取数据。 |
简单的数据库设计。 | 非常复杂的数据库设计。 |
非规范化的数据结构和查询也运行得更快。 | 规范化的数据结构。 |
高水平的数据冗余 | 极低级别的数据冗余 |
单维表包含聚合数据。 | 数据分成不同的维度表。 |
立方体处理速度更快。 | 由于复杂的连接,多维数据集处理可能会很慢。 |
使用星型连接查询优化提供性能更高的查询。 表可能与多个维度相连。 |
雪花模式由集中式事实表表示,不太可能与多个维度相关。 |