数据仓库建模中的星型模式是什么?
什么是星型模式?
星图 在数据仓库中,星型模式是一种模式,其中星型模式的中心可以有一个事实表和多个关联的维度表。由于其结构类似于星型,因此被称为星型模式。星型模式数据模型是最简单的数据仓库模式类型。它也被称为星型连接模式,并且针对查询大型数据集进行了优化。
什么是多维模式?
多维模式 是专门为数据仓库系统建模而设计的。这些模式旨在满足为分析目的而设计的超大型数据库的独特需求(OLAP).
数据仓库模式的类型:
以下是 3 种主要类型的多维模式,每种模式都有其独特的优势。
- 星图
- 雪花模式
- 银河模式
星型模式数据建模示例
在下面的星型模式示例中,事实表位于中心,其中包含每个维度表的键,如 Dealer_ID、Model ID、Date_ID、Product_ID、Branch_ID 以及其他属性,如销售单位和收入。
事实表
星型架构中的事实表包含事实并与维度相连。事实表有两种类型的列:
- 包含事实的列
- 维度表的外键
一般来说,事实表的主键是由组成该表的所有外键组成的复合键。
事实表可以包含详细级事实或聚合事实。包含聚合事实的事实表通常称为汇总表。事实表通常包含已聚合到某种程度的事实。
尺寸表
维度是一种按层次结构对数据进行分类的架构。没有层次结构和级别的维度称为平面维度或列表。每个维度表的主键都是事实表复合主键的一部分。维度属性是一种描述性的文本属性,有助于描述维度值。事实表通常比维度表大。
星型模式的特点
- 星型模式中的每个维度都用唯一的一维表来表示。
- 维度表应该包含属性集。
- 维度表使用外键连接到事实表
- 维度表之间没有相互连接
- 事实表将包含关键和度量
- 星型模式易于理解并提供最佳的磁盘使用率。
- 维度表未规范化。例如,在上图中,Country_ID 没有 OLTP 设计所具有的 Country 查找表。
- 该模式受到 BI 工具的广泛支持
星型模式的优点
- 与其他从高度规范化的事务模式中获取数据的模式相比,星型模式具有更直接的连接逻辑。
- 与高度规范化的交易模式相反,星型模式简化了常见的业务报告逻辑,例如报告和期间报告。
- 星型模式被 OLAP 系统广泛用于高效设计多维数据集。在大多数主流 OLAP 系统中,星型模式可用作源,而无需设计多维数据集结构。
- 通过启用可应用于查询的特定性能方案,星型模式中的查询处理器软件可以提供更好的执行计划。
星型模式的缺点
- 由于模式高度非规范化,数据完整性无法得到很好的保证。
- 在分析需求方面不够灵活。
- 星型模式不会强化业务实体内的多对多关系。