什么是 OLAP?多维数据集,分析 Opera数据仓库中的
什么是 OLAP?
在线分析处理 (OLAP) 是一类允许用户同时分析来自多个数据库系统的信息的软件。它是一种使分析师能够从不同角度提取和查看业务数据的技术。
分析师经常需要对数据进行分组、聚合和连接。数据挖掘中的这些 OLAP 操作非常耗费资源。使用 OLAP 可以预先计算和预先聚合数据,从而加快分析速度。
OLAP 数据库分为一个或多个立方体。立方体的设计方式使得创建和查看报告变得容易。OLAP 代表联机分析处理。
OLAP 多维数据集

OLAP 概念的核心是 OLAP 多维数据集。OLAP 多维数据集是一种优化的数据结构,可实现非常快速的 数据分析.
OLAP 多维数据集由按维度分类的称为度量的数字事实组成。OLAP 多维数据集也称为 超立方体.
通常,数据操作和分析是使用简单的电子表格进行的,其中数据值以行和列格式排列。这对于二维数据来说是理想的。然而,OLAP 包含多维数据,数据通常来自不同的、不相关的来源。使用电子表格并不是最佳选择。多维数据集可以以逻辑和有序的方式存储和分析多维数据。
它是如何起作用的?
数据仓库将从多种数据源和格式(如文本文件、Excel 表、多媒体文件等)提取信息。
提取的数据经过清理和转换。数据被加载到 OLAP 服务器(或 OLAP 多维数据集)中,其中的信息已预先计算以供进一步分析。
OLAP 的基本分析操作
四种类型的分析 OLAP 操作是:
- 卷起
- 向下钻取
- 切片和骰子
- 枢轴(旋转)
1)卷起:
Roll-up 也称为“合并”或“聚合”。Roll-up 操作可以通过两种方式执行
- 减小尺寸
- 概念层次结构向上攀升。概念层次结构是一种根据事物的顺序或级别对其进行分组的系统。
考虑下图
- 在这个例子中,城市新泽西和洛斯安格尔斯被归入美国国家
- 新泽西和洛杉矶的销量分别为440和1560。汇总后为2000
- 在这个聚合过程中,数据的位置层次从城市向上移动到国家。
- 在汇总过程中,至少需要删除一个或多个维度。在此示例中,删除了城市维度。
2)深入研究
在钻取过程中,数据被分割成更小的部分。这与汇总过程相反。它可以通过以下方式完成
- 向下移动概念层次
- 增加维度
考虑上面的图表
- 季度 Q1 细分为 XNUMX 月、XNUMX 月和 XNUMX 月。相应的销售额也是记录。
- 在此示例中,添加了维度月份。
3)切片:
这里选择一个维度,并创建一个新的子多维数据集。
下图解释了切片操作是如何执行的:
- 使用 Q1 作为过滤器对时间维度进行切片。
- 一个新的立方体就创建完成了。
骰子:
此操作类似于切片。与切块不同的是,您选择 2 个或更多维度,从而创建子立方体。
4)枢轴
在 Pivot 中,您可以旋转数据轴来提供数据的替代呈现方式。
在以下示例中,透视基于项目类型。
OLAP 系统的类型
OLAP 层次结构
OLAP 类型 | 说明 |
---|---|
关系型OLAP(ROLAP): | ROLAP 是一种扩展的 RDBMS,它带有多维数据映射来执行标准关系操作。 |
多维OLAP(MOLAP) | MOLAP实现多维数据的操作。 |
混合在线分析处理(HOLAP) | 在 HOLAP 方法中,汇总总数存储在多维数据库中,而详细数据存储在关系数据库中。这既提供了 ROLAP 模型的数据效率,又提供了 MOLAP 模型的性能。 |
桌面 OLAP (DOLAP) | 在桌面 OLAP 中,用户从本地或桌面的数据库下载一部分数据并进行分析。
与其他 OLAP 系统相比,DOLAP 提供的功能很少,因此部署起来相对较便宜。 |
Web OLAP(WOLAP) | Web OLAP 是一种可通过 Web 浏览器访问的 OLAP 系统。WOLAP 是一种三层架构。它由三个组件组成:客户端、中间件和数据库服务器。 |
移动 OLAP: | 移动 OLAP 可帮助用户使用移动设备访问和分析 OLAP 数据 |
空间 OLAP: | SOLAP 的创建是为了方便管理地理信息系统 (GIS) 中的空间和非空间数据 |
罗拉普
ROLAP 处理关系数据库中的数据。事实和维度表存储为关系表。它还允许对数据进行多维分析,是增长最快的 OLAP。
ROLAP模型的优点:
- 数据效率高。 它提供了很高的数据效率,因为查询性能和访问语言特别针对多维数据分析进行了优化。
- 可扩展性。 这种类型的 OLAP 系统提供了管理大量数据的可扩展性,甚至在数据稳步增加时也能如此。
ROLAP模型的缺点:
- 对更高资源的需求: ROLAP对人力、软件和硬件资源的利用率要求较高。
- 总体数据限制。 ROLAP 工具的使用 SQL 对所有聚合数据的计算。但是,对于处理计算没有设定限制。
- 查询性能缓慢。 与 MOLAP 相比,此模型的查询性能较慢
莫拉普
MOLAP 使用基于数组的多维存储引擎来显示数据的多维视图。基本上,它们使用 OLAP 多维数据集。
详细了解 MOLAP 点击这里
混合 OLAP
混合 OLAP 是 ROLAP 和 MOLAP 的混合体。它既具有 MOLAP 的快速计算能力,又具有 ROLAP 的更高可扩展性。HOLAP 使用两个数据库。
- 聚合或计算的数据存储在多维 OLAP 多维数据集中
- 详细信息存储在关系数据库中。
混合 OLAP 的优点:
- 这种OLAP有助于节省磁盘空间,并且保持紧凑,有助于避免与访问速度和便利性相关的问题。
- 混合 HOLAP 使用多维数据集技术,可以为所有类型的数据提供更快的性能。
- ROLAP 是即时更新的,HOLAP 用户可以访问这些实时即时更新的数据。MOLAP 可以清理和转换数据,从而提高数据的相关性。这带来了两全其美的效果。
混合 OLAP 的缺点:
- 复杂程度更高: HOLAP 系统的主要缺点是它同时支持 ROLAP 和 MOLAP 工具和应用程序。因此,它非常复杂。
- 潜在的重叠: 重叠的可能性更高,特别是在功能方面。
OLAP 的优点
- OLAP 是一个适用于所有类型业务的平台,包括规划、预算、报告和分析。
- OLAP 多维数据集中的信息和计算是一致的。这是一个至关重要的好处。
- 快速创建和分析“假设”场景
- 轻松在 OLAP 数据库中搜索广泛或特定的术语。
- OLAP 为业务建模工具、数据挖掘工具、性能报告工具提供了构建模块。
- 允许用户通过各种维度、度量和过滤器对立方体数据进行切片和切块。
- 它有利于分析时间序列。
- 使用 OLAP 可以轻松找到一些聚类和异常值。
- 它是一个强大的可视化在线分析过程系统,提供更快的响应时间
OLAP 的缺点
- OLAP 需要将数据组织成星型或雪花型模式。这些模式的实现和管理都很复杂
- 单个 OLAP 多维数据集中不能有大量维度
- OLAP 系统无法访问事务数据。
- OLAP 多维数据集中的任何修改都需要对多维数据集进行完全更新。这是一个耗时的过程
总结
- OLAP 中 数据仓库 是一种使分析师能够从不同角度提取和查看业务数据的技术。
- OLAP 概念的核心是 OLAP 多维数据集。
- 各种业务应用程序和其他数据操作都需要使用OLAP Cube。
- 数据仓库中的分析 OLAP 操作主要有五种类型:1)汇总 2)下钻 3)切片 4)切块 5)透视
- 广泛使用的三种 OLAP 系统是 MOLAP、ROLAP 和混合 OLAP。
- 桌面 OLAP、Web OLAP 和移动 OLAP 是其他一些类型的 OLAP 系统。