什么是 OLAP?多维数据集,分析 Opera数据仓库中的

什么是 OLAP?

在线分析处理 (OLAP) 是一类允许用户同时分析来自多个数据库系统的信息的软件。它是一种使分析师能够从不同角度提取和查看业务数据的技术。

分析师经常需要对数据进行分组、聚合和连接。数据挖掘中的这些 OLAP 操作非常耗费资源。使用 OLAP 可以预先计算和预先聚合数据,从而加快分析速度。

OLAP 数据库分为一个或多个立方体。立方体的设计方式使得创建和查看报告变得容易。OLAP 代表联机分析处理。

OLAP 多维数据集

联机分析处理立方体
联机分析处理立方体

OLAP 概念的核心是 OLAP 多维数据集。OLAP 多维数据集是一种优化的数据结构,可实现非常快速的 数据分析.

OLAP 多维数据集由按维度分类的称为度量的数字事实组成。OLAP 多维数据集也称为 超立方体.

通常,数据操作和分析是使用简单的电子表格进行的,其中数据值以行和列格式排列。这对于二维数据来说是理想的。然而,OLAP 包含多维数据,数据通常来自不同的、不相关的来源。使用电子表格并不是最佳选择。多维数据集可以以逻辑和有序的方式存储和分析多维数据。

它是如何起作用的?

数据仓库将从多种数据源和格式(如文本文件、Excel 表、多媒体文件等)提取信息。

提取的数据经过清理和转换。数据被加载到 OLAP 服务器(或 OLAP 多维数据集)中,其中的信息已预先计算以供进一步分析。

OLAP 的基本分析操作

四种类型的分析 OLAP 操作是:

  1. 卷起
  2. 向下钻取
  3. 切片和骰子
  4. 枢轴(旋转)

1)卷起:

Roll-up 也称为“合并”或“聚合”。Roll-up 操作可以通过两种方式执行

  1. 减小尺寸
  2. 概念层次结构向上攀升。概念层次结构是一种根据事物的顺序或级别对其进行分组的系统。

考虑下图

OLAP 中的汇总操作
OLAP 中的汇总操作
  • 在这个例子中,城市新泽西和洛斯安格尔斯被归入美国国家
  • 新泽西和洛杉矶的销量分别为440和1560。汇总后为2000
  • 在这个聚合过程中,数据的位置层次从城市向上移动到国家。
  • 在汇总过程中,至少需要删除一个或多个维度。在此示例中,删除了城市维度。

2)深入研究

在钻取过程中,数据被分割成更小的部分。这与汇总过程相反。它可以通过以下方式完成

  • 向下移动概念层次
  • 增加维度
OLAP 中的下钻操作
OLAP 中的下钻操作

考虑上面的图表

  • 季度 Q1 细分为 XNUMX 月、XNUMX 月和 XNUMX 月。相应的销售额也是记录。
  • 在此示例中,添加了维度月份。

3)切片:

这里选择一个维度,并创建一个新的子多维数据集。

下图解释了切片操作是如何执行的:

OLAP 中的切片操作
OLAP 中的切片操作
  • 使用 Q1 作为过滤器对时间维度进行切片。
  • 一个新的立方体就创建完成了。

骰子:

此操作类似于切片。与切块不同的是,您选择 2 个或更多维度,从而创建子立方体。

OLAP 中的骰子操作
OLAP 中的骰子操作

4)枢轴

在 Pivot 中,您可以旋转数据轴来提供数据的替代呈现方式。

在以下示例中,透视基于项目类型。

OLAP 中的枢轴操作
OLAP 中的枢轴操作

OLAP 系统的类型

OLAP 层次结构

OLAP 系统的类型
OLAP 系统的类型
OLAP 类型 说明
关系型OLAP(ROLAP): ROLAP 是一种扩展的 RDBMS,它带有多维数据映射来执行标准关系操作。
多维OLAP(MOLAP) MOLAP实现多维数据的操作。
混合在线分析处理(HOLAP) 在 HOLAP 方法中,汇总总数存储在多维数据库中,而详细数据存储在关系数据库中。这既提供了 ROLAP 模型的数据效率,又提供了 MOLAP 模型的性能。
桌面 OLAP (DOLAP) 在桌面 OLAP 中,用户从本地或桌面的数据库下载一部分数据并进行分析。

与其他 OLAP 系统相比,DOLAP 提供的功能很少,因此部署起来相对较便宜。

Web OLAP(WOLAP) Web OLAP 是一种可通过 Web 浏览器访问的 OLAP 系统。WOLAP 是一种三层架构。它由三个组件组成:客户端、中间件和数据库服务器。
移动 OLAP: 移动 OLAP 可帮助用户使用移动设备访问和分析 OLAP 数据
空间 OLAP: SOLAP 的创建是为了方便管理地理信息系统 (GIS) 中的空间和非空间数据

罗拉普

ROLAP 处理关系数据库中的数据。事实和维度表存储为关系表。它还允许对数据进行多维分析,是增长最快的 OLAP。

ROLAP模型的优点:

  • 数据效率高。 它提供了很高的数据效率,因为查询性能和访问语言特别针对多维数据分析进行了优化。
  • 可扩展性。 这种类型的 OLAP 系统提供了管理大量数据的可扩展性,甚至在数据稳步增加时也能如此。

ROLAP模型的缺点:

  • 对更高资源的需求: ROLAP对人力、软件和硬件资源的利用率要求较高。
  • 总体数据限制。 ROLAP 工具的使用 SQL 对所有聚合数据的计算。但是,对于处理计算没有设定限制。
  • 查询性能缓慢。 与 MOLAP 相比,此模型的查询性能较慢

莫拉普

MOLAP 使用基于数组的多维存储引擎来显示数据的多维视图。基本上,它们使用 OLAP 多维数据集。

详细了解 MOLAP 点击这里

混合 OLAP

混合 OLAP 是 ROLAP 和 MOLAP 的混合体。它既具有 MOLAP 的快速计算能力,又具有 ROLAP 的更高可扩展性。HOLAP 使用两个数据库。

  1. 聚合或计算的数据存储在多维 OLAP 多维数据集中
  2. 详细信息存储在关系数据库中。

混合 OLAP 的优点:

  • 这种OLAP有助于节省磁盘空间,并且保持紧凑,有助于避免与访问速度和便利性相关的问题。
  • 混合 HOLAP 使用多维数据集技术,可以为所有类型的数据提供更快的性能。
  • ROLAP 是即时更新的,HOLAP 用户可以访问这些实时即时更新的数据。MOLAP 可以清理和转换数据,从而提高数据的相关性。这带来了两全其美的效果。

混合 OLAP 的缺点:

  • 复杂程度更高: HOLAP 系统的主要缺点是它同时支持 ROLAP 和 MOLAP 工具和应用程序。因此,它非常复杂。
  • 潜在的重叠: 重叠的可能性更高,特别是在功能方面。

OLAP 的优点

  • OLAP 是一个适用于所有类型业务的平台,包括规划、预算、报告和分析。
  • OLAP 多维数据集中的信息和计算是一致的。这是一个至关重要的好处。
  • 快速创建和分析“假设”场景
  • 轻松在 OLAP 数据库中搜索广泛或特定的术语。
  • OLAP 为业务建模工具、数据挖掘工具、性能报告工具提供了构建模块。
  • 允许用户通过各种维度、度量和过滤器对立方体数据进行切片和切块。
  • 它有利于分析时间序列。
  • 使用 OLAP 可以轻松找到一些聚类和异常值。
  • 它是一个强大的可视化在线分析过程系统,提供更快的响应时间

OLAP 的缺点

  • OLAP 需要将数据组织成星型或雪花型模式。这些模式的实现和管理都很复杂
  • 单个 OLAP 多维数据集中不能有大量维度
  • OLAP 系统无法访问事务数据。
  • OLAP 多维数据集中的任何修改都需要对多维数据集进行完全更新。这是一个耗时的过程

总结

  • OLAP 中 数据仓库 是一种使分析师能够从不同角度提取和查看业务数据的技术。
  • OLAP 概念的核心是 OLAP 多维数据集。
  • 各种业务应用程序和其他数据操作都需要使用OLAP Cube。
  • 数据仓库中的分析 OLAP 操作主要有五种类型:1)汇总 2)下钻 3)切片 4)切块 5)透视
  • 广泛使用的三种 OLAP 系统是 MOLAP、ROLAP 和混合 OLAP。
  • 桌面 OLAP、Web OLAP 和移动 OLAP 是其他一些类型的 OLAP 系统。