数据仓库-OLAP
在线分析处理服务器(OLAP)基于多维数据模型。它允许经理和分析师通过快速、一致和交互式的信息访问来深入了解信息。本章介绍了OLAP的类型、OLAP的操作、OLAP之间的区别以及统计数据库和OLTP。
OLAP 服务器的类型
我们有四种类型的 OLAP 服务器 -
- 关系型OLAP(ROLAP)
- 多维OLAP(MOLAP)
- 混合OLAP(HOLAP)
- 专门的 SQL 服务器
关系型联机分析处理
ROLAP服务器放置在关系型后端服务器和客户端前端工具之间。为了存储和管理仓库数据,ROLAP 使用关系型或扩展关系型 DBMS。
ROLAP 包括以下内容 -
- 聚合导航逻辑的实现。
- 针对每个 DBMS 后端的优化。
- 附加工具和服务。
多维OLAP
MOLAP 使用基于数组的多维存储引擎来实现数据的多维视图。对于多维数据存储,如果数据集稀疏,则存储利用率可能较低。因此,许多MOLAP服务器使用两级数据存储表示来处理密集和稀疏数据集。
混合联机分析处理
混合 OLAP 是 ROLAP 和 MOLAP 的组合。它提供了 ROLAP 更高的可扩展性和 MOLAP 更快的计算。HOLAP 服务器允许存储大量数据的详细信息。聚合单独存储在 MOLAP 存储中。
专门的 SQL 服务器
专用 SQL 服务器为只读环境中星型和Snowflake模式的 SQL 查询提供高级查询语言和查询处理支持。
OLAP操作
由于OLAP服务器基于数据的多维视图,因此我们将讨论多维数据中的OLAP操作。
以下是 OLAP 操作的列表 -
- 卷起
- 深入钻取
- 切片和切丁
- 枢轴(旋转)
卷起
Roll-up 通过以下任一方式对数据立方体执行聚合 -
- 通过爬升维度的概念层次结构
- 通过降维
下图说明了汇总的工作原理。
汇总是通过爬升维度位置的概念层次结构来执行的。
最初的概念层次是“街道<城市<省<国家”。
上滚时,通过将位置层次结构从城市级别提升到国家/地区级别来聚合数据。
数据按城市而不是国家分组。
执行汇总时,数据立方体中的一个或多个维度将被删除。
深入钻取
向下钻取是上卷的逆操作。它通过以下方式之一执行 -
- 通过逐步降低维度的概念层次结构
- 通过引入一个新的维度。
下图说明了向下钻取的工作原理 -
向下钻取是通过逐步降低维度时间的概念层次结构来执行的。
最初,概念层次结构是“日 < 月 < 季度 < 年”。
向下钻取时,时间维度从季度级别下降到月份级别。
执行向下钻取时,会添加数据立方体中的一个或多个维度。
它将数据从不太详细的数据导航到非常详细的数据。
片
切片操作从给定的多维数据集中选择一个特定维度并提供一个新的子多维数据集。考虑下图,它显示了切片的工作原理。
这里使用标准时间=“Q1”对维度“时间”执行切片。
它将通过选择一个或多个维度来形成一个新的子立方体。
骰子
Dice 从给定的立方体中选择两个或多个维度并提供一个新的子立方体。考虑下图,该图显示了骰子的操作。
基于以下选择标准对立方体进行的骰子操作涉及三个维度。
- (地点=“多伦多”或“温哥华”)
- (时间=“Q1”或“Q2”)
- (项目=“移动”或“调制解调器”)
枢
枢转操作也称为旋转。它在视图中旋转数据轴,以提供数据的替代表示。考虑下图,该图显示了枢轴操作。
OLAP 与 OLTP
先生。 | 数据仓库(OLAP) | 运营数据库(OLTP) |
---|---|---|
1 | 涉及信息的历史处理。 | 涉及日常处理。 |
2 | OLAP 系统由高管、经理和分析师等知识工作者使用。 | OLTP 系统由文员、DBA 或数据库专业人员使用。 |
3 | 对于分析业务很有用。 | 对经营业务很有用。 |
4 | 它专注于信息输出。 | 它专注于数据输入。 |
5 | 基于星型模式、Snowflake模式和事实星座模式。 | 基于实体关系模型。 |
6 | 包含历史数据。 | 包含当前数据。 |
7 | 提供汇总和整合的数据。 | 提供原始且高度详细的数据。 |
8 | 提供数据的汇总和多维视图。 | 提供详细且平面的数据关系视图。 |
9 | 用户数量为数百。 | 用户数量以千计。 |
10 | 访问的记录数以百万计。 | 访问的记录数量有数十个。 |
11 | 数据库大小从 100 GB 到 1 TB | 数据库大小从 100 MB 到 1 GB。 |
12 | 高度灵活。 | 提供高性能。 |