DW - 类型


数据仓库系统有四种类型。

  • 数据库
  • 在线分析处理(OLAP)
  • 在线事务处理 (OLTP)
  • 预测分析(PA)

数据库

数据集市被称为数据仓库系统的最简单形式,通常由组织中的单个功能区域组成,例如销售、财务或营销等。

组织中的数据集市由单个部门创建和管理。由于它属于单个部门,因此该部门通常仅从少数或一种类型的源/应用程序获取数据。该源可以是内部操作系统、数据仓库或外部系统。

在线分析处理

与事务系统相比,OLAP 系统中的事务数量较少。执行的查询本质上很复杂并且涉及数据聚合。

什么是聚合?

我们保存带有聚合数据的表,例如每年(1 行)、每季度(4 行)、每月(12 行)左右,如果有人必须进行年度比较,则只会处理一行。但是,在未聚合的表中,它将比较所有行。

SELECT SUM(salary)
FROM employee
WHERE title = 'Programmer';

OLAP系统中的有效措施

响应时间被认为是OLAP系统中最有效、最关键的衡量标准之一。聚合存储的数据以多维模式(如星型模式)进行维护(当数据被排列成分层组(通常称为维度)并排列成事实和聚合事实时,称为模式)。

与预计延迟接近一天的数据集市相比,OLAP 系统的延迟为几个小时。

在线交易处理

在OLTP系统中,存在大量INSERT、UPDATE、DELETE等短在线事务。

在OLTP系统中,一个有效的衡量标准是短事务的处理时间并且非常少。它控制多访问环境中的数据完整性。对于 OLTP 系统,每秒的事务数衡量有效性。OLTP 数据仓库系统包含当前的详细数据,并在实体模型 (3NF) 的架构中进行维护。

例子

零售店的日常交易系统,每天都会插入、更新和删除客户记录。它提供非常快速的查询处理。OLTP 数据库包含详细的最新数据。用于存储OLTP数据库的Schema就是Entity模型。

OLTP 和 OLAP 之间的区别

下图显示了OLTPOLAP系统之间的主要区别。

OLTP 和 OLAP
  • 索引- OLTP 系统只有很少的索引,而在 OLAP 系统中有很多用于性能优化的索引。

  • 连接- 在 OLTP 系统中,大量连接和数据被标准化。然而,在 OLAP 系统中,连接较少且非规范化。

  • 聚合- 在 OLTP 系统中,不聚合数据,而在 OLAP 数据库中使用更多聚合。

预测分析

预测分析是指通过使用不同的数学函数来发现 DW 系统中存储的数据中的隐藏模式来预测未来的结果。

预测分析系统在用途上与 OLAP 系统不同。它用于关注未来的结果。OALP 系统侧重于分析报告的当前和历史数据处理。