DW - 概述


数据仓库被称为中央存储库,用于存储来自一个或多个异构数据源的数据。数据仓库用于报告和分析信息并存储历史和当前数据。DW系统中的数据用于分析报告,随后供业务分析师、销售经理或知识工作者用于决策。

DW系统中的数据是从销售、营销、HR、SCM等运营事务系统加载的。在加载到DW系统进行信息处理之前,它可能会经过运营数据存储或其他转换。

数据仓库 - 主要功能

DW 系统的主要特点是 -

  • 它是中央数据存储库,其中存储来自一个或多个异构数据源的数据。

  • DW 系统存储当前数据和历史数据。通常DW系统存储5-10年的历史数据。

  • DW 系统始终与可操作的事务系统分开。

  • DW 系统中的数据用于不同类型的分析报告,范围从季度到年度比较。

需要 DW 系统

假设您有一家住房贷款机构,其中的数据来自多个应用程序,例如营销、销售、ERP、HRM、MM 等。这些数据在数据仓库中提取、转换和加载。

例如,如果您必须比较产品的季度/年度销售额,则不能使用操作事务数据库,因为这会挂起事务系统。因此,数据仓库就是用于此目的。

DW和ODB的区别

数据仓库和操作数据库(事务数据库)之间的区别如下:

  • 事务系统是为已知的工作负载和事务而设计的,例如更新用户记录、搜索记录等。但是,数据仓库事务更加复杂,并且呈现通用形式的数据。

  • 事务系统包含组织的当前数据,数据仓库通常包含历史数据。

  • 事务系统支持多个事务的并行处理。需要并发控制和恢复机制来维护数据库的一致性。

  • 操作数据库查询允许读取和修改操作(删除和更新),而 OLAP 查询仅需要存储数据的只读访问(Select 语句)。

数据仓库架构

数据仓库涉及数据清理、数据集成和数据整合。

数据仓库架构

数据仓库具有 3 层架构 -数据源层、集成层表示层。上图显示了数据仓库系统的常见架构。