SAP HANA - 数据仓库中的架构


模式是数据仓库中表的逻辑描述。模式是通过连接多个事实表和维度表来创建的,以满足某些业务逻辑。

数据库使用关系模型来存储数据。然而,数据仓库使用连接维度和事实表的模式来满足业务逻辑。数据仓库中使用三种类型的模式 -

  • 星型模式
  • Snowflake模式
  • 银河图式

星型模式

在星型模式中,每个维度都连接到一个事实表。每个维度仅由一个维度表示,并且不进一步标准化。

维度表包含用于分析数据的属性集。

示例- 在下面给出的示例中,我们有一个事实表 FactSales,它具有所有 Dim 表的主键以及用于分析的units_sold 和dollars_ sell 度量。

我们有四个维度表 - DimTime、DimItem、DimBranch、DimLocation

星型模式

每个维度表都连接到事实表,因为事实表具有用于连接两个表的每个维度表的主键。

事实表中的事实/度量与维度表中的属性一起用于分析目的。

Snowflake模式

在Snowflake模式中,一些维度表被进一步规范化,并且维度表连接到单个事实表。规范化用于组织数据库的属性和表,以最大限度地减少数据冗余。

规范化涉及将表分解为冗余较少的较小表,而不丢失任何信息,并将较小的表连接到维度表。

Snowflake模式

在上面的示例中,DimItem 和 DimLocation Dimension 表已标准化,而不会丢失任何信息。这称为Snowflake模式,其中维度表进一步规范化为较小的表。

银河图式

在Galaxy Schema中,有多个事实表和维度表。每个事实表存储几个维度表的主键和用于分析的度量/事实。

银河图式

在上面的示例中,有两个事实表 FactSales、FactShipping 以及连接到事实表的多个维度表。每个事实表都包含连接 Dim 表的主键和用于执行分析的度量/事实。