使用 DAX 进行数据建模 - 概念
商业智能 (BI) 在多个领域和组织中变得越来越重要。在竞争日益激烈的世界中,基于历史数据的决策和预测变得至关重要。任何类型的数据分析都可以从各种来源获得大量内部和外部数据。
然而,面临的挑战是根据当前的要求从可用的大数据中提取相关数据,并以适合从数据中预测不同见解的方式存储它。通过使用关键业务术语而获得的数据模型是一种有价值的通信工具。数据模型还需要提供一种根据需要生成报告的快速方法。
BI 系统的数据建模使您能够应对许多数据挑战。
BI 数据模型的先决条件
BI 的数据模型应满足进行数据分析的业务需求。以下是任何数据模型必须满足的最低基础知识 -
数据模型需要针对特定业务
适用于某一业务线的数据模型可能不适用于不同的业务线。因此,数据模型必须根据具体业务、使用的业务术语、数据类型及其关系来开发。它应该基于组织中做出的目标和决策类型。
数据模型需要内置智能
数据模型应包括通过元数据、层次结构和继承的内置智能,以促进高效且有效的商业智能流程。这样,您将能够为不同的用户提供一个通用平台,从而消除重复的过程。
数据模型必须是健壮的
数据模型应该准确地呈现特定于业务的数据。它应该能够实现有效的磁盘和内存存储,以便于快速处理和报告。
数据模型需要可扩展
数据模型应该能够快速有效地适应不断变化的业务场景。可能必须包含新数据或新数据类型。数据刷新可能必须得到有效处理。
BI 数据建模
BI 的数据建模包括以下步骤 -
- 塑造数据
- 加载数据
- 定义表之间的关系
- 定义数据类型
- 创造新的数据洞察
塑造数据
构建数据模型所需的数据可以来自各种来源并且可以采用不同的格式。您需要确定特定数据分析需要每个数据源中的哪一部分数据。这称为塑造数据。
例如,如果您要检索组织中所有员工的数据,则需要确定每个员工的哪些详细信息与当前上下文相关。换句话说,您需要确定需要导入员工表的哪些列。这是因为,数据模型中表的列数越少,表上的计算速度就越快。
加载数据
您需要加载已识别的数据 - 每个表中包含所选列的数据表。
定义表之间的关系
接下来,您需要定义各个表之间的逻辑关系,以便于组合这些表中的数据,即,如果您有一个表 - 产品 - 包含有关产品的数据和一个表 - 销售 - 包含产品的各种销售交易,通过定义两个表之间的关系,您可以汇总销售、产品情况。
定义数据类型
为数据模型中的数据确定适当的数据类型对于计算的准确性至关重要。对于导入的每个表中的每一列,您需要定义数据类型。例如文本数据类型、实数数据类型、整数数据类型等。
创建新的数据洞察
这是 BI 日期建模的关键步骤。所构建的数据模型可能必须与需要了解数据趋势并在很短的时间内做出所需决策的多个人共享。因此,从源数据创建新的数据见解将是有效的,可以避免分析的返工。
新的数据洞察可以采用元数据的形式,特定业务人员可以轻松理解和使用。
数据分析
数据模型准备好后,就可以根据需求对数据进行分析。呈现分析结果也是重要的一步,因为决策将根据报告做出。