SAP HANA - SQL 数据分析


SQL 数据分析任务用于理解和分析来自多个数据源的数据。它用于在将数据加载到数据仓库之前删除不正确、不完整的数据并防止数据质量问题。

以下是 SQL 数据分析任务的好处 -

  • 它有助于更​​有效地分析源数据。

  • 它有助于更​​好地理解源数据。

  • 它在将数据加载到数据仓库之前删除不正确、不完整的数据并提高数据质量。

  • 它与提取、转换和加载任务一起使用。

数据分析任务检查有助于了解数据源并识别数据中必须修复的问题的配置文件。

您可以使用 Integration ServicesIntegration Services 包内的数据分析任务来分析存储在 SQL Server 中的数据并识别潜在的数据质量问题。

注意- 数据分析任务仅适用于 SQL Server 数据源,不支持任何其他基于文件或第三方数据源。

访问要求

要运行包含数据分析任务的包,用户帐户必须具有对 tempdb 数据库的读/写权限和 CREATE TABLE 权限。

数据分析器查看器

数据配置文件查看器用于查看分析器输出。数据配置文件查看器还支持向下钻取功能,以帮助您了解配置文件输出中识别的数据质量问题。此钻取功能将实时查询发送到原始数据源。

数据分析任务设置和审查

设置数据分析任务

它涉及执行包含数据分析任务的包来计算配置文件。该任务将 XML 格式的输出保存到文件或包变量中。

查看配置文件

要查看数据配置文件,请将输出发送到文件,然后使用数据配置文件查看器。该查看器是一个独立的实用程序,以摘要和详细格式显示配置文件输出,并具有可选的向下钻取功能。

数据分析 - 配置选项

数据分析任务有这些方便的配置选项 -

通配符列

配置配置文件请求时,任务接受“*”通配符来代替列名称。这简化了配置,并且更容易发现不熟悉的数据的特征。当任务运行时,任务会分析具有适当数据类型的每一列。

快速简介

您可以选择“快速配置文件”来快速配置任务。快速配置文件使用所有默认配置文件和设置来配置表或视图。

数据分析任务可以计算八种不同的数据配置文件。其中五个配置文件可以检查单个列,其余三个分析多个列或列之间的关系。

数据分析 - 任务输出

数据分析任务将选定的配置文件输出为 XML 格式,其结构类似于 DataProfile.xsd 架构。

您可以保存架构的本地副本,并在 Microsoft Visual Studio 或其他架构编辑器、XML 编辑器或文本编辑器(例如记事本)中查看架构的本地副本。