SAP BODS - 查询转换


这是数据服务中最常见的转换,您可以执行以下功能 -

  • 从来源过滤数据
  • 连接多个来源的数据
  • 对数据执行函数和转换
  • 从输入模式到输出模式的列映射
  • 分配主键
  • 将新的列、模式和函数添加到输出模式中

由于查询转换是最常用的转换,因此工具选项板中为此查询提供了快捷方式。

要添加查询转换,请按照以下步骤操作 -

步骤 1 - 单击查询转换工具选项板。单击数据流工作区上的任意位置。将其连接到输入和输出。

连接输入输出

双击查询转换图标时,它将打开用于执行查询操作的查询编辑器。

查询转换中存在以下区域 -

  • 输入模式
  • 输出模式
  • 参数

输入和输出模式包含列、嵌套模式和函数。Schema In 和 Schema Out 显示当前在转换中选择的模式。

输入输出模式

要更改输出架构,请选择列表中的架构,右键单击并选择设为当前。

更改输出架构

数据质量转型

数据质量转换无法直接连接到包含嵌套表的上游转换。要连接这些转换,您应该在嵌套表转换和数据质量转换之间添加查询转换或 XML 管道转换。

如何使用数据质量转换?

步骤 1 - 转到对象库 → 变换选项卡

库转换选项卡

步骤 2 - 展开数据质量转换并添加要添加到数据流的转换或转换配置。

转换配置

步骤 3 - 绘制数据流连接。双击变换的名称,打开变换编辑器。在输入架构中,选择要映射的输入字段。

注意- 要使用关联变换,您可以将用户定义的字段添加到输入选项卡。

文本数据处理转换

文本数据处理转换允许您从大量文本中提取特定信息。您可以搜索特定于组织的事实和实体,例如客户、产品和财务事实。

此转换还检查实体之间的关系并允许提取。使用文本数据处理提取的数据可用于商业智能、报告、查询和分析。

实体提取变换

在数据服务中,文本数据处理是在实体提取的帮助下完成的,实体提取从非结构化数据中提取实体和事实。

这涉及分析和处理大量文本数据、搜索实体、将它们分配给适当的类型并以标准格式呈现元数据。

实体提取转换可以从任何文本、HTML、XML 或某些二进制格式(例如 PDF)内容中提取信息并生成结构化输出。您可以根据您的工作流程以多种方式使用输出。您可以将其用作另一个转换的输入或写入多个输出源,例如数据库表或平面文件。输出以 UTF-16 编码生成。

实体提取变换可用于以下场景 -

  • 从大量的文本中寻找特定的信息。

  • 从非结构化文本中查找结构化信息与现有信息建立新的联系。

  • 产品质量报告和分析。

TDP 和数据清理之间的差异

文本数据处理用于从非结构化文本数据中查找相关信息。然而,数据清理用于标准化和清理结构化数据。

参数 文本数据处理 数据清理
输入类型 非结构化数据 结构化数据
输入尺寸 超过5KB 小于5KB
输入范围 具有多种变体的广泛领域 变化有限
潜在用途 来自非结构化数据的潜在有意义的信息 存储到存储库的数据质量
输出 以实体、类型等形式创建注解,输入不改变 创建标准化字段,输入发生变化