SAP BODS - 调整技术


ETL 作业的性能取决于您使用数据服务软件的系统、移动次数等。

还有各种其他因素会影响 ETL 任务的性能。他们是 -

  • 源数据库- 应将源数据库设置为快速执行Select语句。这可以通过增加数据库 I/O 的大小、增加共享缓冲区的大小以缓存更多数据以及不允许小表并行等来完成。

  • 源操作系统- 源操作系统应配置为从磁盘快速读取数据。将预读协议设置为 64KB。

  • 目标数据库- 目标数据库必须配置为快速执行插入更新。这可以通过 -

    • 禁用存档日志记录。
    • 禁用所有表的重做日志记录。
    • 最大化共享缓冲区的大小。
  • 目标操作系统- 必须配置目标操作系统才能将数据快速写入磁盘。您可以打开异步 I/O 以使输入/输出操作尽可能快。

  • 网络- 网络带宽应足以将数据从源传输到目标系统。

  • BODS 存储库数据库- 为了提高 BODS 作业的性能,可以执行以下操作 -

    • 监控采样率- 如果您在 ETL 作业中处理大量数据集,请将采样率监控为更高的值,以减少对日志文件的 I/O 调用数量,从而提高性能。

    • 如果在作业服务器上配置了病毒扫描,您还可以从病毒扫描中排除数据服务日志,因为这可能会导致性能下降

  • 作业服务器操作系统- 在数据服务中,作业中的一个数据流启动一个“al_engine”进程,该进程启动四个线程。为了获得最大性能,请考虑一种设计,每个 CPU 一次运行一个“al_engine”进程。作业服务器操作系统应以所有线程分布到所有可用 CPU 的方式进行调整。