Apache NiFi - 处理器


Apache NiFi 处理器是创建数据流的基本块。每个处理器都有不同的功能,这有助于创建输出流文件。下图所示的数据流使用 GetFile 处理器从一个目录中获取文件,并使用 PutFile 处理器将其存储在另一目录中。

放置文件处理器

获取文件

GetFile进程用于从特定目录中获取特定格式的文件。它还为用户提供了其他选项,以更好地控制获取。我们将在下面的属性部分讨论它。

获取文件

获取文件设置

以下是 GetFile 处理器的不同设置 -

姓名

在“名称”设置中,用户可以根据项目或项目为处理器定义任何名称,这使得名称更有意义。

使能够

用户可以使用此设置启用或禁用处理器。

处罚期限

此设置允许用户在流程文件失败时添加惩罚持续时间。

产量持续时间

该设置用于指定处理器的屈服时间。在此期间,不会再次安排该进程。

公告级别

此设置用于指定该处理器的日志级别。

自动终止关系

其中包含该特定进程的所有可用关系的检查列表。通过选中这些框,用户可以对处理器进行编程,以在该事件上终止流文件,并且不在流中进一步发送它。

自动终止关系

获取文件调度

这些是 GetFile 处理器提供的以下调度选项 -

日程策略

您可以通过选择时间驱动来按时间安排进程,也可以通过选择 CRON 驱动程序选项来安排指定的 CRON 字符串。

并发任务

该选项用于定义该处理器的并发任务调度。

执行

用户可以使用此选项定义是在所有节点中运行处理器还是仅在主节点中运行处理器。

运行时间表

它用于定义时间驱动策略的时间或CRON驱动策略的CRON表达式。

运行时间表

获取文件属性

GetFile 提供了多个属性,如下图所示,从强制属性(如输入目录和文件过滤器)到可选属性(如路径过滤器和最大文件大小)。用户可以使用这些属性来管理文件获取过程。

获取文件属性

获取文件评论

本节用于指定有关处理器的任何信息。

获取文件评论

放置文件

PutFile 处理器用于将文件从数据流存储到特定位置。

放置文件

放置文件设置

PutFile 处理器具有以下设置 -

姓名

在名称设置中,用户可以根据项目或使名称更有意义的名称为处理器定义任何名称。

使能够

用户可以使用此设置启用或禁用处理器。

处罚期限

此设置允许用户在流程文件失败时添加惩罚持续时间。

产量持续时间

该设置用于指定处理器的屈服时间。在此期间,不会再次安排该进程。

公告级别

此设置用于指定该处理器的日志级别。

自动终止关系

此设置具有该特定进程的所有可用关系的检查列表。通过选中这些框,用户可以对处理器进行编程,以在该事件上终止流文件,并且不再在流中进一步发送它。

自动终止

PutFile调度

这些是 PutFile 处理器提供的以下调度选项 -

日程策略

您可以通过选择计时器驱动或通过选择 CRON 驱动程序选项指定的 CRON 字符串来按时间安排进程。还有一种实验策略“事件驱动”,它将在特定事件上触发处理器。

并发任务

该选项用于定义该处理器的并发任务调度。

执行

用户可以使用此选项定义是在所有节点中运行处理器还是仅在主节点中运行处理器。

运行时间表

它用于定义定时器驱动策略的时间或CRON驱动策略的CRON表达式。

Putfile 运行计划

放置文件属性

PutFile 处理器提供诸如 Directory 之类的属性来指定用于文件传输的输出目录,以及其他属性来管理传输,如下图所示。

放置文件属性

PutFile 注释

本节用于指定有关处理器的任何信息。

Putfile 评论