Apache NiFi - 处理器分类


在本章中,我们将讨论 Apache NiFi 中的进程分类。

数据摄取处理器

数据摄取类别下的处理器用于将数据摄取到 NiFi 数据流中。这些主要是apache NiFi中任何数据流的起点。属于这些类别的一些处理器有 GetFile、GetHTTP、GetFTP、GetKAFKA 等。

路由和中介处理器

路由和中介处理器用于根据流文件的属性或内容中的信息将流文件路由到不同的处理器或数据流。这些处理器还负责控制 NiFi 数据流。属于此类别的一些处理器有 RouteOnAttribute、RouteOnContent、ControlRate、RouteText 等。

数据库访问处理器

此数据库访问类别的处理器能够从数据库选择或插入数据或执行和准备其他 SQL 语句。这些处理器主要使用Apache NiFi的数据连接池控制器设置。属于此类别的一些处理器包括 ExecuteSQL、PutSQL、PutDatabaseRecord、ListDatabaseTables 等。

属性提取处理器

属性提取处理器负责提取、分析、更改NiFi数据流中的流文件属性处理。属于此类别的一些处理器包括 UpdateAttribute、EvaluateJSONPath、ExtractText、AttributesToJSON 等。

系统交互处理器

系统交互处理器用于在任何操作系统中运行进程或命令。这些处理器还运行多种语言的脚本以与各种系统交互。属于此类别的一些处理器有 ExecuteScript、ExecuteProcess、ExecuteGroovyScript、ExecuteStreamCommand 等。

数据转换处理器

属于数据转换的处理器能够更改流文件的内容。当用户必须将流文件作为 HTTP 主体发送以调用 HTTP 处理器时,这些可用于完全替换通常使用的流文件的数据。属于此类别的一些处理器有 ReplaceText、JoltTransformJSON 等。

发送数据处理器

发送数据处理器通常是数据流中的最终处理器。这些处理器负责存储数据或将数据发送到目标服务器。成功存储或发送数据后,这些处理器会删除具有成功关系的流文件。属于此类别的处理器有 PutEmail、PutKafka、PutSFTP、PutFile、PutFTP 等。

拆分和聚合处理器

这些处理器用于分割和合并流文件中存在的内容。属于此类别的一些处理器包括 SplitText、SplitJson、SplitXml、MergeContent、SplitContent 等。

HTTP 处理器

这些处理器处理 HTTP 和 HTTPS 调用。属于此类别的一些处理器有 InvokeHTTP、PostHTTP、ListenHTTP 等。

AWS 处理器

AWS 处理器负责与 Amazon Web 服务系统交互。属于此类别的一些处理器包括 GetSQS、PutSNS、PutS3Object、FetchS3Object 等。