Apache Pig - 评估函数


Apache Pig 提供各种内置函数,即eval、load、store、math、string、bagtuple函数。

评估函数

下面给出的是Apache Pig 提供的eval函数列表。

序列号 功能说明
1 平均值()

计算袋子内数值的平均值。

2 袋到字符串()

将包的元素连接成字符串。连接时,我们可以在这些值之间放置分隔符(可选)。

3 连接()

连接两个或多个相同类型的表达式。

4 数数()

获取包中元素的数量,同时计算包中元组的数量。

5 COUNT_STAR()

它类似于COUNT()函数。它用于获取包中元素的数量。

6 差异()

比较元组中的两个包(字段)。

7 是空的()

检查袋子或地图是否是空的。

8 最大限度()

计算单列包中的列(数值或字符数组)的最高值。

9 最小值()

获取单列包中某一列的最小值(数值或字符数组)。

10 拔取元组()

使用 Pig Latin PluckTuple()函数,我们可以定义一个字符串 Prefix 并过滤关系中以给定前缀开头的列。

11 尺寸()

基于任何 Pig 数据类型计算元素数量。

12 减去()

减去两个袋子。它接受两个包作为输入并返回一个包,其中包含第一个包中不在第二个包中的元组。

13 和()

获取单列包中某一列的数值总和。

14 代币化()

将字符串(包含一组单词)拆分为单个元组并返回一个包含拆分操作输出的包。