- Apache Pig 教程
- Apache Pig - 主页
- Apache Pig介绍
- Apache Pig - 概述
- Apache Pig - 架构
- Apache Pig 环境
- Apache Pig - 安装
- Apache Pig - 执行
- Apache Pig - Grunt Shell
- 猪拉丁语
- 猪拉丁语 - 基础知识
- 加载和存储操作符
- Apache Pig - 读取数据
- Apache Pig - 存储数据
- Pig Latin 内置函数
- Apache Pig - 评估函数
- 加载和存储功能
- Apache Pig - 袋和元组函数
- Apache Pig - 字符串函数
- Apache Pig - 日期时间函数
- Apache Pig - 数学函数
- Apache Pig 有用资源
- Apache Pig - 快速指南
- Apache Pig - 有用的资源
- Apache Pig - 讨论
Apache Pig - 联合运算符
Pig Latin 的UNION运算符用于合并两个关系的内容。要对两个关系执行 UNION 操作,它们的列和域必须相同。
句法
下面给出了UNION运算符的语法。
grunt> Relation_name3 = UNION Relation_name1, Relation_name2;
例子
假设HDFS的/pig_data/目录下有两个文件student_data1.txt和student_data2.txt,如下所示。
学生数据1.txt
001,Rajiv,Reddy,9848022337,Hyderabad 002,siddarth,Battacharya,9848022338,Kolkata 003,Rajesh,Khanna,9848022339,Delhi 004,Preethi,Agarwal,9848022330,Pune 005,Trupthi,Mohanthy,9848022336,Bhuwaneshwar 006,Archana,Mishra,9848022335,Chennai.
学生数据2.txt
7,Komal,Nayak,9848022334,trivendram. 8,Bharathi,Nambiayar,9848022333,Chennai.
我们将这两个文件加载到 Pig 中,关系为Student1和Student2,如下所示。
grunt> student1 = LOAD 'hdfs://localhost:9000/pig_data/student_data1.txt' USING PigStorage(',') as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:chararray); grunt> student2 = LOAD 'hdfs://localhost:9000/pig_data/student_data2.txt' USING PigStorage(',') as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:chararray);
现在让我们使用UNION运算符合并这两个关系的内容,如下所示。
grunt> student = UNION student1, student2;
确认
使用DUMP运算符验证关系Student,如下所示。
grunt> Dump student;
输出
它将显示以下输出,显示关系Student的内容。
(1,Rajiv,Reddy,9848022337,Hyderabad) (2,siddarth,Battacharya,9848022338,Kolkata) (3,Rajesh,Khanna,9848022339,Delhi) (4,Preethi,Agarwal,9848022330,Pune) (5,Trupthi,Mohanthy,9848022336,Bhuwaneshwar) (6,Archana,Mishra,9848022335,Chennai) (7,Komal,Nayak,9848022334,trivendram) (8,Bharathi,Nambiayar,9848022333,Chennai)