Apache Pig 教程

Apache Pig 教程


Apache Pig 是 MapReduce 的抽象。它是一个工具/平台,用于分析将其表示为数据流的较大数据集。Pig一般与Hadoop一起使用;我们可以使用 Pig 执行 Hadoop 中的所有数据操作操作。

观众

本教程面向所有从事 Hadoop 工作、希望执行 MapReduce 操作而无需在 Java 中键入复杂代码的专业人士。

先决条件

为了充分利用本教程,您应该充分了解 Hadoop 和 HDFS 命令的基础知识。如果你擅长 SQL,这肯定会有帮助。