HCatalog教程

HCatalog教程


HCatalog 是 Hadoop 的表存储管理工具,可将 Hive Metastore 的表格数据公开给其他 Hadoop 应用程序。它使用户能够使用不同的数据处理工具(Pig、MapReduce)轻松地将数据写入网格。HCatalog 确保用户不必担心数据存储在何处或以何种格式存储。这是一个小教程,仅解释 HCatalog 的基础知识以及如何使用它。

观众

本教程面向有志于使用 Hadoop 框架从事大数据分析职业的专业人士。一般来说,喜欢分析的 ETL 开发人员和专业人士也可以使用本教程来获得良好的效果。

先决条件

在继续学习本教程之前,您需要了解 Core Java、SQL 数据库概念、Hadoop 文件系统以及任何 Linux 操作系统风格的基本知识。