Hadoop教程

Hadoop教程


Hadoop 是一个开源框架,允许使用简单的编程模型在跨计算机集群的分布式环境中存储和处理大数据。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。

本简短教程快速介绍了大数据、MapReduce 算法和 Hadoop 分布式文件系统。

观众

本教程是为有志于学习使用 Hadoop 框架的大数据分析基础知识并成为 Hadoop 开发人员的专业人士准备的。软件专业人员、分析专业人员和 ETL 开发人员是本课程的主要受益者。

先决条件

在开始学习本教程之前,我们假设您之前已经接触过 Core Java、数据库概念和任何 Linux 操作系统风格。