Apache Spark 教程

Apache Spark 教程


Apache Spark 是一种闪电般的集群计算,专为快速计算而设计。它构建在 Hadoop MapReduce 之上,并扩展了 MapReduce 模型以有效地使用更多类型的计算,其中包括交互式查询和流处理。这是一个简短的教程,解释了 Spark Core 编程的基础知识。

观众

本教程是为有志于使用 Spark 框架学习大数据分析基础知识并成为 Spark 开发人员的专业人士准备的。此外,它对于分析专业人员和 ETL 开发人员也很有用。

先决条件

在开始学习本教程之前,我们假设您之前已经接触过 Scala 编程、数据库概念和任何 Linux 操作系统风格。