Apache Flink - Flink、Spark、Hadoop

这是一个综合表格，显示了三种最流行的大数据框架之间的比较：Apache Flink、Apache Spark 和 Apache Hadoop。

	阿帕奇Hadoop	阿帕奇火花	阿帕奇弗林克
原产地年份	2005年	2009年	2009年
发源地	MapReduce (谷歌) Hadoop (雅虎)	加州大学伯克利分校	柏林工业大学
数据处理引擎	批	批	溪流
处理速度	比 Spark 和 Flink 慢	比 Hadoop 快 100 倍	比火花还快
编程语言	Java、C、C++、Ruby、Groovy、Perl、Python	Java、Scala、Python 和 R	Java 和 Scala
编程模型	映射减少	弹性分布式数据集 (RDD)	循环数据流
数据传输	批	批	流水线和批量
内存管理	基于磁盘	JVM 管理	主动管理
潜伏	低的	中等的	低的
吞吐量	中等的	高的	高的
优化	手动的	手动的	自动的
应用程序编程接口	低级	高水平	高水平
流媒体支持	不适用	火花流	Flink 流式传输
SQL支持	蜂巢、黑斑羚	SparkSQL	表 API 和 SQL
图表支持	不适用	图X	杰利
机器学习支持	不适用	SparkML	FlinkML