- Apache Flink 教程
- Apache Flink - 主页
- Apache Flink - 大数据平台
- 批处理与实时处理
- Apache Flink - 简介
- Apache Flink - 架构
- Apache Flink - 系统要求
- Apache Flink - 设置/安装
- Apache Flink - API 概念
- Apache Flink - 表 API 和 SQL
- 创建 Flink 应用程序
- Apache Flink - 运行 Flink 程序
- Apache Flink - 库
- Apache Flink - 机器学习
- Apache Flink - 用例
- Apache Flink - Flink、Spark、Hadoop
- Apache Flink - 结论
- Apache Flink 资源
- Apache Flink - 快速指南
- Apache Flink - 有用的资源
- Apache Flink - 讨论
Apache Flink - 大数据平台
过去 10 年数据的进步是巨大的;这产生了“大数据”这个术语。数据没有固定大小,可以称之为大数据;传统系统(RDBMS)无法处理的任何数据都是大数据。该大数据可以是结构化、半结构化或非结构化格式。最初,数据有三个维度:数量、速度、多样性。现在的维度已经超出了三个V。我们现在添加了其他 V——准确性、有效性、漏洞、价值、可变性等。
大数据导致了多种有助于数据存储和处理的工具和框架的出现。有一些流行的大数据框架,如 Hadoop、Spark、Hive、Pig、Storm 和 Zookeeper。它还提供了在医疗保健、金融、零售、电子商务等多个领域创建下一代产品的机会。
无论是跨国公司还是初创企业,每个人都在利用大数据来存储和处理数据并做出更明智的决策。