Apache Flink - 大数据平台


过去 10 年数据的进步是巨大的;这产生了“大数据”这个术语。数据没有固定大小,可以称之为大数据;传统系统(RDBMS)无法处理的任何数据都是大数据。该大数据可以是结构化、半结构化或非结构化格式。最初,数据有三个维度:数量、速度、多样性。现在的维度已经超出了三个V。我们现在添加了其他 V——准确性、有效性、漏洞、价值、可变性等。

大数据导致了多种有助于数据存储和处理的工具和框架的出现。有一些流行的大数据框架,如 Hadoop、Spark、Hive、Pig、Storm 和 Zookeeper。它还提供了在医疗保健、金融、零售、电子商务等多个领域创建下一代产品的机会。

无论是跨国公司还是初创企业,每个人都在利用大数据来存储和处理数据并做出更明智的决策。