Splunk - 概述


Splunk 是一款处理机器数据和其他形式的大数据并从中获取洞察力的软件。这些机器数据是由运行网络服务器的CPU、物联网设备、移动应用程序的日志等生成的。没有必要向最终用户提供这些数据,并且没有任何商业意义。然而,它们对于了解、监控和优化机器的性能极其重要。

Splunk 可以读取这种非结构化、半结构化或很少结构化的数据。读取数据后,它允许对这些数据进行搜索、标记、创建报告和仪表板。随着大数据的出现,Splunk 现在能够从各种来源获取大数据,这些数据可能是机器数据,也可能不是机器数据,并对大数据进行分析。

因此,Splunk从一个简单的日志分析工具,经过漫长的发展,成为非结构化机器数据和各种形式的大数据的通用分析工具。

产品类别

Splunk 提供三种不同的产品类别,如下 -

  • Splunk Enterprise - 由拥有大型 IT 基础设施和 IT 驱动业务的公司使用。它有助于收集和分析来自网站、应用程序、设备和传感器等的数据。

  • Splunk Cloud - 它是云托管平台,具有与企业版相同的功能。它可以从 Splunk 本身或通过 AWS 云平台使用。

  • Splunk Light - 它允许从一个地方实时搜索、报告和警报所有日志数据。与其他两个版本相比,它的功能和特性有限。

Splunk 功能

在本节中,我们将讨论企业版的重要特征 -

数据摄取

Splunk 可以摄取各种数据格式(例如 JSON、XML)以及非结构化机器数据(例如 Web 和应用程序日志)。非结构化数据可以根据用户需要建模为数据结构。

数据索引

摄取的数据由 Splunk 建立索引,以便在不同条件下更快地搜索和查询。

资料搜寻

Splunk 中的搜索涉及使用索引数据来创建指标、预测未来趋势和识别数据中的模式。

使用警报

当在分析的数据中发现某些特定条件时,Splunk 警报可用于触发电子邮件或 RSS 源。

仪表板

Splunk Dashboards 可以以图表、报告和数据透视表等形式显示搜索结果。

数据模型

索引数据可以被建模为基于专门领域知识的一个或多个数据集。这使得分析业务案例的最终用户可以更轻松地导航,而无需了解 Splunk 使用的搜索处理语言的技术细节。