Weka - 启动资源管理器
在本章中,让我们研究一下浏览器为处理大数据而提供的各种功能。
当您单击应用程序选择器中的资源管理器按钮时,它将打开以下屏幕 -
在顶部,您将看到此处列出的几个选项卡 -
- 预处理
- 分类
- 簇
- 联系
- 选择属性
- 可视化
在这些选项卡下,有几种预先实现的机器学习算法。现在让我们详细研究一下它们。
预处理选项卡
最初,当您打开资源管理器时,仅启用“预处理”选项卡。机器学习的第一步是预处理数据。因此,在“预处理”选项中,您将选择数据文件,对其进行处理并使其适合应用各种机器学习算法。
分类选项卡
“分类”选项卡为您提供了多种用于数据分类的机器学习算法。举几个例子,您可以应用线性回归、逻辑回归、支持向量机、决策树、随机树、随机森林、NaiveBayes 等算法。该列表非常详尽,并提供有监督和无监督的机器学习算法。
集群选项卡
在Cluster选项卡下,提供了多种聚类算法 - 例如 SimpleKMeans、FilteredClusterer、HierarchicalClusterer 等。
关联选项卡
在Associate选项卡下,您将找到 Apriori、FilteredAssociator 和 FPGrowth。
选择属性选项卡
选择属性允许您基于多种算法(例如 ClassifierSubsetEval、PrincipalComponents 等)进行功能选择。
可视化选项卡
最后,“可视化”选项允许您可视化处理后的数据以进行分析。
正如您所注意到的,WEKA 提供了几种即用型算法来测试和构建机器学习应用程序。要有效地使用 WEKA,您必须充分了解这些算法、它们的工作原理、在什么情况下选择哪一种算法、在处理后的输出中查找什么内容等等。简而言之,您必须在机器学习方面拥有坚实的基础,才能有效地使用 WEKA 构建应用程序。
在接下来的章节中,您将深入研究资源管理器中的每个选项卡。