- KNIME Tutorial
- KNIME - Home
- KNIME - Introduction
- KNIME - Installation
- KNIME - First Run
- KNIME - Workbench
- KNIME - Running Your First Workflow
- KNIME - Exploring Workflow
- KNIME - Building Your Own Model
- KNIME - Testing the Model
- KNIME - Summary and Future Work
- KNIME Useful Resources
- KNIME - Quick Guide
- KNIME - Useful Resources
- KNIME - Discussion
KNIME - 探索工作流程
如果您检查工作流程中的节点,您可以看到它包含以下内容 -
文件阅读器,
色彩管理器
分区
决策树学习器
决策树预测器
分数
互动桌
散点图
统计数据
这些可以在大纲视图中轻松看到,如下所示 -
每个节点都提供工作流中的特定功能。我们现在将研究如何配置这些节点以满足所需的功能。请注意,我们将仅讨论在当前探索工作流程的上下文中与我们相关的节点。
文件阅读器
文件读取器节点如下面的屏幕截图所示 -
窗口顶部有一些由工作流创建者提供的描述。它告诉这个节点读取成人数据集。从节点符号下方的描述可以看出,该文件的名称为Adult.csv 。文件读取器有两个输出 - 一个输出到颜色管理器节点,另一个输出到统计节点。
如果右键单击文件管理器,将显示一个弹出菜单,如下所示 -
配置菜单选项允许进行节点配置。执行菜单运行节点。请注意,如果节点已经运行并且处于绿色状态,则此菜单将被禁用。另请注意“编辑注释描述”菜单选项的存在。这允许您编写节点的描述。
现在,选择“配置”菜单选项,它显示包含成人.csv 文件中的数据的屏幕,如屏幕截图所示 -
当执行该节点时,数据将被加载到内存中。整个数据加载程序代码对用户是隐藏的。您现在可以体会到此类节点的有用性 - 无需编码。
我们的下一个节点是颜色管理器。
色彩管理器
选择颜色管理器节点并右键单击它进入其配置。将出现一个颜色设置对话框。从下拉列表中选择收入列。
您的屏幕将如下所示 -
请注意两个约束的存在。如果收入小于 50K,则数据点将变为绿色,如果大于,则变为红色。当我们在本章后面查看散点图时,您将看到数据点映射。
分区
在机器学习中,我们通常将整个可用数据分为两部分。较大的部分用于训练模型,而较小的部分用于测试。有不同的策略用于对数据进行分区。
要定义所需的分区,请右键单击“分区”节点并选择“配置”选项。您将看到以下屏幕 -
在本例中,系统建模者使用了相对(%) 模式,并且数据按 80:20 的比例进行分割。在进行分割时,数据点是随机选取的。这可以确保您的测试数据不会有偏差。在线性采样的情况下,用于测试的剩余 20% 数据可能无法正确代表训练数据,因为它在收集过程中可能完全有偏差。
如果确定数据采集时能够保证随机性,那么可以选择线性抽样。一旦您的数据准备好用于训练模型,请将其提供给下一个节点,即决策树学习器。
决策树学习器
顾名思义,决策树学习器节点使用训练数据并构建模型。查看该节点的配置设置,如下面的屏幕截图所示 -
如您所见,班级是收入。因此,树将根据收入列构建,这就是我们在该模型中试图实现的目标。我们希望将收入高于或低于 5 万的人分开。
该节点成功运行后,您的模型就可以进行测试了。
决策树预测器
决策树预测器节点将开发的模型应用于测试数据集并附加模型预测。
预测器的输出被馈送到两个不同的节点 - Scorer和Scatter Plot。接下来,我们将检查预测的输出。
得分手
该节点生成混淆矩阵。要查看它,请右键单击该节点。您将看到以下弹出菜单 -
单击“视图:混淆矩阵”菜单选项,矩阵将在单独的窗口中弹出,如屏幕截图所示 -
这表明我们开发的模型的准确率为 83.71%。如果您对此不满意,您可以在模型构建中尝试其他参数,特别是您可能想重新访问和清理您的数据。
散点图
要查看数据分布的散点图,请右键单击“散点图”节点,然后选择菜单选项“交互式视图:散点图”。您将看到以下Plotly -
该图以两个不同颜色的点(红色和蓝色)给出了基于 50K 阈值的不同收入群体的分布。这些是我们的颜色管理器节点中设置的颜色。该分布与 x 轴上绘制的年龄相关。您可以通过更改节点的配置来为 x 轴选择不同的功能。
此处显示配置对话框,其中我们选择婚姻状况作为 x 轴的特征。
我们对 KNIME 提供的预定义模型的讨论到此结束。我们建议您自学模型中的另外两个节点(统计和交互表)。
现在让我们继续本教程最重要的部分 - 创建您自己的模型。