Weka - 协会


据观察,购买啤酒的人同时也购买了尿布。也就是说,一起购买啤酒和尿布存在关联。虽然这看起来不太令人信服,但这条关联规则是从超市的庞大数据库中挖掘出来的。同样,花生酱和面包之间也可能存在关联。

找到这样的关联对于超市来说至关重要,因为他们会将尿布放在啤酒旁边,以便顾客可以轻松找到这两种物品,从而增加超市的销售额。

Apriori算法就是机器学习中的一种算法,它可以找出可能的关联并创建关联规则。WEKA 提供了 Apriori 算法的实现。您可以在计算这些规则时定义最小支持度和可接受的置信度。您将对WEKA 安装中提供的超市数据应用Apriori算法。

加载数据中

在 WEKA 资源管理器中,打开“预处理”选项卡,单击“打开文件...”按钮,然后从安装文件夹中选择Supermarket.arff数据库。数据加载后,您将看到以下屏幕 -

加载数据中

该数据库包含 4627 个实例和 217 个属性。您可以很容易地理解检测如此大量的属性之间的关联是多么困难。幸运的是,这个任务在 Apriori 算法的帮助下是自动化的。

助理

单击“关联”选项卡,然后单击“选择”按钮。选择Apriori关联,如屏幕截图所示 -

关联选项卡

要设置 Apriori 算法的参数,请单击其名称,将弹出一个窗口,如下所示,允许您设置参数 -

先验算法

设置完参数后,单击“开始”按钮。一段时间后,您将看到结果,如下面的屏幕截图所示 -

启动参数

在底部,您将找到检测到的最佳关联规则。这将有助于超市将产品存放在适当的货架上。