Python 中的逻辑回归 - 案例研究
假设一家银行要求您开发一个机器学习应用程序,该应用程序将帮助他们识别将向他们开立定期存款(某些银行也称为定期存款)的潜在客户。银行定期通过电话或网络形式进行调查,收集潜在客户的信息。这项调查本质上是一般性的,是针对大量受众进行的,其中许多人可能对与这家银行本身打交道不感兴趣。在其余的人中,只有少数人可能有兴趣开立定期存款。其他人可能对银行提供的其他设施感兴趣。因此,调查不一定是为了识别开设 TD 的客户。您的任务是从银行将与您分享的海量调查数据中找出所有最有可能开通 TD 的客户。
幸运的是,对于那些渴望开发机器学习模型的人来说,这样一种数据是公开可用的。该数据是由加州大学欧文分校的一些学生在外部资助下准备的。该数据库作为UCI 机器学习存储库的一部分提供,并被世界各地的学生、教育工作者和研究人员广泛使用。数据可以从这里下载。
在接下来的章节中,让我们使用相同的数据执行应用程序开发。