机器学习 - 类别
机器学习大致分为以下几类:
机器学习从左到右演化,如上图所示。
最初,研究人员从监督学习开始。这就是前面讨论的房价预测的情况。
接下来是无监督学习,即机器在没有任何监督的情况下自行学习。
科学家进一步发现,当机器按预期方式完成工作时给予奖励可能是个好主意,于是强化学习应运而生。
很快,现在可用的数据变得如此巨大,以至于迄今为止开发的传统技术无法分析大数据并为我们提供预测。
因此,深度学习应运而生,在二进制计算机中创建的人工神经网络 (ANN) 中模拟人脑。
该机器现在利用当今可用的高计算能力和巨大的内存资源进行自主学习。
现在观察到深度学习已经解决了许多以前无法解决的问题。
现在,通过奖励深度学习网络作为奖励,该技术得到了进一步发展,最终出现了深度强化学习。
现在让我们更详细地研究每个类别。
监督学习
监督学习类似于训练孩子走路。你会握住孩子的手,教他如何把脚向前迈,自己走路示范等等,直到孩子学会自己走路。
回归
类似地,在监督学习的情况下,您向计算机提供具体的已知示例。您可以说,对于给定的特征值 x1,输出是 y1,对于 x2,输出是 y2,对于 x3,输出是 y3,依此类推。根据这些数据,您可以让计算机计算出 x 和 y 之间的经验关系。
一旦机器用足够数量的数据点以这种方式进行训练,现在您可以要求机器预测给定 X 的 Y。假设您知道给定 X 的 Y 的实际值,您将能够推断出机器的预测是否正确。
因此,您将使用已知的测试数据来测试机器是否已经学习。一旦您对机器能够以所需的准确度(例如 80 到 90%)进行预测感到满意,您就可以停止进一步训练机器。
现在,您可以安全地使用机器对未知数据点进行预测,或者要求机器针对给定 X 预测 Y,而您不知道 Y 的实际值。此训练属于我们讨论的回归早些时候。
分类
您还可以使用机器学习技术来解决分类问题。在分类问题中,您将具有相似性质的对象分类为一组。例如,假设有 100 名学生,您可能希望根据身高将他们分为三组 - 矮组、中组和长组。测量每个学生的身高,您将把他们分成适当的组。
现在,当一名新学生进来时,您将通过测量他的身高将他分为适当的组。通过遵循回归训练的原则,您将训练机器根据学生的特征(身高)对学生进行分类。当机器学习如何形成小组时,它将能够对任何未知的新学生正确分类。在将开发的模型投入生产之前,您将再次使用测试数据来验证机器是否已学习您的分类技术。
监督学习是人工智能真正开始其旅程的地方。该技术在多个案例中得到了成功应用。您在机器上进行手写识别时使用过该模型。已经开发了几种用于监督学习的算法。您将在接下来的章节中了解它们。
无监督学习
在无监督学习中,我们不向机器指定目标变量,而是询问机器“关于 X,你能告诉我什么?”。更具体地说,我们可能会问这样的问题:给定一个巨大的数据集 X,“我们可以从 X 中得出哪五个最好的组?” 或“X 中哪些特征最常同时出现?”。要找到此类问题的答案,您可以理解,机器推断策略所需的数据点数量将非常大。在监督学习的情况下,甚至可以使用大约数千个数据点来训练机器。然而,在无监督学习的情况下,学习中合理接受的数据点数量从几百万开始。如今,数据通常非常丰富。理想情况下,数据需要整理。然而,社交网络中不断流动的数据量,在大多数情况下数据管理是一项不可能完成的任务。
下图显示了由无监督机器学习确定的黄点和红点之间的边界。您可以清楚地看到,机器能够以相当好的精度确定每个黑点的类别。
来源:
https://chrisjmccormick.files.wordpress.com/2013/08/approx_decision_boun dary.png
无监督学习在许多现代人工智能应用中取得了巨大成功,例如人脸检测、物体检测等。
强化学习
考虑训练一只宠物狗,我们训练我们的宠物给我们带来一个球。我们把球扔到一定的距离,然后让狗把球捡回来给我们。每当狗做对了,我们就会奖励它。慢慢地,狗知道正确地完成工作会给它带来奖励,然后狗以后每次都会开始以正确的方式完成工作。确切地说,这个概念应用于“强化”类型的学习。该技术最初是为玩游戏的机器而开发的。机器有一个算法来分析游戏每个阶段所有可能的动作。机器可以随机选择其中一项动作。如果动作正确,机器就会受到奖励,否则可能会受到惩罚。慢慢地,机器将开始区分正确和错误的动作,经过几次迭代后,机器将学会以更好的精度解决游戏难题。随着机器玩的游戏越来越多,赢得游戏的准确性将会提高。
整个过程如下图所示 -
这种机器学习技术与监督学习的不同之处在于,您不需要提供标记的输入/输出对。重点是在探索新解决方案与利用学到的解决方案之间找到平衡。
深度学习
深度学习是基于人工神经网络(ANN),更具体地说是卷积神经网络(CNN)的模型。深度学习中使用了多种架构,例如深度神经网络、深度置信网络、循环神经网络和卷积神经网络。
这些网络已成功应用于解决计算机视觉、语音识别、自然语言处理、生物信息学、药物设计、医学图像分析和游戏等问题。还有其他几个领域也积极应用深度学习。深度学习需要巨大的处理能力和海量数据,而这些现在通常很容易获得。
我们将在接下来的章节中更详细地讨论深度学习。
深度强化学习
深度强化学习(DRL)结合了深度学习和强化学习的技术。Q-learning 等强化学习算法现在与深度学习相结合,创建了强大的 DRL 模型。该技术在机器人、视频游戏、金融和医疗保健领域取得了巨大成功。许多以前无法解决的问题现在可以通过创建 DRL 模型来解决。该领域正在进行大量研究,业界也非常积极地进行研究。
到目前为止,您已经对各种机器学习模型进行了简要介绍,现在让我们更深入地探讨这些模型下可用的各种算法。