- Keras 深度学习教程
- 使用 Keras 进行深度学习 - 主页
- 使用 Keras 进行深度学习 - 简介
- 深度学习
- 设置项目
- 导入库
- 创建深度学习模型
- 编译模型
- 准备数据
- 训练模型
- 评估模型性能
- 根据测试数据进行预测
- 节约模型
- 加载预测模型
- 结论
- 使用 Keras 资源进行深度学习
- 使用 Keras 进行深度学习 - 快速指南
- 使用 Keras 进行深度学习 - 有用的资源
- 使用 Keras 进行深度学习 - 讨论
使用 Keras 进行深度学习 - 深度学习
正如引言中所说,深度学习是用大量数据训练人工神经网络的过程。经过训练后,网络将能够为我们提供对未见数据的预测。在进一步解释什么是深度学习之前,让我们快速浏览一下训练神经网络时使用的一些术语。
神经网络
人工神经网络的想法源自我们大脑中的神经网络。典型的神经网络由三层组成——输入层、输出层和隐藏层,如下图所示。
这也称为浅层神经网络,因为它仅包含一个隐藏层。您可以在上述架构中添加更多隐藏层以创建更复杂的架构。
深度网络
下图显示了一个由四个隐藏层、一个输入层和一个输出层组成的深度网络。
随着网络中隐藏层数量的增加,其训练在所需资源和完全训练网络所需的时间方面变得更加复杂。
网络培训
定义网络架构后,您可以训练它进行某些类型的预测。训练网络是为网络中每个链接找到适当权重的过程。在训练期间,数据通过各个隐藏层从输入层流向输出层。由于数据总是从输入到输出沿一个方向移动,因此我们将该网络称为前馈网络,并将数据传播称为前向传播。
激活函数
在每一层,我们计算输入的加权和并将其输入激活函数。激活函数给网络带来了非线性。它只是一些离散化输出的数学函数。一些最常用的激活函数是 sigmoid、双曲、正切 (tanh)、ReLU 和 Softmax。
反向传播
反向传播是一种监督学习算法。在反向传播中,误差从输出向后传播到输入层。给定一个误差函数,我们计算误差函数相对于每个连接分配的权重的梯度。梯度的计算通过网络向后进行。先计算最后一层权重的梯度,最后计算第一层权重的梯度。
在每一层,梯度的部分计算在前一层的梯度计算中被重用。这称为梯度下降。
在这个基于项目的教程中,您将定义一个前馈深度神经网络,并使用反向传播和梯度下降技术对其进行训练。幸运的是,Keras 为我们提供了所有高级 API,用于定义网络架构并使用梯度下降对其进行训练。接下来,您将学习如何在 Keras 中执行此操作。
手写数字识别系统
在此小型项目中,您将应用前面描述的技术。您将创建一个深度学习神经网络,该网络将接受训练以识别手写数字。在任何机器学习项目中,第一个挑战是收集数据。特别是对于深度学习网络,您需要大量数据。幸运的是,对于我们正在尝试解决的问题,有人已经创建了一个用于训练的数据集。这称为 mnist,它作为 Keras 库的一部分提供。该数据集由多个 28x28 像素的手写数字图像组成。您将在此数据集的主要部分上训练您的模型,其余数据将用于验证您训练的模型。
项目介绍
mnist数据集由 70000 张手写数字图像组成。这里复制了一些示例图像供您参考
每个图像的大小为 28 x 28 像素,总共有 768 个不同灰度级别的像素。大多数像素趋向于黑色阴影,而只有少数像素趋于白色。我们将把这些像素的分布放在一个数组或一个向量中。例如,数字4和5的典型图像的像素分布如下图所示。
每个图像的大小为 28 x 28 像素,总共有 768 个不同灰度级别的像素。大多数像素趋向于黑色阴影,而只有少数像素趋于白色。我们将把这些像素的分布放在一个数组或一个向量中。例如,数字4和5的典型图像的像素分布如下图所示。
显然,您可以看到像素的分布(尤其是那些趋于白色调的像素)不同,这可以区分它们代表的数字。我们会将这个 784 像素的分布提供给我们的网络作为其输入。网络的输出将包含 10 个类别,代表 0 到 9 之间的数字。
我们的网络将由 4 层组成——一个输入层、一个输出层和两个隐藏层。每个隐藏层将包含 512 个节点。每一层都完全连接到下一层。当我们训练网络时,我们将计算每个连接的权重。我们通过应用前面讨论的反向传播和梯度下降来训练网络。