Caffe2 - 简介
近几年来,深度学习已成为机器学习的一大趋势。它已成功应用于解决视觉、语音识别和自然语言处理(NLP)领域以前无法解决的问题。深度学习正在许多领域得到应用并显示出其实用性。
Caffe(快速特征嵌入的卷积架构)是伯克利视觉与学习中心(BVLC)开发的深度学习框架。Caffe项目是贾扬清博士在读博士期间创建的。在加州大学伯克利分校。Caffe 提供了一种简单的方法来实验深度学习。它是用 C++ 编写的,并提供Python和Matlab的绑定。
它支持多种不同类型的深度学习架构,例如CNN(卷积神经网络)、LSTM(长短期记忆)和 FC(全连接)。它支持 GPU,因此非常适合涉及深度神经网络的生产环境。它还支持基于CPU的内核库,例如NVIDIA、CUDA深度神经网络库(cuDNN)和Intel数学内核库(Intel MKL)。
2017 年 4 月,美国社交网络服务公司 Facebook 宣布推出 Caffe2,其中包含 RNN(循环神经网络),并于 2018 年 3 月将 Caffe2 合并到 PyTorch。Caffe2 创建者和社区成员创建了解决各种问题的模型。这些模型作为预训练模型向公众开放。Caffe2 帮助创建者使用这些模型并创建自己的网络来对数据集进行预测。
在详细介绍Caffe2之前,让我们先了解一下机器学习和深度学习之间的区别。这对于理解 Caffe2 中如何创建和使用模型是必要的。
机器学习与深度学习
在任何机器学习算法中,无论是传统算法还是深度学习算法,数据集中特征的选择对于获得所需的预测精度都起着极其重要的作用。在传统的机器学习技术中,特征选择主要是通过人类的检查、判断和深层领域知识来完成的。有时,您可能会向一些经过测试的算法寻求帮助以进行特征选择。
传统的机器学习流程如下图所示 -
在深度学习中,特征选择是自动的,是深度学习算法本身的一部分。如下图所示 -
在深度学习算法中,特征工程是自动完成的。一般来说,特征工程非常耗时,并且需要良好的领域专业知识。为了实现自动特征提取,深度学习算法通常需要大量数据,因此如果只有数千、数万个数据点,深度学习技术可能无法给您满意的结果。
对于更大的数据,深度学习算法比传统的机器学习算法产生更好的结果,并且具有较少或没有特征工程的额外优势。