- Scikit 学习教程
- Scikit Learn - 主页
- Scikit Learn - 简介
- Scikit Learn - 建模过程
- Scikit Learn - 数据表示
- Scikit Learn - 估计器 API
- Scikit Learn - 约定
- Scikit Learn - 线性建模
- Scikit Learn - 扩展线性建模
- 随机梯度下降
- Scikit Learn - 支持向量机
- Scikit Learn - 异常检测
- Scikit Learn - K 最近邻
- Scikit Learn - KNN 学习
- 使用朴素贝叶斯分类
- Scikit Learn - 决策树
- 随机决策树
- Scikit Learn - Boosting 方法
- Scikit Learn - 聚类方法
- 集群性能评估
- 使用 PCA 降维
- Scikit Learn 有用资源
- Scikit Learn - 快速指南
- Scikit Learn - 有用的资源
- Scikit Learn - 讨论
Scikit Learn - 使用朴素贝叶斯进行分类
朴素贝叶斯方法是一组基于应用贝叶斯定理的监督学习算法,该算法强烈假设所有预测变量彼此独立,即类中某个特征的存在独立于同一类中任何其他特征的存在班级。这是朴素的假设,这就是这些方法被称为朴素贝叶斯方法的原因。
贝叶斯定理陈述了以下关系,以便找到类别的后验概率,即标签和一些观察到的特征的概率,$P\left(\begin{array}{c} Y\arrowvert features\end{array}\right )$。
$$P\left(\begin{array}{c} Y\arrowvert 特征\end{array}\right)=\left(\frac{P\lgroup Y\rgroup P\left(\begin{array}{c } 特征\arrowvert Y\end{array}\right)}{P\left(\begin{array}}{c} 特征\end{array}\right)}\right)$$这里,$P\left(\begin{array}{c} Y\arrowvert features\end{array}\right)$是类的后验概率。
$P\left(\begin{array}{c} Y\end{array}\right)$ 是类别的先验概率。
$P\left(\begin{array}{c} features\arrowvert Y\end{array}\right)$ 是似然,即给定类别的预测器的概率。
$P\left(\begin{array}{c} features\end{array}\right)$ 是预测器的先验概率。
Scikit-learn 提供不同的朴素贝叶斯分类器模型,即高斯、多项式、补集和伯努利。所有这些的不同之处主要在于它们对分布的假设