Scikit Learn - 使用朴素贝叶斯进行分类


朴素贝叶斯方法是一组基于应用贝叶斯定理的监督学习算法,该算法强烈假设所有预测变量彼​​此独立,即类中某个特征的存在独立于同一类中任何其他特征的存在班级。这是朴素的假设,这就是这些方法被称为朴素贝叶斯方法的原因。

贝叶斯定理陈述了以下关系,以便找到类别的后验概率,即标签和一些观察到的特征的概率,$P\left(\begin{array}{c} Y\arrowvert features\end{array}\right )$。

$$P\left(\begin{array}{c} Y\arrowvert 特征\end{array}\right)=\left(\frac{P\lgroup Y\rgroup P\left(\begin{array}{c } 特征\arrowvert Y\end{array}\right)}{P\left(\begin{array}}{c} 特征\end{array}\right)}\right)$$

这里,$P\left(\begin{array}{c} Y\arrowvert features\end{array}\right)$是类的后验概率。

$P\left(\begin{array}{c} Y\end{array}\right)$ 是类别的先验概率。

$P\left(\begin{array}{c} features\arrowvert Y\end{array}\right)$ 是似然,即给定类别的预测器的概率。

$P\left(\begin{array}{c} features\end{array}\right)$ 是预测器的先验概率。

Scikit-learn 提供不同的朴素贝叶斯分类器模型,即高斯、多项式、补集和伯努利。所有这些的不同之处主要在于它们对分布的假设