统计 - 卡方分布


具有自由度的卡方分布(卡方或 ${X^2}$ - 分布),k 是 k 个独立标准正态随机变量的平方和的分布。它是统计学中使用最广泛的概率分布之一。它是伽玛分布的一个特例。

卡方分布

卡方分布被统计学家广泛用于计算以下内容:

  • 使用样本标准差估计正态分布的总体标准差的置信区间。

  • 检查多个定性变量的两个分类标准的独立性。

  • 检查分类变量之间的关系。

  • 研究基本分布呈正态分布的样本方差。

  • 测试预期频率和观察到的频率之间的差异的偏差。

  • 进行卡方检验(拟合优度检验)。

概率密度函数

卡方分布的概率密度函数如下:

公式

${ f(x; k ) = } $ $ \begin {cases} \frac{x^{ \frac{k}{2} - 1} e^{-\frac{x}{2}}}{2 ^{\frac{k}{2}}\Gamma(\frac{k}{2})}, & \text{如果 $x \gt 0 $} \\[7pt] 0, & \text{如果 $ x \le 0 $} \end{案例} $

其中 -

  • ${\Gamma(\frac{k}{2})}$ = 具有整数参数 k 的封闭形式值的 Gamma 函数。

  • ${x}$ = 随机变量。

  • ${k}$ = 整数参数。

累积分布函数

卡方分布的累积分布函数如下:

公式

${ F(x; k) = \frac{\gamma(\frac{x}{2}, \frac{k}{2})}{\Gamma(\frac{k}{2})}\\ [7pt] = P (\frac{x}{2}, \frac{k}{2}) }$

其中 -

  • ${\gamma(s,t)}$ = 较低的不完全伽玛函数。

  • ${P(s,t)}$ = 正则化伽马函数。

  • ${x}$ = 随机变量。

  • ${k}$ = 整数参数。