统计 - 功率计算器


每当进行假设检验时,我们都需要确定该检验是高质量的。检查检验功效或敏感性的一种方法是计算当备择假设正确时检验能够正确拒绝原假设的概率。换句话说,检验的功效是当备择假设为真时接受备择假设的概率,其中备择假设在统计检验中检测到效果。

${Power = \P(\reject\H_0 | H_1\is\true) } $

检验的功效还通过检查 I 类错误 ($ { \alpha } $) 和 II 类错误 ($ { \beta } $) 的概率来测试,其中 I 类错误表示对有效原假设的错误拒绝,而II 类错误表示错误保留无效的原假设。发生 I 类或 II 类错误的可能性越小,统计检验的能力就越大。

例子

对学生进行了一项调查,以检查他们的智商水平。假设随机抽取 16 名学生进行测试。调查员使用 0.05 的显着性水平和 16 的标准差,对学生 IQ 为 100 的原假设与学生 IQ 不是 100 的备择假设进行检验。假设检验的功效是多少,如果真实总体平均数是116?

解决方案:

由于原假设下的检验统计量分布遵循学生 t 分布。这里 n 很大,我们可以用正态分布来近似 t 分布。由于犯第一类错误($ { \alpha } $)的概率为0.05,当检验统计量$ { T \ge 1.645 } $时,我们可以拒绝原假设${H_0}$。让我们通过以下公式使用检验统计量来计算样本均值。

$ {T = \frac{ \bar X - \mu}{ \frac{\sigma}{\sqrt \mu}} \\[7pt] \意味着 \bar X = \mu + T(\frac{\sigma} {\sqrt \mu}) \\[7pt] \, = 100 + 1.645(\frac{16}{\sqrt {16}})\\[7pt] \, = 106.58 } $

让我们通过以下公式计算统计检验的功效。

$ {幂 = P(\bar X \ge 106.58 \ 其中\ \mu = 116 ) \\[7pt] \, = P( T \ge -2.36) \\[7pt] \, = 1- P( T \ lt -2.36 ) \\[7pt] \, = 1 - 0.0091 \\[7pt] \, = 0.9909 } $

因此,我们有 99.09% 的机会拒绝原假设 ${H_0: \mu = 100 } $,而支持备择假设 $ {H_1: \mu \gt 100 } $,其中未知总体平均值为 $ {\mu = 116 } $。