- 统计教程
- 家
- 调整后的 R 平方
- 方差分析
- 算术平均值
- 算术中位数
- 算术模式
- 算术范围
- 条状图
- 最佳点估计
- 贝塔分布
- 二项分布
- 布莱克-斯科尔斯模型
- 箱线图
- 中心极限定理
- 切比雪夫定理
- 卡方分布
- 卡方表
- 循环排列
- 整群抽样
- 科恩卡帕系数
- 组合
- 与替换组合
- 比较图
- 连续均匀分布
- 连续级数算术平均值
- 连续级数算术中位数
- 连续级数运算模式
- 累积频率
- 变异系数
- 相关系数
- 累计地块
- 累积泊松分布
- 数据采集
- 数据收集 - 问卷设计
- 数据收集-观察
- 数据收集-案例研究方法
- 数据模式
- 十分位数统计
- 离散级数算术平均值
- 离散级数算术中位数
- 离散级数运算模式
- 点图
- 指数分布
- F分布
- F测试台
- 阶乘
- 频率分布
- 伽玛分布
- 几何平均数
- 几何概率分布
- 拟合优度
- 中庸之道
- 甘贝尔分布
- 调和平均值
- 谐波数
- 谐波共振频率
- 直方图
- 超几何分布
- 假设检验
- 个别系列算术平均值
- 个别系列算术中位数
- 个别系列运算模式
- 区间估计
- 逆伽玛分布
- 柯尔莫哥洛夫斯米尔诺夫检验
- 峰度
- 拉普拉斯分布
- 线性回归
- 对数伽玛分布
- 逻辑回归
- 麦克尼马尔测试
- 平均偏差
- 均值差异
- 多项式分布
- 负二项分布
- 正态分布
- 奇数和偶数排列
- 一比例 Z 检验
- 异常值函数
- 排列
- 置换置换
- 饼形图
- 泊松分布
- 合并方差 (r)
- 功率计算器
- 可能性
- 概率加性定理
- 概率倍数定理
- 概率贝叶斯定理
- 概率密度函数
- 过程能力 (Cp) 和过程性能 (Pp)
- 过程西格玛
- 二次回归方程
- 定性数据与定量数据
- 四分位数偏差
- 范围经验法则
- 瑞利分布
- 回归截距置信区间
- 相对标准偏差
- 可靠性系数
- 所需样本量
- 残差分析
- 残差平方和
- 均方根
- 样品策划
- 取样方式
- 散点图
- 香农维纳多样性指数
- 信噪比
- 简单随机抽样
- 偏度
- 标准差
- 标准误差 (SE)
- 标准普通表
- 统计学意义
- 统计公式
- 统计符号
- 茎叶图
- 分层抽样
- 学生 T 检验
- 平方和
- T-分布表
- Ti 83 指数回归
- 转换
- 截尾均值
- I 型和 II 型错误
- 方差
- 维恩图
- 弱大数定律
- Z工作台
- 统计有用资源
- 统计 - 讨论
统计 - 柯尔莫哥洛夫斯米尔诺夫检验
该检验用于必须在观察到的样本分布与理论分布之间进行比较的情况。
KS 一个样本测试
该检验用作拟合优度检验,当样本量较小时是理想的选择。它将变量的累积分布函数与指定分布进行比较。原假设假设观察到的分布与理论分布之间没有差异,并且检验统计量“D”的值计算如下:
公式
$D = 最大值 |F_o(X)-F_r(X)|$
其中 -
${F_o(X)}$ = n 个观测值的随机样本的观测累积频率分布。
且 ${F_o(X) = \frac{k}{n}}$ = (观测值数量 ≤ X)/(观测值总数)。
${F_r(X)}$ = 理论频率分布。
${D}$ 的临界值是从一个样本测试的 KS 表值中找到的。
接受标准:如果计算值小于临界值,则接受原假设。
拒绝标准:如果计算值大于表值,则拒绝原假设。
例子
问题陈述:
在一项对一所大学各个流系进行的研究中,我们采访了 60 名学生,每个流派的学生人数相同,并注意到他们加入大学戏剧俱乐部的意图。
理学学士 | 学士 | B.Com | 嘛 | 微康 | |
---|---|---|---|---|---|
各班人数 | 5 | 9 | 11 | 16 | 19 |
预计每个班有12名学生加入戏剧社。使用 KS 测试来了解学生班级在加入戏剧俱乐部的意图方面是否存在差异。
解决方案:
${H_o}$:不同流派的学生加入戏剧社的意愿没有差异。
我们开发了观测分布和理论分布的累积频率。
流 | 有兴趣加入的学生人数 | ${F_O(X)}$ | ${F_T(X)}$ | ${|F_O(X)-F_T(X)|}$ | |
---|---|---|---|---|---|
观察到的 (O) | 理论值 (T) | ||||
理学学士 | 5 | 12 | 5/60 | 12/60 | 7/60 |
学士 | 9 | 12 | 14/60 | 24/60 | 10/60 |
B.COM。 | 11 | 12 | 25/60 | 36/60 | 11/60 |
嘛 | 16 | 12 | 41/60 | 48/60 | 7/60 |
M.COM。 | 19 | 12 | 60/40 | 60/60 | 60/60 |
全部的 | n=60 | ||||
检验统计量 ${|D|}$ 计算如下:
5% 显着性水平下的 D 表值由下式给出
由于计算值大于临界值,因此我们拒绝零假设并得出结论:不同流派的学生加入俱乐部的意愿存在差异。
KS 两样本测试
当有两个独立样本而不是一个时,可以使用 KS 二样本检验来检验两个累积分布之间的一致性。原假设表明两个分布之间没有差异。D 统计量的计算方式与 KS 单样本检验相同。
公式
${D = 最大值 |{F_n}_1(X)-{F_n}_2(X)|}$
其中 -
${n_1}$ = 第一个样本的观察结果。
${n_2}$ = 第二个样本的观察结果。
可以看出,当累积分布显示较大的最大偏差 ${|D|}$ 时,表明两个样本分布之间存在差异。
对于 ${n_1 = n_2}$ 且 ≤ 40 的样本,D 的临界值使用两个样本情况的 KS 表。当 ${n_1}$ 和/或 ${n_2}$ > 40 时,应使用两样本检验的大样本 KS 表。如果计算值小于表值,则接受原假设,反之亦然。
因此,当目标人群的特征未知或没有做出任何假设时,使用任何这些非参数检验都有助于研究人员检验其结果的显着性。