- 统计教程
- 家
- 调整后的 R 平方
- 方差分析
- 算术平均值
- 算术中位数
- 算术模式
- 算术范围
- 条状图
- 最佳点估计
- 贝塔分布
- 二项分布
- 布莱克-斯科尔斯模型
- 箱线图
- 中心极限定理
- 切比雪夫定理
- 卡方分布
- 卡方表
- 循环排列
- 整群抽样
- 科恩卡帕系数
- 组合
- 与替换组合
- 比较图
- 连续均匀分布
- 连续级数算术平均值
- 连续级数算术中位数
- 连续级数运算模式
- 累积频率
- 变异系数
- 相关系数
- 累计地块
- 累积泊松分布
- 数据采集
- 数据收集 - 问卷设计
- 数据收集-观察
- 数据收集-案例研究方法
- 数据模式
- 十分位数统计
- 离散级数算术平均值
- 离散级数算术中位数
- 离散级数运算模式
- 点图
- 指数分布
- F分布
- F测试台
- 阶乘
- 频率分布
- 伽玛分布
- 几何平均数
- 几何概率分布
- 拟合优度
- 中庸之道
- 甘贝尔分布
- 调和平均值
- 谐波数
- 谐波共振频率
- 直方图
- 超几何分布
- 假设检验
- 个别系列算术平均值
- 个别系列算术中位数
- 个别系列运算模式
- 区间估计
- 逆伽玛分布
- 柯尔莫哥洛夫斯米尔诺夫检验
- 峰度
- 拉普拉斯分布
- 线性回归
- 对数伽玛分布
- 逻辑回归
- 麦克尼马尔测试
- 平均偏差
- 均值差异
- 多项式分布
- 负二项分布
- 正态分布
- 奇数和偶数排列
- 一比例 Z 检验
- 异常值函数
- 排列
- 置换置换
- 饼形图
- 泊松分布
- 合并方差 (r)
- 功率计算器
- 可能性
- 概率加性定理
- 概率倍数定理
- 概率贝叶斯定理
- 概率密度函数
- 过程能力 (Cp) 和过程性能 (Pp)
- 过程西格玛
- 二次回归方程
- 定性数据与定量数据
- 四分位数偏差
- 范围经验法则
- 瑞利分布
- 回归截距置信区间
- 相对标准偏差
- 可靠性系数
- 所需样本量
- 残差分析
- 残差平方和
- 均方根
- 样品策划
- 取样方式
- 散点图
- 香农维纳多样性指数
- 信噪比
- 简单随机抽样
- 偏度
- 标准差
- 标准误差 (SE)
- 标准普通表
- 统计学意义
- 统计公式
- 统计符号
- 茎叶图
- 分层抽样
- 学生 T 检验
- 平方和
- T-分布表
- Ti 83 指数回归
- 转换
- 截尾均值
- I 型和 II 型错误
- 方差
- 维恩图
- 弱大数定律
- Z工作台
- 统计有用资源
- 统计 - 讨论
统计 - 分层抽样
这种研究策略被用作以下情况的一部分:可以轻松地将人口划分为彼此不相同的群体或阶层,但群体内部的组成部分在某些属性方面是相似的,例如学校的学生可以根据性取向、开设的课程、年龄等进行分层。在此过程中,种群首先被划分为多个层,然后从每个层中采集基本的不规则样本。分层考试有两种:比例分层考试和不比例分层考试。
比例分层抽样- 从每个阶层中选择的单位数量与该阶层在人口中所占的比例成比例,例如,一所大学共有 2500 名学生,其中 1500 名学生就读研究生课程,1000 名学生就读研究生课程培训班。如果使用比例分层抽样选择 100 名样本,则样本中的本科生人数将为 60 人,研究生人数为 40 人。因此,这两个阶层在样本中的比例与它们在总体中的比例相同。
当抽样的目的是估计某些特征的总体值并且层内方差没有差异时,此方法最适用。
不成比例的分层抽样——当研究的目的是比较各阶层之间的差异时,就有必要从所有阶层中抽取相等的单位,无论其在人口中所占的比例如何。有时,某些层在某些特征方面比其他层变化更大,在这种情况下,可以从变化更大的层中抽取更多数量的单元。在这两种情况下,抽取的样本都是不成比例的分层样本。
可以使用以下公式来优化分配层大小和层变异性的差异,以确定不同层的样本大小
公式
${n_i = \frac{n.n_i\sigma_i}{n_1\sigma_1+n_2\sigma_2+...+n_k\sigma_k}\ for\ i = 1,2 ...k}$
其中 -
${n_i}$ = i 层的样本量。
${n}$ = 地层的大小。
${\sigma_1}$ = i 层的标准差。
除此之外,可能存在这样的情况:某一层的样本采集成本可能高于其他层。最佳不成比例抽样应以以下方式进行:
${\frac{n_1}{n_1\sigma_1\sqrt{c_1}} = \frac{n_2}{n_2\sigma_1\sqrt{c_2}} = ... = \frac{n_k}{n_k\sigma_k\sqrt{ c_k}}}$
其中${c_1, c_2, ... ,c_k}$指的是k层采样的成本。不同层的样本量可以使用以下公式确定:
${n_i = \frac{\frac{n.n_i\sigma_i}{\sqrt{c_i}}}{\frac{n_1\sigma_1}{\sqrt{c_i}}+\frac{n_2\sigma_2}{\sqrt {c_2}}+...+\frac{n_k\sigma_k}{\sqrt{c_k}}}\ for\ i = 1,2 ...k}$
例子
问题陈述:
一个组织有 5000 名员工,分为三个级别。
A 层:50 名高管,标准差 = 9
B 层:1250 名非体力工人,标准差 = 4
C 层:3700 名体力工人,标准差 = 1
如何在不成比例的基础上抽取 300 名员工的样本并进行最佳分配?
解决方案:
使用不成比例抽样的公式进行优化分配。