统计 - 箱线图


箱线图是基于以下五个数字汇总来显示数据分布的标准化方式。

  1. 最低限度

  2. 第一个四分位数

  3. 中位数

  4. 第三个四分位数

  5. 最大限度

对于均匀分布的数据集,在箱线图中,中心矩形跨越第一四分位数到第三四分位数(或四分位数间距,IQR)。矩形内的线显示中值,框上方和下方的“须线”显示最小值和最大值的位置。此类箱线图显示从最小到最大的完整变化范围、可能的变化范围、IQR 和中位数。

箱形图

问题陈述:

为以下两个数据集创建箱线图。

0.22
-0.87
-2.39
-1.79
0.37
-1.54
1.28
-0.31
-0.74
1.72
0.38
-0.17
-0.62
-1.10
0.30
0.15
2.30
0.19
-0.50
-0.09
-5.13
-2.19
-2.43
-3.83
0.50
-3.25
4.32
1.63
5.18
-0.43
7.11
4.87
-3.10
-5.81
3.76
6.31
2.58
0.07
5.76
3.50

解决方案:

这里两个数据集在零附近均匀平衡,因此均值在零附近。在第一个数据集中,变化范围约为 -2.5 到 2.5,而在第二个数据集中,变化范围约为 -6 到 6。绘制图表如下所示:

箱形图