统计 - 相关系数


相关系数

相关系数是一个变量值的变化预测另一个变量值的变化程度的统计度量。在正相关变量中,值同时增加或减少。在负相关变量中,一个变量的值随着另一个变量的值的减小而增加。

相关系数表示为+1 和-1 之间的值。

系数 +1 表示完全正相关:一个变量值的变化将预测第二个变量的相同方向的变化。

系数 -1 表示完全负数:一个变量值的变化预示着第二个变量的相反方向的变化。较小的相关度表示为非零小数。系数为零表示变量波动之间没有可辨别的关系。

公式

${r = \frac{N \sum xy - (\sum x)(\sum y)}{\sqrt{[N\sum x^2 - (\sum x)^2][N\sum y^2 - (\sum y)^2]}} }$

其中 -

  • ${N}$ = 分数对的数量

  • ${\sum xy}$ = 配对分数的乘积之和。

  • ${\sum x}$ = x 分数的总和。

  • ${\sum y}$ = y 分数的总和。

  • ${\sum x^2}$ = x 分数的平方和。

  • ${\sum y^2}$ = y 分数平方和。

例子

问题陈述:

计算以下各项的相关系数:

X
12
35
45
48

解决方案:

${ \sum xy = (1)(2) + (3)(5) + (4)(5) + (4)(8) = 69 \\[7pt] \sum x = 1 + 3 + 4 + 4 = 12 \\[7pt] \sum y = 2 + 5 + 5 + 8 = 20 \\[7pt] \sum x^2 = 1^2 + 3^2 + 4^2 + 4^2 = 42 \ \[7pt] \sum y^2 = 2^2 + 5^2 + 5^2 + 8^2 = 118 \\[7pt] r= \frac{69 - \frac{(12)(20)}{ 4}}{\sqrt{(42 - \frac{(12)^2}{4})(118-\frac{(20)^2}{4}}} \\[7pt] = .866 }$