统计 - 线性回归


一旦使用相关分析确定了变量之间的关系程度,就很自然地要深入研究关系的本质。回归分析有助于确定变量之间的因果关系。如果可以使用图形方法或代数方法预测自变量的值,则可以预测其他变量(称为因变量)的值。

图解法

它涉及绘制一个散点图,其中 X 轴为自变量,Y 轴为因变量。之后,以穿过大部分分布的方式绘制一条线,其余点几乎均匀地分布在该线的两侧。

回归线被称为最佳拟合线,它总结了数据的一般变化。它显示一个变量与另一个变量的平均值相对应的最佳平均值。回归线基于这样的标准:它是一条使因变量的预测值和观测值之间的偏差平方和最小化的直线。

代数法

代数方法建立了 X 对 Y 和 Y 对 X 的两个回归方程。

Y 对 X 的回归方程

${Y = a+bX}$

其中 -

  • ${Y}$ = 因变量

  • ${X}$ = 自变量

  • ${a}$ = 显示 Y 轴截距的常数

  • ${b}$ = 显示线斜率的常数

a和b的值通过以下正规方程获得:

${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 }$

其中 -

  • ${N}$ = 观察数

X 对 Y 的回归方程

${X = a+bY}$

其中 -

  • ${X}$ = 因变量

  • ${Y}$ = 自变量

  • ${a}$ = 显示 Y 轴截距的常数

  • ${b}$ = 显示线斜率的常数

a和b的值通过以下正规方程获得:

${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 }$

其中 -

  • ${N}$ = 观察数

例子

问题陈述:

一位研究人员发现,父亲和儿子的体重倾向之间存在相关性。他现在有兴趣根据给定数据建立两个变量的回归方程:

父亲的体重(公斤)696366646764706668676571
儿子的体重(公斤)706568656966686571676472

发展

  1. Y 对 X 的回归方程。

  2. Y 的回归方程。

解决方案:

${X}$${X^2}$${Y}$${Y^2}$${XY}$
6947617049004830
6339696542254095
6643566846244488
6440966542254160
6744896947614623
6440966643564224
7049006846244760
6643566542254290
6846247150414828
6744896744894489
6542256440964160
7150417251845112
${\总和X = 800}$${\总和X^2 = 53,402}$${\总和 Y = 810}$${\总和Y^2 = 54,750}$${\XY = 54,059}$

Y 对 X 的回归方程

Y=a+bX

其中,a和b由正规方程得到

${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 \\[7pt] 其中\ \sum Y = 810,\sum X = 800 , \sum X^2 = 53,402 \\[7pt] , \sum XY = 54, 049, N = 12 }$

${\Rightarrow}$ 810 = 12a + 800b ... (i)

${\Rightarrow}$ 54049 = 800a + 53402 b ... (ii)

将等式(i)乘以800,将等式(ii)乘以12,我们得到:

96000a + 640000b = 648000 ... (iii)

96000a + 640824b = 648588 ... (iv)

从 (iii) 中减去方程 (iv)

-824 b = -588

${\Rightarrow}$ b = -.0713

将 b 的值代入式中。(我)

810 = 12a + 800 (-0.713)

810 = 12a + 570.4

12a = 239.6

${\Rightarrow}$a = 19.96

因此 X 上的方程 Y 可以写为

${Y = 19.96 - 0.713X}$

X 对 Y 的回归方程

X = a+bY

其中,a和b由正规方程得到

${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 \\[7pt] 其中\ \sum Y = 810, \sum Y^2 = 54,750 \\[7pt] , \sum XY = 54, 049, N = 12 }$

${\Rightarrow}$ 800 = 12a + 810a + 810b ... (V)

${\Rightarrow}$ 54,049 = 810a + 54, 750 ... (vi)

将 eq (v) 乘以 810,将 eq (vi) 乘以 12,我们得到

9720a + 656100b = 648000 ... (七)

9720a + 65700b = 648588 ... (viii)

从式 vii 中减去式 viii

900b = -588

${\右箭头}$ b = 0.653

将 b 的值代入方程 (v)

800 = 12a + 810 (0.653)

12a = 271.07

${\Rightarrow}$a = 22.58

因此 X 和 Y 的回归方程为

${X = 22.58 + 0.653Y}$