时间序列 - 误差指标


对我们来说,量化模型的性能以将其用作反馈和比较非常重要。在本教程中,我们使用了最流行的误差度量均方根误差之一。还有各种其他可用的错误指标。本章简要讨论它们。

均方误差

它是预测值与真实值之差的平方平均值。Sklearn 将其作为函数提供。它与真实值和预测值的平方具有相同的单位,并且始终为正值。

$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$

其中$y'_{t}$ 是预测值,

$y_{t}$ 是实际值,并且

n 是测试集中的值总数。

从方程中可以清楚地看出,MSE 对较大误差或异常值的惩罚更大。

根均方误差

它是均方误差的平方根。它也始终为正值并且在数据范围内。

$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$

其中,$y'_{t}$为预测值

$y_{t}$ 是实际值,并且

n 是测试集中的值总数。

它具有统一的力量,因此与 MSE 相比更容易解释。对于较大的错误,RMSE 也会受到更大的惩罚。我们在教程中使用了 RMSE 指标。

平均绝对误差

它是预测值与真实值之间的绝对差的平均值。它与预测值和真实值具有相同的单位,并且始终为正值。

$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$

其中,$y'_{t}$为预测值,

$y_{t}$ 是实际值,并且

n 是测试集中的值总数。

平均百分比误差

它是预测值与真实值之间的绝对差值的平均值除以真实值的百分比。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$

其中,$y'_{t}$为预测值,

$y_{t}$ 是实际值,n 是测试集中的值总数。

然而,使用该误差的缺点是正误差和负误差可以相互抵消。因此使用平均绝对百分比误差。

平均绝对百分比误差

它是预测值与真实值之间的绝对差值的平均值除以真实值的百分比。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}* 100\:\%$$

其中$y'_{t}$ 是预测值

$y_{t}$ 是实际值,并且

n 是测试集中的值总数。