时间序列 - 向前验证


在时间序列建模中,随着时间的推移,预测变得越来越不准确,因此,当模型可用于进一步预测时,使用实际数据重新训练模型是一种更现实的方法。由于统计模型的训练并不耗时,因此前向验证是获得最准确结果的首选解决方案。

让我们对数据应用一步一步验证,并将其与我们之前获得的结果进行比较。

在[333]中:

prediction = []
data = train.values
for t In test.values:
   model = (ExponentialSmoothing(data).fit())
   y = model.predict()
   prediction.append(y[0])
   data = numpy.append(data, t)

在[335]中:

test_ = pandas.DataFrame(test)
test_['predictionswf'] = prediction

在[341]中:

plt.plot(test_['T'])
plt.plot(test_.predictionswf, '--')
plt.show()
代码片段 18

在[340]中:

error = sqrt(metrics.mean_squared_error(test.values,prediction))
print ('Test RMSE for Triple Exponential Smoothing with Walk-Forward Validation: ', error)
Test RMSE for Triple Exponential Smoothing with Walk-Forward Validation:  11.787532205759442

我们可以看到我们的模型现在表现明显更好。事实上,趋势被如此紧密地遵循,以至于绘图上的预测与实际值重叠。您也可以尝试在 ARIMA 模型上应用前向验证。