时间序列 - 向前验证
在时间序列建模中,随着时间的推移,预测变得越来越不准确,因此,当模型可用于进一步预测时,使用实际数据重新训练模型是一种更现实的方法。由于统计模型的训练并不耗时,因此前向验证是获得最准确结果的首选解决方案。
让我们对数据应用一步一步验证,并将其与我们之前获得的结果进行比较。
在[333]中:
prediction = [] data = train.values for t In test.values: model = (ExponentialSmoothing(data).fit()) y = model.predict() prediction.append(y[0]) data = numpy.append(data, t)
在[335]中:
test_ = pandas.DataFrame(test) test_['predictionswf'] = prediction
在[341]中:
plt.plot(test_['T']) plt.plot(test_.predictionswf, '--') plt.show()
在[340]中:
error = sqrt(metrics.mean_squared_error(test.values,prediction)) print ('Test RMSE for Triple Exponential Smoothing with Walk-Forward Validation: ', error) Test RMSE for Triple Exponential Smoothing with Walk-Forward Validation: 11.787532205759442
我们可以看到我们的模型现在表现明显更好。事实上,趋势被如此紧密地遵循,以至于绘图上的预测与实际值重叠。您也可以尝试在 ARIMA 模型上应用前向验证。