时间序列-参数校准


介绍

任何统计或机器学习模型都有一些参数,这些参数极大地影响数据的建模方式。例如,ARIMA 具有 p、d、q 值。这些参数的确定应使实际值与模型值之间的误差最小。参数校准被认为是模型拟合中最关键和最耗时的任务。因此,选择最优参数对我们来说非常重要。

参数校准方法

校准参数的方法有多种。本节详细讨论其中的一些内容。

试一试

校准模型的一种常见方法是手动校准,首先将时间序列可视化,然后直观地尝试一些参数值,然后一遍又一遍地更改它们,直到达到足够好的拟合效果。它需要对我们正在尝试的模型有很好的理解。对于 ARIMA 模型,借助“p”参数的自相关图、“q”参数的部分自相关图和 ADF 测试来完成手动校准,以确认时间序列的平稳性并设置“d”参数。我们将在接下来的章节中详细讨论所有这些。

网格搜索

校准模型的另一种方法是通过网格搜索,这本质上意味着您尝试为所有可能的参数组合构建模型,并选择误差最小的模型。这是耗时的,因此当要校准的参数数量和它们采用的值范围较少时非常有用,因为这涉及多个嵌套的 for 循环。

遗传算法

遗传算法基于生物学原理,即好的解决方案最终会演变成最“最优”的解决方案。它利用变异、交叉和选择等生物学操作,最终达到最优解。

要了解更多知识,您可以阅读其他参数优化技术,例如贝叶斯优化和群体优化。