时间序列-参数校准
介绍
任何统计或机器学习模型都有一些参数,这些参数极大地影响数据的建模方式。例如,ARIMA 具有 p、d、q 值。这些参数的确定应使实际值与模型值之间的误差最小。参数校准被认为是模型拟合中最关键和最耗时的任务。因此,选择最优参数对我们来说非常重要。
参数校准方法
校准参数的方法有多种。本节详细讨论其中的一些内容。
试一试
校准模型的一种常见方法是手动校准,首先将时间序列可视化,然后直观地尝试一些参数值,然后一遍又一遍地更改它们,直到达到足够好的拟合效果。它需要对我们正在尝试的模型有很好的理解。对于 ARIMA 模型,借助“p”参数的自相关图、“q”参数的部分自相关图和 ADF 测试来完成手动校准,以确认时间序列的平稳性并设置“d”参数。我们将在接下来的章节中详细讨论所有这些。
网格搜索
校准模型的另一种方法是通过网格搜索,这本质上意味着您尝试为所有可能的参数组合构建模型,并选择误差最小的模型。这是耗时的,因此当要校准的参数数量和它们采用的值范围较少时非常有用,因为这涉及多个嵌套的 for 循环。
遗传算法
遗传算法基于生物学原理,即好的解决方案最终会演变成最“最优”的解决方案。它利用变异、交叉和选择等生物学操作,最终达到最优解。
要了解更多知识,您可以阅读其他参数优化技术,例如贝叶斯优化和群体优化。