用于多期概率预测的线性回归
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
线性回归模型在时间序列分析中的应用概述
线性回归模型因其快速、易解释以及部署简便,在许多组织中依旧是一个有力的选择。尤其是自回归模型,被广泛应用于时间序列的点估计。然而,现实中的应用场景常常需要模型能够提供概率预测以及多期超前预测。
概率预测
通过分位数回归(Quantile regression),可以预测未来任意时间点的不同百分位数,从而实现对预测不确定性的量化分析。分位数回归不同于传统的回归分析,它能够估计因变量的条件分位数,进而推断整个条件概率分布。
多期超前预测
为了实现多期预测,可以采用递归预测策略,即使用模型先进行一期预测,然后将该结果作为下一期的输入,如此递推。另一种策略是直接预测策略,即建立多个模型,每个模型对应预测一个特定时期。
线性回归模型的扩展
线性回归模型也可以包含其他协变量,如温度、燃料价格等。Python的Darts库提供了封装了scikit-learn函数的时间序列库,便于执行上述扩展的线性回归预测。
数据处理与模型实施
使用沃尔玛数据集进行示例,该数据集包含了从2010年到2012年的每周商店销售额等信息。数据集被加载到Pandas数据框架中,并使用Darts库的TimeSeries类创建时间序列。
建模与预测
模型构建分为几个步骤:
- 不包含协变量的单变量时间序列预测。
- 添加过去和未来的协变量进行预测。
- 生成量化预测,考虑不同的百分位数。
在这些步骤中,Darts库的LinearRegressionModel类被用于建立模型,并进行拟合和预测。模型的性能通过mean absolute error (MAE)和mean absolute percentage error (MAPE)进行评估。
结论
文章最后总结了Darts库线性回归模型类的特点,它能够进行多期前瞻概率预测,并且讨论了模型类的关键输入选项,例如协变量的使用以及预测策略的选择。
想要了解更多内容?
点击领取《Python学习手册》,后台回复「福利」获取。『数据STUDIO』专注于数据科学原创文章分享,内容以 Python 为核心语言,涵盖机器学习、数据分析、可视化、MySQL等领域干货知识总结及实战项目。