用于时间序列概率预测的分位数回归
我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。
概述
分位数回归是一种统计技术,用于估计预测变量与响应变量之间的关系,特别是在条件分布的不同分位数水平上的关系。它与传统的回归方法不同,侧重于估计条件分位数而非条件均值。
分位数回归概念
分位数回归由Koenker和Bassett于1978年提出,用于建模一组回归变量X与被解释变量Y的分位数之间的线性关系。区别于最小化残差平方的OLS回归,分位数回归基于最小化非对称形式的绝对值残差。
优点
分位数回归能更全面描述条件分布,稳健地估计不同水平上被解释变量的影响,并且对离群值和非正态分布的误差项具有较强鲁棒性。
与蒙特卡罗模拟的对比
分位数回归直接估计响应变量的条件分位数,提供特定量级的预测不确定性估计,相比蒙特卡罗模拟的大量可能结果,这种方法更为直接且基于模型。
实践应用
利用NeuralProphet,可以构建分位数回归模型,本文使用共享单车数据集来演示。安装NeuralProphet,导入必要的库,并对数据集进行预处理,以满足NeuralProphet的要求。
模型构建与预测
在NeuralProphet中构建分位数回归模型,指定分位数列表,并利用训练集和测试集进行模型训练。使用.make_future_dataframe()方法创建新数据帧进行预测,并使用m.predict()获取预测结果。
预测区间与置信区间的区别
预测区间与置信区间虽然都用于量化不确定性,但它们有着不同的目标、计算方法和应用。线性回归关注的是条件均值的置信区间,而分位数回归提供的是预测区间,关注的是条件分布的不同量化值。
总结
本文介绍了分位数回归的概念,如何使用NeuralProphet生成预测区间,并阐明了预测区间和置信区间之间的差异,这对于商业应用中的决策非常关键。
想要了解更多内容?
点击领取《Python学习手册》,后台回复「福利」获取。『数据STUDIO』专注于数据科学原创文章分享,内容以 Python 为核心语言,涵盖机器学习、数据分析、可视化、MySQL等领域干货知识总结及实战项目。