扫码阅读
手机扫码阅读

用于时间序列概率预测的分位数回归

225 2024-10-16

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:用于时间序列概率预测的分位数回归
文章来源:
数据STUDIO
扫码关注公众号

概述

分位数回归是一种统计技术,用于估计预测变量与响应变量之间的关系,特别是在条件分布的不同分位数水平上的关系。它与传统的回归方法不同,侧重于估计条件分位数而非条件均值。

分位数回归概念

分位数回归由Koenker和Bassett于1978年提出,用于建模一组回归变量X与被解释变量Y的分位数之间的线性关系。区别于最小化残差平方的OLS回归,分位数回归基于最小化非对称形式的绝对值残差。

优点

分位数回归能更全面描述条件分布,稳健地估计不同水平上被解释变量的影响,并且对离群值和非正态分布的误差项具有较强鲁棒性。

与蒙特卡罗模拟的对比

分位数回归直接估计响应变量的条件分位数,提供特定量级的预测不确定性估计,相比蒙特卡罗模拟的大量可能结果,这种方法更为直接且基于模型。

实践应用

利用NeuralProphet,可以构建分位数回归模型,本文使用共享单车数据集来演示。安装NeuralProphet,导入必要的库,并对数据集进行预处理,以满足NeuralProphet的要求。

模型构建与预测

在NeuralProphet中构建分位数回归模型,指定分位数列表,并利用训练集和测试集进行模型训练。使用.make_future_dataframe()方法创建新数据帧进行预测,并使用m.predict()获取预测结果。

预测区间与置信区间的区别

预测区间与置信区间虽然都用于量化不确定性,但它们有着不同的目标、计算方法和应用。线性回归关注的是条件均值的置信区间,而分位数回归提供的是预测区间,关注的是条件分布的不同量化值。

总结

本文介绍了分位数回归的概念,如何使用NeuralProphet生成预测区间,并阐明了预测区间和置信区间之间的差异,这对于商业应用中的决策非常关键。

想要了解更多内容?

查看原文:用于时间序列概率预测的分位数回归
文章来源:
数据STUDIO
扫码关注公众号