扫码阅读
手机扫码阅读
全面整理!机器学习常用的回归预测模型

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。


Datawhale
扫码关注公众号
前言
回归预测建模的核心是学习输入到输出的映射关系,其中输出是连续值向量。本文整理各种回归预测模型,帮助读者学习回归预测。
线性模型
线性回归通过特征的线性组合预测连续值标签。scikit-learn提供多种线性模型,包括普通最小二乘、Lasso和岭回归等。特别地,弹性网络结合了L1和L2正则化,最小角回归适用于高维数据,正交匹配追踪算法用于近似拟合约束线性模型,贝叶斯回归方法包括ARD和岭回归。
异常值鲁棒回归器如Huber回归和广义线性模型(GLM)用于处理非正态分布的因变量。
非线性模型
非线性回归通过特征的非线性组合交互预测连续值标签。集成树模型如XGBoost、LightGBM、CatBoost在回归预测中广泛使用。非线性模型还包括决策树、支持向量机、KNN和神经网络回归等。
随机森林和深度森林都是基于决策树的集成学习方法,而Extra trees和AdaBoost关注不同的集成策略。基于直方图的梯度提升和TabNet是进一步的改进。
INCE、Local Cascade Ensemble和GATE等是最新的深度学习框架,它们针对表格数据设计,提高预测效率和性能。
想要了解更多内容?


Datawhale
扫码关注公众号
Datawhale的其他文章
对标 OpenAI ,这家大模型企业发布一大波旗舰级模型!
Datawhale发布 发布:智谱AI,最新旗舰级模型自 ChatGP
AI顶会 ICLR 最新演讲:“The ChatGLM's Road to AGI”,首个中国大模型团队!
国产大模型的全球影响力!
吴恩达 x OpenAI Prompt Engineering教程中文笔记
Datawhale干货
作者:刘俊君,Datawhale成员完整课程??
Github调研:开发者对生产力、协作和AI编码工具的看法
在美国,有92%的开发者使用AI编码工具,70%说他们看到了使用这些工具的巨大好处。
GLM-4最新开源版本硬核测评!Datawhale成员万字测评(一)
GLM-4最新开源版本硬核测评。
加入社区微信群
与行业大咖零距离交流学习


PMO实践白皮书
白皮书上线
白皮书上线