下载全书

决策树

0
0
1514
贡献人:

定义
编辑

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。

决策树是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

决策树一般由决策点、状态节点、结果节点组成:
□——决策点,是对几种可能方案的选择,即最后选择的最佳方案。如果决策属于多级决策,则决策树的中间可以有多个决策点,以决策树根部的决策点为最终决策方案。
○——状态节点,代表备选方案的经济效果(期望值),通过各状态节点的经济效果的对比,按照一定的决策标准就可以选出最佳方案。由状态节点引出的分支称为概率枝,概率枝的数目表示可能出现的自然状态数目每个分枝上要注明该状态出现的概率。
△——结果节点,将每个方案在各种自然状态下取得的损益值标注于结果节点的右端。

实践出处
编辑

20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinlan提出了ID3算法以后,决策树在机器学习、数据挖掘领域得到极大的发展。Quinlan后来又提出了C4.5,成为新的监督学习算法。1984年,几位统计学家 提出了CART分类算法。ID3和CART算法几乎同时被提出,但都是采用类似的方法从训练样本中学习决策树。

为什么
编辑

  • 决策树易于理解和实现,人们在在学习过程中不需要使用者了解很多的背景知识,这同时是它的能够直接体现数据的特点,只要通过解释后都有能力去理解决策树所表达的意义

  • 对于决策树,数据的准备往往是简单或者是不必要的,而且能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果。

  • 易于通过静态测试来对模型进行评测,可以测定模型可信度;如果给定一个观察的模型,那么根据所产生的决策树很容易推出相应的逻辑表达式。

何时使用
编辑

1.分类问题:用于对不同类别进行预测。
2.数据理解:帮助理解数据中的模式和关系。
3.变量选择:确定哪些变量对决策或分类最重要

如何使用
编辑

1.数据加载与准备: 导入所需的数据集,并确保数据的格式正确。 可能需要对数据进行一些预处理,如缺失值处理、特征工程等。
2.构建决策树模型: 选择合适的决策树算法,如 ID3、C4.5 或 CART 等。 根据具体需求设置决策树的参数,如最大深度、最小样本分割等。
image
3.训练决策树模型: 将准备好的数据作为输入,使用构建好的决策树模型进行训练。
4.模型评估: 使用测试集或交叉验证等方法评估模型的性能,如准确率、召回率、F1 值等指标。
5.可视化决策树: 可以使用相关工具将决策树可视化,以便更好地理解模型的结构和决策逻辑。
6.应用决策树模型: 将训练好的决策树模型应用于新的数据,进行预测或决策。
需要注意的是,具体的使用方法可能因决策树库的不同而有所差异,在实际使用时,还需要根据库的文档和具体情况进行适当的调整和优化 。

参考资料
编辑

  1. 刘小虎,李生.决策树的优化算法[J].软件学报,1998.

  2. 《Python大数据分析与机器学习商业案例实战》王宇韬 钱妍竹著

  3. http://www.tup.tsinghua.edu.cn/upload/books/yz/090631-01.pdf

实战案例
编辑

某科技公司计划开发一款新的智能手机应用,该应用旨在通过用户的日常活动数据提供个性化健康建议。项目团队需要评估不同的开发策略,并决定最优的执行路径。项目的潜在风险包括技术可行性、市场接受度、竞争对手的反应以及法律合规性。

决策树构建
决策结点:项目团队面临的主要决策包括开发策略(快速上市 vs. 功能完善)和市场进入策略(先行进入 vs. 跟随策略)。
方案枝:四个主要的策略组合。
状态结点:不同策略下可能遇到的市场和技术状态。
概率枝:各状态发生的概率。
损益值:每种状态下的预期收益或损失。

数据支撑
市场和技术状态概率:
技术成功且市场接受度高:40%
技术成功但市场接受度低:30%
技术失败:10%
技术成功但面临激烈竞争:20%
预期收益/损失:
快速上市且市场接受度高:收益1000万元
功能完善且市场接受度高:收益1500万元
快速上市但市场接受度低:损失500万元
功能完善但市场接受度低:损失300万元
快速上市但面临激烈竞争:损失200万元
功能完善但面临激烈竞争:损失100万元

决策树分析
计算期望值:对于每个策略组合,计算其在不同状态下的期望收益。
比较期望值:比较四个策略组合的期望值,选择期望值最高的策略。

计算过程
快速上市的期望收益: ????(快速上市)=1000万×40%−500万×30%−200万×20%E(快速上市)=1000万×40%−500万×30%−200万×20%
功能完善的期望收益: ????(功能完善)=1500万×40%−300万×30%−100万×20%E(功能完善)=1500万×40%−300万×30%−100万×20%

决策
根据计算结果,功能完善的期望收益高于快速上市,因此项目团队应该选择功能完善作为开发策略。

风险管理
除了决策树分析,项目团队还应该:
识别风险:包括技术风险、市场风险、法律风险等。
风险评估:评估各风险的概率和影响。
风险应对策略:为每个风险制定应对措施,如技术风险可以通过增加研发投入来降低,市场风险可以通过市场调研来评估。
监控和控制:项目实施过程中持续监控风险,并根据实际情况调整策略。

结论
通过决策树分析,项目团队能够量化不同决策方案下的风险和收益,从而做出更加科学的决策。同时,结合风险管理和问题解决策略,可以进一步提高项目的成功率。

关键词
编辑

分析、预测、测试

我们非常重视知识产权,我们在非常努力地寻找最初的出处来源并注明出处。但因为互联网信息浩瀚,难免会有疏漏。如果您觉得有侵犯您的权益,请联系我们。

更新时间:
2024-08-06
版本号: 10
决策树 9 更新时间:2024-07-29
决策树 8 更新时间:2024-07-29
决策树 5 更新时间:2024-07-25
决策树 1 更新时间:2024-05-10
请提出您的意见
通过审核后显示您的意见

文章导航

定义
实践出处
为什么
何时使用
如何使用
参考资料
实战案例
关键词

主要贡献人

刘洋

实践被点赞 0

实践被收藏 0

加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线