下载全书

决策树

0
0
2041
贡献人:

定义

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。
决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。
分类树(决策树)是一种十分常用的分类方法。它是一种监督学习,所谓监督学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习
决策树一般由决策点、状态节点、结果节点组成:
□——决策点,是对几种可能方案的选择,即最后选择的最佳方案。如果决策属于多级决策,则决策树的中间可以有多个决策点,以决策树根部的决策点为最终决策方案。
○——状态节点,代表备选方案的经济效果(期望值),通过各状态节点的经济效果的对比,按照一定的决策标准就可以选出最佳方案。由状态节点引出的分支称为概率枝,概率枝的数目表示可能出现的自然状态数目每个分枝上要注明该状态出现的概率。
△——结果节点,将每个方案在各种自然状态下取得的损益值标注于结果节点的右端。

2024-05-10 09:30:46

实践出处

20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinlan提出了ID3算法以后,决策树在机器学习、数据挖掘领域得到极大的发展。Quinlan后来又提出了C4.5,成为新的监督学习算法。1984年,几位统计学家 提出了CART分类算法。ID3和CART算法几乎同时被提出,但都是采用类似的方法从训练样本中学习决策树。——《Python数据分析与挖掘实战》

2024-05-10 09:30:46

为什么

 决策树易于理解和实现,人们在在学习过程中不需要使用者了解很多的背景知识,这同时是它的能够直接体现数据的特点,只要通过解释后都有能力去理解决策树所表达的意义
 对于决策树,数据的准备往往是简单或者是不必要的,而且能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果。
 易于通过静态测试来对模型进行评测,可以测定模型可信度;如果给定一个观察的模型,那么根据所产生的决策树很容易推出相应的逻辑表达式。

2024-05-10 09:30:46

何时使用

1.分类问题:用于对不同类别进行预测。
2.数据理解:帮助理解数据中的模式和关系。
3.变量选择:确定哪些变量对决策或分类最重要

2024-05-10 09:30:46

如何使用

1.数据加载与准备: 导入所需的数据集,并确保数据的格式正确。 可能需要对数据进行一些预处理,如缺失值处理、特征工程等。
2.构建决策树模型: 选择合适的决策树算法,如 ID3、C4.5 或 CART 等。 根据具体需求设置决策树的参数,如最大深度、最小样本分割等。
image
3.训练决策树模型: 将准备好的数据作为输入,使用构建好的决策树模型进行训练。
4.模型评估: 使用测试集或交叉验证等方法评估模型的性能,如准确率、召回率、F1 值等指标。
5.可视化决策树: 可以使用相关工具将决策树可视化,以便更好地理解模型的结构和决策逻辑。
6.应用决策树模型: 将训练好的决策树模型应用于新的数据,进行预测或决策。
需要注意的是,具体的使用方法可能因决策树库的不同而有所差异,在实际使用时,还需要根据库的文档和具体情况进行适当的调整和优化

2024-05-10 09:30:46

参考资料

戴淑芬 .管理学教程 .北京大学出版社.2009.76-79
曹赛玉.几种决策概率模型在现实生活中的应用.理论与实践理论月刊,2006(5)
基于决策树的数据挖掘算法的应用与研究.拓步ERP资讯网.2012-10-30 [引用日期2013-01-16]
陈诚,基于AFS理论的模糊分类器设计, 大连理工大学,2010
什么是决策树?.中国机床网 [引用日期2013-01-16]
Jiawei Han.数据挖掘概念与技术.机械工业出版社.2012
《Python大数据分析与机器学习商业案例实战》

2024-05-10 09:30:46

实战案例

为了适应市场的需要,某地准备扩大电视机生产。市场预测表明:产品销路好的概率为0.7;销路差的概率为0.3。备选方案有三个:第一个方案是建设大工厂,需要投资600万元,可使用10年;如销路好,每年可赢利200万元;如销路不好,每年会亏损40万元。第二个方案是建设小工厂,需投资280万元;如销路好,每年可赢利80万元;如销路不好,每年也会赢利60万元。第三个方案也是先建设小工厂,但是如销路好,3年后扩建,扩建需投资400万元,可使用7年,扩建后每年会赢利190万元。
各点期望:
image
点②:0.7×200×10+0.3×(-40)×10-600(投资)=680(万元)
点⑤:1.0×190×7-400=930(万元)
点⑥:1.0×80×7=560(万元)
比较决策点4的情况可以看到,由于点⑤(930万元)与点⑥(560万元)相比,点⑤的期望利润值较大,因此应采用扩建的方案,而舍弃不扩建的方案。把点⑤的930万元移到点4来,可计算出点③的期望利润值。
点③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(万元)
最后比较决策点1的情况。由于点③(719万元)与点②(680万元)相比,点③的期望利润值较大,因此取点③而舍点②。这样,相比之下,建设大工厂的方案不是最优方案,合理的策略应采用前3年建小工厂,如销路好,后7年进行扩建的方案。

2024-05-10 09:30:46

关键词

分析、预测、测试

2024-05-10 09:30:46

我们非常重视知识产权,我们在非常努力地寻找最初的出处来源并注明出处。但因为互联网信息浩瀚,难免会有疏漏。如果您觉得有侵犯您的权益,请联系我们。

更新时间:
2024-05-10
版本号: 1
决策树 10 更新时间:2024-08-06
决策树 9 更新时间:2024-07-29
决策树 8 更新时间:2024-07-29
决策树 5 更新时间:2024-07-25
请提出您的意见
通过审核后显示您的意见

文章导航

定义
实践出处
为什么
何时使用
如何使用
参考资料
实战案例
关键词

主要贡献人

刘洋

实践被点赞 0

实践被收藏 0

加入社区微信群
与行业大咖零距离交流学习
PMO实践白皮书
白皮书上线