当前位置:网站首页>随机森林的理解
随机森林的理解
2022-07-17 00:10:00 【elkluh】
- 一个样本容量为N的样本,有放回的抽取N次,每次抽取1个,最终形成了N个样本。这选择好了的N个样本用来训练一个决策树,作为决策树根节点处的样本。这用了(a.)bagging的思想。
- 当每个样本有M个属性时,在决策树(c.)的每个节点需要分裂时,随机从这M个属性中选取出m个属性 (b.),满足条件m << M。然后从这m个属性中采用某种策略(比如说信息增益)来选择1个属性作为该节点的分裂属性。
- 决策树形成过程中每个节点都要按照步骤2来分裂(很容易理解,如果下一次该节点选出来的那一个属性是刚刚其父节点分裂时用过的属性,则该节点已经达到了叶子节点,无须继续分裂了)。一直到不能够再分裂为止。注意整个决策树形成过程中没有进行剪枝。
- 按照步骤1~3建立大量的决策树,这样就构成了随机森林了。
a. bagging : Bootstrap aggregating


•对于分类,我们让不同的机器投票
•对于回归,我们可以平均不同机器的预测
•bagging提高了决策树的性能
b. 上面的过程描述了树的原始的 bagging 算法。随机森林与这个通用的方案只有一点不同:它使用一种改进的学习算法,在学习过程中的每次候选分裂中选择特征的随机子集(减小相关性)。这个过程有时又被称为“特征 bagging”。这样做的原因是 bootstrap 抽样导致的树的相关性:如果有一些特征预测目标值的能力很强,那么这些特征就会被许多树所选择,这样就会导致树的强相关性
c. 决策树
边栏推荐
- 微信公众号网页授权40029错误「建议收藏」
- 【文献阅读】isl: An Integer Set Library for the Polyhedral Model
- 爭奪存量用戶關鍵戰,助力企業構建完美標簽體系丨01期直播回顧
- 基于移动互联网应用的儿童网络保护产业实践与完善
- [go language] code coverage test (Gcov)
- 雷达通信一体化波形设计综述
- 集成学习
- Today's code farmer girl learned about nodejs and repl interactive interpreter
- Leveraging Semi-Supervised Learning for Fairness using Neural Networks
- Redis+Caffeine两级缓存,让访问速度纵享丝滑
猜你喜欢

One vs One Mitigation of Intersectional Bias

Xcode11新建项目后的一些问题

Why do you spend 1.16 million to buy an NFT avatar in the library of NFT digital collections? The answer may be found by reviewing the "rise history" of NFT avatars

【文献阅读】Multi-state MRAM cells for hardware neuromorphic computing

Byte two side: what is pseudo sharing? How to avoid it?

Classification and use of express Middleware

Redis suddenly slowed down?

Countless times of stepping on the pit to install awvs

How to use express and how to match and use routes

如何建设实时开发平台,深入释放企业实时数据价值?
随机推荐
基于深度学习的加密流量识别研究综述及展望
通感一体去蜂窝超大规模MIMO与高频段无线接入技术
玩转集群配置中心,一文带你了解Taier控制台
Cannot find module ‘process‘ or its corresponding type declarations.
JVM 判断对象已死,实践验证GC回收
Common asynchronous sending code writing
网络安全新架构:零信任安全
【文献阅读】Multi-state MRAM cells for hardware neuromorphic computing
ViLT Vision-and-Language Transformer Without Convolution or Region Supervision
Ace download address
TCP and UDP, TCP server and client, UDP server and client
监听浏览器返回操作-禁止返回上一页
mysql innodb 事务相关记录
Punch in 10 interview questions every day - JVM article
【MySQL】windows安装MySQL 5.6
Valgrind detailed tutorial (1) MemCheck
基于开源流批一体数据同步引擎ChunJun数据还原—DDL解析模块的实战分享
The interviewer asked: how to check if redis suddenly slows down?
fetch请求-简单记录
CABasicAnimation暂停\企动