【预售】(按需印刷POD版)数据挖掘中的集成方法——通过集成预测来提升精度
图书信息
作者:(美)赛尼(GiovanniSeni),(美)艾德(JohnElder)著;王攀等译著王攀等译著作译
出版社:科学出版社
定价:80.00
ISBN:9787030443274
出版时间:2015-06-01
分类:图书,行业职业,计算机,数据库
商品介绍
目录
译者序
原书序一
原书序二
摘要
第1章 集成发现
1.1建立集成
1.2正则化
1.3现实世界中的实例:信用评分+网飞挑战
1.4本书的组织架构
第2章 预测学习和决策树
2.1决策树归纳纵览
2.2决策树的性能
2.3决策树的缺陷
第3章 模型复杂度、模型选择和正则化
3.1什么是树的"合适"规模
3.2偏差-方差分解
3.3正则化
3.3.1正则化与成本-复杂度树修剪
3.3.2交叉验证
3.3.3运用收缩的正则化
3.3.4通过构建增量模型的正则化
3.3.5实例
3.3.6正则化综述
第4章 重要性采样和经典集成方法
4.1重要性采样
4.1.1参数重要性测度
4.1.2扰动采样
4.2泛化集成生成
4.3Bagging
4.3.1实例
4.3.2为什么Bagging有用
4.4随机森林
4.5AdaBoost
4.5.1实例
4.5.2为什么使用指数损失
4.5.3AdaBoost的总体最小值
4.6梯度Boosting
4.7MART
4.8并行集成与顺序集成的比较
第5章 规则集成和解释统计
5.1规则集成
5.2解释
5.2.1仿真数据实例
5.2.2变量重要性
5.2.3偏相关
5.2.4交互统计
5.3制造业数据实例
5.4总结
第6章 集成复杂性
6.1复杂性
6.2广义自由度
6.3实例:带有噪声的决策树表面
6.4广义自由度的R代码和实例
6.5总结与讨论
参考文献
附录A AdaBoost与FSF程序的等价性
附录B 梯度Boosting和鲁棒损失函数
内容简介
《数据挖掘中的集成方法—通过集成预测来提升精度》讨论基于决策树的集成,分析被视为当前现代集成算法高级性能的主要原因之一的正则化问题,描述集成方法领域近年来的两个发展——重要性采样(IS)和规则集成(RE),论述新数据信息集成在复杂性和更高精度方面的悖论等重要命题。《数据挖掘中的集成方法—通过集成预测来提升精度》面向前沿、文字简练、论述充分、可读性好。
- 中公2017公务员考试用书 数量关系(李永新,人民日报)
- 一个行者的传奇:分文不带走美国(麦金太尔(Mclntyre.M.) 著,向晓红,)
- 丝绸之路千问千答(高建群 著)
- 医用物理学学习指导(张延芳 编)
- 坤宁酒谜:道光帝后妃传奇(翟文明著,中国人民大学)
- AutoCAD 2011建筑设计与施工图绘制经典实例教程(麓山文化 编著,机械工业)
- 万卷楼国学启蒙:中国神话故事(未知)
- 中国参与产品内国际分工:特征、效应及升级思路(杜琼 著,中国金融)
