Python机器学习:预测分析核心算法图书
人气:23

Python机器学习:预测分析核心算法

人工智能深度学习参考书目 掌握算法和Python编程 用Python分析数据 预测结果的简单高效的方式
  • 所属分类:图书 >计算机/网络>程序设计>其他  
  • 作者:[美] [Michael] [Bowles] [鲍尔斯] 著
  • 产品参数:
  • 丛书名:--
  • 国际刊号:9787115433732
  • 出版社:人民邮电出版社
  • 出版时间:2016-12
  • 印刷时间:2016-12-01
  • 版次:1
  • 开本:128开
  • 页数:--
  • 纸张:胶版纸
  • 包装:平装-胶订
  • 套装:

内容简介

在学习和研究机器学习的时候,面临令人眼花缭乱的算法,机器学习新手往往会不知 所措。本书从算法和Python 语言实现的角度,帮助读者认识机器学习。 本书专注于两类核心的“算法族”,即惩罚线性回归和集成方法,并通过代码实例来 展示所讨论的算法的使用原则。全书共分为7 章,详细讨论了预测模型的两类核心算法、预测模型的构建、惩罚线性回归和集成方法的具体应用和实现。 本书主要针对想提高机器学习技能的Python 开发人员,帮助他们解决某一特定的项 目或是提升相关的技能。

编辑推荐

机器学习关注于预测,其核心是一种基于数学和算法的技术,要掌握该技术,需要对数学及统计概念有深入理解,能够熟练使用R 语言或者其他编程语言。 本书通过集中介绍两类可以进行有效预测的机器学习算法,展示了如何使用Python 编程语言完成机器学习任务,从而降低机器学习难度,使机器学习能够被更广泛的人群掌握。 作者利用多年的机器学习经验带领读者设计、构建并实现自己的机器学习方案。本书尽可能地用简单的术语来介绍算法,避免复杂的数学推导,同时提供了示例代码帮助读者迅速上手。读者会很快深入了解模型构建背后的原理,不论简单问题还是复杂问题,读者都可以学会如何找到问题的解决算法。书中详细的示例,给出了具体的可修改的代码,展示了机器学习机理,涵盖了线性回归和集成方法,帮助理解使用机器学习方法的基本流程。 本书为不具备数学或统计背景的读者量身打造,详细介绍了如何: ● 针对任务选择合适算法; ● 对不同目的应用训练好的模型; ● 学习数据处理机制,准备数据; ● 评估模型性能以保障应用效果; ● 掌握Python 机器学算法包; ● 使用示例代码设计和构建你自己的模型; ● 构建实用的多功能预测模型。

作者简介

Michael Bowles 在硅谷黑客道场教授机器学习,提供机器学习项目咨询,同时参与了多家创业公司,涉及的领域包括生物信息学、金融高频交易等。他在麻省理工学院获得助理教授教职后,创建并运营了两家硅谷创业公司,这两家公司都已成功上市。他在黑客道场的课程往往听者云集并且好评颇多。

目录

目录

第1章 关于预测的两类核心

算法 ................................................1

1.1为什么这两类算法如此有用 .......1

1.2什么是惩罚回归方法.....................6

1.3什么是集成方法 .............................8

1.4算法的选择 ......................................9

1.5构建预测模型的流程...................11

1.5.1构造一个机器学习问题 ......12

1.5.2特征提取和特征工程 ..........14

1.5.3确定训练后的模型的性能 .....15

1.6各章内容及其依赖关系 ..............15

1.7小结 .................................................17

1.8参考文献 ........................................17

第2章 通过理解数据来了解

问题 ..............................................19

2.1“解剖”一个新问题 .....................19

2.1.1属性和标签的不同类型

决定模型的选择..................21

2.1.2新数据集的注意事项 ..........22

2.2分类问题:用声纳发现未

爆炸的水雷....................................23

2.2.1“ 岩石vs 水雷”数据集的

物理特性..............................23

2.2.2“ 岩石vs 水雷”数据集统计

特征......................................27

2.2.3用分位数图展示异常点 ......30

2.2.4类别属性的统计特征 ..........32

2.2.5利用Python Pandas 对“岩石

vs水雷”数据集进行统计

分析......................................32

2.3对“岩石vs 水雷数据集”属性的

可视化展示....................................35

2.3.1利用平行坐标图进行可视化

展示......................................35

2.3.2属性和标签的关系可视化 .....37

2.3.3用热图(heat map)展示

属性和标签的相关性..........44

2.3.4对“岩石vs. 水雷”数据集

探究过程小结......................45

2.4基于因素变量的实数值预测-

鲍鱼的年龄....................................45

2.4.1回归问题的平行坐标图- 鲍鱼

问题的变量关系可视化......51

2.4.2回归问题如何使用关联热

图-鲍鱼问题的属性对关

系的可视化..........................55

2.5用实数值属性预测实数值目标:

评估红酒口感................................57

2.6多类别分类问题:它属于哪种

玻璃.................................................63

小结............................................................68

参考文献...................................................69

第3章 预测模型的构建:平衡性

能、复杂性以及大数据....71

3.1基本问题:理解函数逼近..........71

3.1.1使用训练数据 ......................72

3.1.2评估预测模型的性能 ..........73

3.2影响算法选择及性能的因素——

复杂度以及数据...........................74

3.2.1简单问题和复杂问题的

对比......................................74

3.2.2一个简单模型与复杂模型的

对比......................................77

3.2.3影响预测算法性能的因素 ....80

3.2.4选择一个算法:线性或者

非线性..................................81

3.3度量预测模型性能 .......................81

3.3.1不同类型问题的性能评价

指标......................................82

3.3.2部署模型的性能模拟 ..........92

3.4模型与数据的均衡 .......................94

3.4.1通过权衡问题复杂度、模型

复杂度以及数据集规模来选

择模型..................................94

3.4.2使用前向逐步回归来控制过

拟合......................................95

3.4.3评估并理解你的预测模型....101

3.4.4通过惩罚回归系数来控制

过拟合——岭回归............103

小结..........................................................112

参考文献.................................................112

第4章 惩罚线性回归模型 ..........113

4.1为什么惩罚线性回归方法如此

有效...............................................113

4.1.1足够快速地估计系数 ........114

4.1.2变量的重要性信息 ............114

4.1.3部署时的预测足够快速 ....114

4.1.4性能 ............................114

4.1.5稀疏解 ................................115

4.1.6问题本身可能需要线性

模型....................................115

4.1.7什么时候使用集成方法 ....115

4.2惩罚线性回归:对线性回归进行

正则化以获得性能............115

4.2.1训练线性模型:最小化错误

以及更多............................117

4.2.2向OLS 公式中添加一个

系数惩罚项........................118

4.2.3其他有用的系数惩罚项:

Manhattan以及ElasticNet .....118

4.2.4为什么套索惩罚会导致稀疏的

系数向量............................119

4.2.5ElasticNet 惩罚项包含套索

惩罚项以及岭惩罚项........120

4.3求解惩罚线性回归问题 ............121

4.3.1理解最小角度回归与前向逐步

回归的关系........................121

4.3.2LARS 如何生成数百个不同

复杂度的模型....................125

4.3.3从数百个LARS 生成结果中

选择模型....................127

4.3.4使用Glmnet :非常快速

并且通用............................133

4.4基于数值输入的线性回归方法的

扩展...............................................140

4.4.1使用惩罚回归求解分类

问题....................................140

4.4.2求解超过2 种输出的分类

问题....................................145

4.4.3理解基扩展:使用线性方法来

解决非线性问题................145

4.4.4向线性方法中引入非数值

属性....................................148

小结..........................................................152

参考文献.................................................153

第5章 使用惩罚线性方法来

构建预测模型.....................155

5.1惩罚线性回归的Python 包 .....155

5.2多变量回归:预测红酒口感 ...156

5.2.1构建并测试模型以预测红酒

口感....................................157

5.2.2部署前在整个数据集上进行

训练....................................162

5.2.3基扩展:基于原始属性扩展

新属性来改进性能............168

5.3二分类:使用惩罚线性回归来

检测未爆炸的水雷.....................172

5.3.1构建部署用的岩石水雷

分类器................................183

5.4多类别分类- 分类犯罪现场的

玻璃样本......................................196

小结..........................................................201

参考文献.................................................202

第6章 集成方法 .................................203

6.1二元决策树 ..................................203

6.1.1如何利用二元决策树进行

预测....................................205

6.1.2如何训练一个二元决策树....207

6.1.3决策树的训练等同于

分割点的选择....................211

6.1.4二元决策树的过拟合 ........214

6.1.5针对分类问题和类别特征

所做的修改........................218

6.2自举集成:Bagging 算法 .........219

6.2.1Bagging 算法是如何

工作的................................219

6.2.2Bagging 算法小结 .............230

6.3梯度提升法(Gradient

Boosting).....................................230

6.3.1梯度提升法的基本原理 ....230

6.3.2获取梯度提升法的

性能....................................234

6.3.3针对多变量问题的梯度

提升法................................237

6.3.4梯度提升方法的小结 ........241

6.4随机森林 ......................................241

6.4.1随机森林:Bagging 加上随机

属性子集............................246

6.4.2随机森林的性能 ................246

6.4.3随机森林小结 ....................247

6.5小结 ...............................................248

6.6参考文献 ......................................248

第7章 用Python 构建集成

模型............................................251

7.1用Python 集成方法工具包解决

回归问题......................................251

7.1.1构建随机森林模型来预测

红酒口感............................251

7.1.2用梯度提升预测红酒品质 ....258

7.2用Bagging 来预测红酒口感 ....266

7.3Python 集成方法引入非数值

属性...............................................271

7.3.1对鲍鱼性别属性编码引入

Python随机森林回归

方法....................................271

7.3.2评估性能以及变量编码的

重要性................................274

7.3.3在梯度提升回归方法中引入

鲍鱼性别属性....................276

7.3.4梯度提升法的性能评价以及

变量编码的重要性............279

7.4用Python 集成方法解决二分类

问题...............................................282

7.4.1用Python 随机森林方法探测

未爆炸的水雷....................282

7.4.2构建随机森林模型探测未

爆炸水雷............................283

7.4.3随机森林分类器的性能 ....288

7.4.4用Python 梯度提升法探测

未爆炸水雷........................289

7.4.5梯度提升法分类器的性能....296

7.5用Python 集成方法解决多类别

分类问题......................................300

7.5.1用随机森林对玻璃进行

分类....................................300

7.5.2处理类不均衡问题 ............304

7.5.3用梯度提升法对玻璃进行

分类....................................306

7.5.4评估在梯度提升法中使用随机

森林基学习器的好处........311

7.6算法比较 ......................................313

小结..........................................................315

参考文献.................................................315

网友评论(不代表本站观点)

来自shfans**的评论:

很好!很好!很好!

2017-11-01 15:12:00
来自阿裤儿**的评论:

包装不错,纸箱结实。快递员服务很好,送到小区门口,很耐心。就是有两本门缺货,没有送。

2017-07-31 13:02:46
来自zjt梦回**的评论:

上手很快,概念和代码均有详细介绍,而且介绍的几种算法都是主流的,挺适合新手和实战学习的

2017-08-03 10:20:22
来自无昵称**的评论:

很快,很好,很开心。正版包装,外有塑料膜。

2017-08-07 18:59:20
来自匿名用**的评论:

总体来说不错的,物流很快,质量很好

2017-08-21 10:25:25
来自匿名用**的评论:

这本书还没有时间读,默认给好评

2017-08-23 16:47:39
来自无昵称**的评论:

书籍还行,比国内同类型的书还是要好的多

2017-08-25 11:45:21
来自无昵称**的评论:

ting不错de,挺详细的~赞

2017-08-30 16:42:07
来自dfjx**的评论:

书不错,包装也好,有时间好好看。

2017-09-03 00:31:51
来自冯现大**的评论:

还没看,应该还行

2017-09-29 21:47:42
来自沐***(**的评论:

还好吧。。。有空学习一下。

2017-10-06 11:26:40
来自无昵称**的评论:

很好的一本书

2017-10-24 08:15:54
来自无昵称**的评论:

还没读,不过感觉不错

2017-10-25 19:58:14
来自李洁老**的评论:

买来学习机器学习的,有空就翻翻,发货速度很快,第二天就到货。

2017-10-25 23:23:38
来自***(匿**的评论:

书中太多代码了,而且代码里面还没有注解,觉得写得不太认真,不值得这个价钱

2017-05-04 00:05:35
来自大大大**的评论:

1分给印刷,1分给纸张,1分给还算详细的介绍;遗留的不少机器翻译扣1分,不少缩进、代码的符号错误扣1分

2017-03-28 22:21:54
来自梅***(**的评论:

有点买错了,暂时好像还用不到。还需要继续学习。

2017-09-28 21:34:30
来自g***1(**的评论:

这是目前机器学习介绍比较清楚的书。很多书十分数学化,我想大部分用户还是更关心利用机器学习可以解决什么问题。该书中介绍的众多分类案例,可以为读者模型选型作参考

2017-01-17 13:12:19
来自匿名用**的评论:

数学公式推导下,代码动手敲,基本知识就全懂了

2017-05-20 17:55:33
来自r***l(**的评论:

应用类,可以参考学习,和其他机器学习一样都是浅

2017-06-15 08:18:29
来自匿名用**的评论:

满二百减一百时候买的,很不错,书的内容正在学习

2017-06-18 09:13:34
来自匿名用**的评论:

关于机器学习方法选择的书,有源代码,很不错,需要有python基础

2017-06-05 08:58:26
来自无昵称**的评论:

挺好的 比较满意挺好的 比较满意挺好的 比较满意

2017-08-03 20:21:10
来自H***o(**的评论:

这个商品( ^_^ )不错嘛,当当活动,有减满。搞机器学习的,python还需要好好学学。

2017-06-02 14:34:41
来自无昵称**的评论:

其实就是现代版周易,研究大数据周期性变化规律

2017-10-13 18:16:43
来自三***侯**的评论:

挺好,个人觉得比较适合入门的,但是尽信书不如无书,里面有些文字错误和翻译错误的,得自己辨别

2017-05-02 11:38:50
来自无昵称**的评论:

翻译生硬,文字排版错误很多,一直以为人民邮电出版社的书都是精品,可惜这本书颠覆了我的印象。买了那么多年书而从不评价的我都忍不住吐槽,不建议购买

2017-06-21 10:23:28
来自匿名用**的评论:

纸质可以,有点光滑,粗略看了一下内容还可以,但有些和机器学习实战重复的!代码是在ubuntu系统下运行,要是window下要适当修改!

2017-04-03 23:36:44
登录后即可发表评论

免责声明

更多相关图书
在线咨询