《贝叶斯方法 概率编程与贝叶斯推断》基于PyMC语言以及一系列常用的Python数据分析框架,如NumPy、SciPy和Matplotlib,通过概率编程的方式,讲解了贝叶斯推断的原理和实现方法。该方法常常可以在避免引入大量数学分析的前提下,有效地解决问题。书中使用的案例往往是工作中遇到的实际问题,有趣并且实用。作者的阐述也尽量避免冗长的数学分析,而让读者可以动手解决一个个的具体问题。通过对本书的学习,读者可以对贝叶斯思维、概率编程有较为深入的了解,为将来从事机器学习、数据分析相关的工作打下基础。本书适用于机器学习、贝叶斯推断、概率编程等相关领域的从业者和爱好者,也适合普通开发人员了解贝叶斯统计而使用。
国际杰出机器学习专家、地平线机器人技术创始人和CEO、前百度研究院执行院长余凯博士,腾讯专家研究员岳亚丁博士推荐、审校 内容涉及Python语言库PyMC,以及相关的工具,包括NumPy\SciPy\Matplotlib,无需复杂的数学分析,通过实例、从编程的角度介绍贝叶斯分析方法,大多数程序员都可以入门并掌握。 本书的内容特色: 学习贝叶斯思维方式 理解计算机如何进行贝叶斯推断 利用PyMC Python库进行编程来实现贝叶斯分析 利用PyMC建模以及调试 测试模型的拟合优度 打开马尔科夫链蒙特卡洛算法的黑盒子,看看它如何工作 利用大数定律的力量 掌握聚类、收敛、自相关、细化等关键概念 根据目标和预期的结果,利用损失函数来推断缺陷 选择合理的先验,并理解其如何随着样本量的大小而变化 克服“研发与开发”的困境:判断是否已经足够好了 利用贝叶斯推断改良A B测试 在可用数据量小的情况下,解决数据科学的问题
作者 Cameron Davidson-Pilon,接触过数学在多个领域的应用——从基因和疾病的动态演化,到金融价格的模型。他对于开源社区主要的贡献包括这本书以及lifelines项目。Cameron成长于加拿大的安大略省圭尔夫市,而就读于滑铁卢大学以及莫斯科独立大学。如今他住在安大略省渥太华市,并在电商领军者Shopify工作。 译者 辛愿,浙江大学硕士毕业,腾讯公司基础研究高级工程师,舆情系统开发经理。曾在百度从事推荐系统、用户画像、数据采集等相关研究工作,拥有多项专利,组织过上海大数据技术沙龙。目前专注于文本挖掘、舆情分析、智能聊天机器人等相关领域。 钟黎,腾讯公司研究员。曾在中国科学院、微软亚洲研究院、IBM研究院(新加坡)从事图像处理、语音处理、机器学习等相关研究工作,拥有多项专利,目前聚焦在自然语言处理、深度学习和人工智能等相关领域。 欧阳婷,华南理工大学硕士毕业,腾讯公司后台策略工程师。在电信、互联网行业参与过推荐系统、资源优化、KPI预测、用户画像等相关项目,拥有多项专利,目前聚焦在欺诈检测、时序分析、业务安全等相关领域。 审校者 余凯博士,地平线机器人技术创始人、CEO,国际杰出机器学习专家,中组部国家“千人计划”专家,中国人工智能学会副秘书长。余博士是前百度研究院执行院长,创建了百度深度学习研究院。他在百度所领导的团队在广告变现、搜索排序、语音识别、计算机视觉等领域做出杰出贡献,创纪录地连续三次获得公司高荣誉——“百度奖”。他还创建了中国公司自动驾驶项目,后发展为百度自动驾驶事业部。 岳亚丁博士,腾讯公司专家研究员,腾讯技术职级评委会基础研究岗位的负责委员。岳博士拥有19年在金融、电信、互联网行业的数据挖掘经验,主导或参与过用户画像、在线广告、推荐系统、CRM、欺诈检测、KPI预测等多种项目。他曾在微软(加拿大)从事行为定向广告的模型研发,另有11年的工程结构、海洋水文气象的力学研究及应用的工作经历。
目录
第1章贝叶斯推断的哲学1
1.1引言1
1.1.1贝叶斯思维1
1.1.2贝叶斯推断在实践中的运用3
1.1.3频率派的模型是错误的吗?4
1.1.4关于大数据4
1.2我们的贝叶斯框架5
1.2.1不得不讲的实例:抛硬币5
1.2.2实例:图书管理员还是农民6
1.3概率分布8
1.3.1离散情况9
1.3.2连续情况10
1.3.3什么是12
1.4使用计算机执行贝叶斯推断12
1.4.1实例:从短信数据推断行为12
1.4.2介绍我们的及时板斧:PyMC14
1.4.3说明18
1.4.4后验样本到底有什么用?18
1.5结论20
1.6补充说明20
1.6.1从统计学上确定两个l值是否真的不一样20
1.6.2扩充至两个转折点22
1.7习题24
1.8答案24
第2章进一步了解PyMC27
2.1引言27
2.1.1父变量与子变量的关系27
2.1.2PyMC变量28
2.1.3在模型中加入观测值31
2.1.4……33
2.2建模方法33
2.2.1同样的故事,不同的结局35
2.2.2实例:贝叶斯A B测试38
2.2.3一个简单的场景38
2.2.4A和B一起41
2.2.5实例:一种人类谎言的算法45
2.2.6二项分布45
2.2.7实例:学生作弊46
2.2.8另一种PyMC模型50
2.2.9更多的PyMC技巧51
2.2.10实例:挑战者号事故52
2.2.11正态分布55
2.2.12挑战者号事故当天发生了什么?61
2.3我们的模型适用吗?61
2.4结论68
2.5补充说明68
2.6习题69
2.7答案69
第3章打开MCMC的黑盒子71
3.1贝叶斯景象图71
3.1.1使用MCMC来探索景象图77
3.1.2MCMC算法的实现78
3.1.3后验的其他近似解法79
3.1.4实例:使用混合模型进行无监督聚类79
3.1.5不要混淆不同的后验样本88
3.1.6使用MAP来改进收敛性91
3.2收敛的判断92
3.2.1自相关92
3.2.2稀释95
3.2.3pymc.Matplot.plot()97
3.3MCMC的一些秘诀98
3.3.1聪明的初始值98
3.3.2先验99
3.3.3统计计算的无名定理99
3.4结论99
第4章从未言明的最伟大定理101
4.1引言101
4.2大数定律101
4.2.1直觉101
4.2.2实例:泊松随机变量的收敛102
4.2.3如何计算Var(Z)106
4.2.4期望和概率106
4.2.5所有这些与贝叶斯统计有什么关系呢107
4.3小数据的无序性107
4.3.1实例:地理数据聚合107
4.3.2实例:Kaggle的美国人口普查反馈比例预测比赛109
4.3.3实例:如何对Reddit网站上的评论进行排序111
4.3.4排序!115
4.3.5但是这样做的实时性太差了117
4.3.6推广到评星系统122
4.4结论122
4.5补充说明122
4.6习题123
4.7答案124
第5章失去一只手臂还是一条腿127
5.1引言127
5.2损失函数127
5.2.1现实世界中的损失函数129
5.2.2实例:优化“价格竞猜”游戏的展品出价130
5.3机器学习中的贝叶斯方法138
5.3.1实例:金融预测139
5.3.2实例:Kaggle观测暗世界 大赛144
5.3.3数据145
5.3.4先验146
5.3.5训练和PyMC实现147
5.4结论156
第6章弄清楚先验157
6.1引言157
6.2主观与客观先验157
6.2.1客观先验157
6.2.2主观先验158
6.2.3决策,决策……159
6.2.4经验贝叶斯160
6.3需要知道的有用的先验161
6.3.1Gamma分布161
6.3.2威沙特分布162
6.3.3Beta分布163
6.4实例:贝叶斯多臂老虎机164
6.4.1应用165
6.4.2一个解决方案165
6.4.3好坏衡量标准169
6.4.4扩展算法173
6.5从领域专家处获得先验分布176
6.5.1试验轮盘赌法176
6.5.2实例:股票收益177
6.5.3对于威沙特分布的专业提示184
6.6共轭先验185
6.7杰弗里斯先验185
6.8当N增加时对先验的影响187
6.9结论189
6.10补充说明190
6.10.1带惩罚的线性回归的贝叶斯视角190
6.10.2选择退化的先验192
第7章贝叶斯A B测试195
7.1引言195
7.2转化率测试的简单重述195
7.3增加一个线性损失函数198
7.3.1收入期望的分析198
7.3.2延伸到A B测试202
7.4超越转化率:t检验204
7.4.1t检验的设定204
7.5增幅的估计207
7.5.1创建点估计210
7.6结论211
术语表213
包装都不包裹一下,拿来书都破了
参考书,希望有用
好书,好内容。在大数据时代尤其对我有帮助
没有来得及细看.貌似是未来 的重要发展趋势.
值得一读的好书!
很好不错…
一本不错的理论书,挺好
好书推荐好书
值得购买 赞!
AI时代的来临,贝叶斯发力了
包装良好,印制精美。
包装良好,发货及时。舒适正版,我想要的。非常满意!
居然是彩印的
书看着纸质还可以,迫不及待要去学习了!
觉得书很不错
还没看,好像写的挺深奥
数学基础需要好好补一补
质量超级棒。比起上次的版本来说修正了很多错误。可以很全面的理解发展历程。这次的版本还是修正版本,读起来很爽快。作者的功力可以说是绝对的实力派。这么一大套书估计要读整整一年了。不过千里之行始于足下,不积跬步无以至千里。慢慢理解书中内容。加油了
很好很好很好
凑满五个字
13245
很好!!!
还不错。。值得拥有
感觉很不错,值得推荐
包装很好,看完再来评论
还没看,应该可以
书中错误不少,还是看英文原版的好,中文的当个参考吧
一直以为是主要讲方法的,原来主要是讲语言的…
这本书其实非常薄,内容还不错,从基础开始。适合新手阅读。最主要的是整本书都是彩色印刷,阅读体验非常棒。
二百一十多页,不算厚,排版不错,彩印,内容暂时没看
重要的颠覆性概念常一笔而过,简单的地方却啰嗦。翻一翻
接下来要做算法,贝叶斯也是很有必要学习的。很不错的一本书,内容不多,但是知识点都不错
不错的书,将统计思维和统计建模方法明白地展现出来。还有对Pymc库使用方法的直接指导。