IBM SPSS数据分析与挖掘实战案例精粹图书
人气:15

IBM SPSS数据分析与挖掘实战案例精粹

业内博学专家十余年实战经验总结,从上千个真实案例中精选出 18个案例,帮助读者迅速成长为真正的数据分析与挖掘高手!

内容简介

全书以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。本书所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。

本书适合从初学者到专家各个级别的数据分析人员阅读,尤其适合于以下读者群:需要提升实战能力的数据分析专业人员;在市场营销、金融、财务、人力资源管理中需要应用数据分析的人士;从事咨询、科研等工作的专业人士;同时也适合于各专业的本科和研究生作为学习数据分析应用的参考书。

编辑推荐

全书以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。本书所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。

本书适合从初学者到专家各个级别的数据分析人员阅读,尤其适合于以下读者群:需要提升实战能力的数据分析专业人员;在市场营销、金融、财务、人力资源管理中需要应用数据分析的人士;从事咨询、科研等工作的专业人士;同时也适合于各专业的本科和研究生作为学习数据分析应用的参考书。

作者简介

张文彤 博士,数据挖掘、市场研究、统计软件教学与应用领域专家,现任全球第八大市场研究集团INTAGE中国公司全国技术总监。曾在复旦大学任教数载,期间协助SPSS在中国建立并完善了其培训体系,是国内知名的SPSS培训师之一。在数据挖掘、市场研究、医药数据分析等领域均经验丰富,曾负责为知名跨国公司完成了中国城市女性市场细分模型、销量预测模型、商圈选址模型等各类项目,并协助完成多项IT、电信、税务、银行等行业的数据挖掘项目。

钟云飞 博学数据分析专家,拥有超过10年的统计分析与数据挖掘在各行业的软件应用及咨询经验,历任SPSS、SAS软件公司首席咨询顾问,目前在国际商业机器(中国)有限公司软件部工作,从事SPSS软件企业应用的推广工作。主要关注统计分析与数据挖掘在银行、电信、政府、保险、零售等行业的应用实践,致力于使用数据分析方法帮助企业和政府组织从数据中获取有价值的信息,从而提高管理水平。

目录

1.1 三种数据分析方法论 3

1.1.1 严格设计支持下的统计

方法论 3

1.1.2 半试验研究支持下的统计

方法论 4

1.1.3 偏智能化、自动化分析的

数据挖掘应用方法论 5

1.2 CRISP-DM方法论介绍 6

1.2.1 概述 6

1.2.2 商业理解 8

1.2.3 数据理解 8

1.2.4 数据准备 9

1.2.5 建立模型 9

1.2.6 模型评价 9

1.2.7 结果部署 10

第2章 数据分析方法体系简介 11

2.1 统计软件中的数据存储格式 11

2.1.1 二维数据表 11

2.1.2 变量的存储类型 12

2.1.3 变量的测量尺度 12

2.2 数据的统计描述与参数估计 13

2.2.1 连续变量的统计描述 13

2.2.2 连续变量的参数估计 16

2.2.3 分类变量的统计描述和参数

估计 18

2.2.4 统计图形体系 21

2.3 常用假设检验方法 24

2.3.1 假设检验的基本原理 25

2.3.2 单变量假设检验方法 26

2.3.3 双变量假设检验方法 28

2.4 多变量模型 31

2.4.1 方差分析/一般线性模型 31

2.4.2 广义线性模型和混合线性

模型 32

2.4.3 回归模型 34

2.4.4 其他常见模型 36

2.5 多元统计分析模型 38

2.5.1 信息浓缩 38

2.5.2 变量间内在关联结构的

探讨 38

2.5.3 数据分类 39

2.5.4 分析元素间的关联 41

2.6 智能统计分析/数据挖掘方法 42

2.6.1 树模型 42

2.6.2 神经网络 43

2.6.3 支持向量机 43

2.6.4 贝叶斯网络 44

2.6.5 最近邻元素分析 44

2.6.6 关联规则与序列分析 44

第3章 IBM SPSS Statistics操作

入门 46

3.1 案例背景 46

3.2 数据文件的读入与变量整理 47

3.2.1 SPSS的基本操作界面 47

3.2.2 数据准备 49

3.3 问卷数据分析 53

3.3.1 生成频数表 53

3.3.2 计算均值 54

3.3.3 对多选题进行描述 55

3.4 项目总结和讨论 56

第4章 IBM SPSS Statistics操作

进阶 57

4.1 案例背景 57

4.1.1 项目背景 57

4.1.2 分析思路 59

4.2 问卷录入 59

4.2.1 开放题的定义 59

4.2.2 单选题的定义 60

4.2.3 多选题的定义 60

4.3 问卷质量校验 62

4.3.1 去除重复记录 62

4.3.2 发现异常值 64

4.3.3 逻辑校验 65

4.4 问卷数据分析 67

4.4.1 问卷加权 67

4.4.2 业务分析 70

4.5 项目总结和讨论 71

第5章 IBM SPSS Modeler操作入门 73

5.1 IBM SPSS Modeler概述 73

5.1.1 IBM SPSS Modeler的界面 73

5.1.2 IBM SPSS Modeler的架构

与产品构成 76

5.2 IBM SPSS Modeler相关操作

与技巧 77

5.2.1 IBM SPSS Modeler的基本

操作 77

5.2.2 IBM SPSS Modeler中的

表达式 79

5.2.3 IBM SPSS Modeler的若干

使用技巧 79

5.3 IBM SPSS Modeler功能介绍 81

5.3.1 数据整理案例 81

5.3.2 探索性数据分析案例 82

5.3.3 建立模型、模型检验与模型

应用案例 83

5.4 案例分析:药物选择决策支持 86

5.4.1 背景介绍 86

5.4.2 数据说明 86

5.4.3 商业理解 87

5.4.4 数据理解 87

5.4.5 数据准备 88

5.4.6 模型建立和评估 89

5.4.7 模型 91

5.5 如何进一步学习IBM SPSS

Modeler 93

第二部分 影响因素发现与数值预测

第6章 酸奶饮料新产品口味测试

研究案例 97

6.1 案例背景 97

6.1.1 研究项目概况 97

6.1.2 分析思路与商业理解 98

6.2 数据理解 98

6.2.1 研究设计框架复查 98

6.2.2 均值的列表描述 99

6.2.3 均值的图形描述 101

6.3 不同品牌的评分差异分析 102

6.3.1 单因素方差分析模型简介 103

6.3.2 品牌作用的总体检验 104

6.3.3 组间两两比较 105

6.3.4 方差齐性检验 108

6.4 两因素方差分析模型分析 108

6.4.1 两因素方差分析模型简介 109

6.4.2 拟合包括交互项的饱

和模型 110

6.4.3 拟合只包含主效应的模型 111

6.4.4 组间两两比较 112

6.4.5 随机因素分析 114

6.5 分析结论与讨论 116

6.5.1 分析结论 116

6.5.2 Benchmark:用还是不用 116

第7章 偏态分布的激素水平影响

因素分析 118

7.1 案例背景 118

7.1.1 研究项目概况 118

7.1.2 分析思路与商业理解 119

7.2 数据理解 119

7.2.1 单变量描述 119

7.2.2 变量关联探索 122

7.3 对因变量变换后的建模分析 127

7.3.1 常见的变量变换方法 127

7.3.2 本案例的具体操作 128

7.4 秩变换分析 131

7.5 利用Cox模型进行分析 132

7.5.1 Cox回归模型的基本原理 133

7.5.2 本案例的具体操作 134

7.6 项目总结与讨论 136

7.6.1 分析结论 136

7.6.2 如何正确选择分析模型 136

第8章 某车企汽车年销量预测案例 138

8.1 案例背景 138

8.1.1 研究项目概况 138

8.1.2 分析思路和商业理解 139

8.2 数据理解 140

8.3 变量变换后的线性回归 142

8.3.1 线性回归模型简介 142

8.3.2 变量变换后拟合线性回归

模型 143

8.3.3 模型拟合效果的判断 146

8.3.4 存储预测值和区间估计值 148

8.4 曲线拟合 148

8.4.1 用曲线估计过程同时拟合

多个曲线模型 149

8.4.2 模型拟合效果的判断 151

8.4.3 模型的预测 153

8.5 利用非线性回归进行拟合 154

8.5.1 模型简介 154

8.5.2 构建分段回归模型 155

8.5.3 不同模型效果的比较 157

8.6 项目总结与讨论 158

8.6.1 分析结论 158

8.6.2 行走在理想与现实之间 158

第9章 脑外伤急救后迟发性颅脑损伤

影响因素分析案例 160

9.1 案例背景 160

9.1.1 研究项目概况 160

9.1.2 分析思路和商业理解 161

9.2 数据理解 161

9.2.1 变量关联的图表描述 161

9.2.2 变量关联的单变量检验 164

9.3 构建二分类Logistic回归模型 167

9.3.1 模型简介 167

9.3.2 初步尝试建模 169

9.3.3 构建最终模型 174

9.4 利用树模型发现交互项 175

9.4.1 模型简介 176

9.4.2 进行树模型分析 178

9.5 使用广义线性过程进行分析 181

9.5.1 模型简介 181

9.5.2 构建仅包括主效应的模型 182

9.5.3 在模型中加入交互项 185

9.6 项目总结与讨论 186

9.6.1 分析结论 186

9.6.2 尺有所短,寸有所长 187

第10章 中国消费者信心指数影响

因素分析 188

10.1 案例背景 188

10.1.1 项目背景 188

10.1.2 项目问卷 189

10.1.3 分析思路和商业理解 192

10.2 数据理解 193

10.2.1 考察时间、地域对信心

指数的影响 193

10.2.2 考察性别、职业、婚姻状况

等对信心指数的影响 195

10.2.3 考察年龄对信心指数的

影响 196

10.3 标准GLM框架下的建模分析 197

10.3.1 建立总模型 197

10.3.2 两两比较的结果 200

10.4 多元方差分析模型的结果 202

10.4.1 模型简介 202

10.4.2 拟合多元方差分析模型 203

10.5 尺度回归 209

10.5.1 方法简介 210

10.5.2 利用尺度回归进行

分析 211

10.6 多水平模型框架下的建模分析 214

10.6.1 模型简介 215

10.6.2 针对时间拟合多水平模型 216

10.7 项目总结与讨论 221

10.7.1 分析结论 221

10.7.2 什么时候运用复杂模型

来建模 222

第三部分 信息浓缩、分类与感知图呈现

第11章 探讨消费者购买保健品的

动机 225

11.1 案例背景 225

11.1.1 研究项目概况 225

11.1.2 分析思路和商业理解 227

11.2 数据理解 227

11.2.1 单变量描述 227

11.2.2 变量关联探索 228

11.3 利用因子分析进行信息浓缩 229

11.3.1 模型简介 229

11.3.2 因子分析的具体操作 231

11.4 基于因子分析结果进行市场细分 238

11.4.1 不同婚姻状况受访者的

差异 238

11.4.2 不同品牌保健品使用者的

因子偏好差异 240

11.5 项目总结与讨论 241

11.5.1 研究结论 241

11.5.2 合理解读因子分析的结果 242

第12章 1988年汉城奥运会男子十项

全能成绩分析 244

12.1 案例背景 244

12.1.1 项目概况 244

12.1.2 分析思路和商业理解 245

12.2 数据理解 246

12.2.1 单变量描述 246

12.2.2 变量关联性探索 246

12.2.3 尝试初步建模 247

12.3 利用因子分析进行信息浓缩 249

12.3.1 初步分析 249

12.3.2 因子旋转 252

12.3.3 继续寻找更好的分析结果 253

12.3.4 结果存储与 254

12.4 主成分回归 255

12.5 将主成分回归方程还原回原始

变量的形式 257

12.6 项目总结与讨论 257

12.6.1 研究结论 257

12.6.2 正确诠释因子的方差解释

比例 258

第13章 打败SARS 259

13.1 案例背景 259

13.1.1 研究项目概况 259

13.1.2 分析思路和商业理解 262

13.2 数据理解与数据准备 263

13.2.1 消费者关注的信息 263

13.2.2 突发事件保险产品购买

倾向 265

13.2.3 未来消费者生活方式的

变化 267

13.3 “非典”信息关注倾向的多维偏好

分析 269

13.3.1 模型简介 269

13.3.2 多维偏好分析的SPSS

操作 270

13.3.3 尝试初步建模 272

13.3.4 引入更多的背景变量 275

13.4 突发事件险种购买倾向的多重

对应分析 278

13.4.1 模型简介 278

13.4.2 简单对应分析 280

13.4.3 多重对应分析 284

13.5 “非典”对未来生活方式的影响 289

13.5.1 采用多维偏好分析进行

初步探索 289

13.5.2 换用因子分析进行信息

汇总 291

13.6 项目总结与讨论 295

13.6.1 研究结论 295

13.6.2 对多维偏好分析等信息浓缩

方法本质的讨论 297

第14章 住院费用影响因素挖掘 299

14.1 案例背景 299

14.1.1 项目概况 299

14.1.2 分析思路/商业理解 302

14.2 数据理解与数据准备 303

14.2.1 费用数据分布 303

14.2.2 变量合并 305

14.2.3 极端值清理 306

14.2.4 病种分布考察 306

14.2.5 变量变换 307

14.3 采用聚类分析寻找费用类型 308

14.3.1 用因子分析汇总信息 308

14.3.2 聚类分析方法简介 310

14.3.3 对费用数据进行聚类分析 312

14.4 住院费用影响因素的神经网络

分析 315

14.4.1 模型简介 316

14.4.2 初步尝试用神经网络建模 318

14.4.3 对年龄离散化后重新建模 323

14.4.4 构建双因变量神经网络 325

14.4.5 进一步寻找更清晰的结果

解释 327

14.5 不同疗法疗效与费用比较的神经

网络分析 328

14.5.1 生成工作用数据集 329

14.5.2 进行神经网络的建模预测 330

14.5.3 模型预测值的比较 332

14.6 项目总结与讨论 334

14.6.1 研究结论 334

14.6.2 数据挖掘方法和经典方法的

取舍 335

第四部分 数据挖掘案例精选

第15章 淘宝大卖家之营销数据

分析 339

15.1 案例背景 339

15.1.1 卖家张三 339

15.1.2 分析思路和商业理解 340

15.2 利用RFM模型定位促销名单 341

15.2.1 RFM模型简介 341

15.2.2 对数据进行RFM模型

分析 343

15.3 寻找有重购行为买家的特征 348

15.3.1 数据理解与数据准备 348

15.3.2 利用直销模块寻找重购

人群的特征 354

15.4 总结与讨论 356

15.4.1 可使用的其他营销分析

方法 356

15.4.2 研究总结 357

第16章 超市商品购买关联分析 358

16.1 案例背景 358

16.1.1 研究背景 358

16.1.2 分析思路和商业理解 358

16.2 数据准备 359

16.3 商品购买关联分析 362

1

网友评论(不代表本站观点)

来自朱振义**的评论:

印刷有缺页现象,从50页直接到了67页,其他的都还好,内容详细,但不适合入门级学员,看这本书最好有一定SPSS基础和数理统计知识

2015-08-13 11:08:01
来自无昵称**的评论:

很好,不过需要一定基础才读的懂,而且唯一不足是书中比较喜欢让人参考前面某章某节,很不方便

2016-03-19 23:46:51
来自ironman**的评论:

果然为SPSS高级教程,内容非常好,总共买了8本相关专业书,这本是我见过最好的一本!初学者不建议买这本,可以买张文彤编写的初级教程。中级以上水平者可以参考。

2013-07-27 20:48:46
来自色亦菲**的评论:

不错~一直在当当买书,比其他的电商感觉要好。书的包装都很新,还没有看很期待迅速掌握它。

2016-12-12 16:24:08
来自学习的**的评论:

例子蛮有意思的,就是实际导到电脑里操作还需要好好研究研究。

2016-10-09 08:13:06
来自无昵称**的评论:

张老师的前一版书用了觉得特别好,现在把新版的基础,高级,数据分析三本都备齐了,潜心学习中。

2015-01-16 16:46:14
来自无昵称**的评论:

数据分析与挖掘实战案例精粹,发货速度很快,及时让我遇到的困难得到解决,非常感谢

2013-10-29 11:18:20
来自无昵称**的评论:

好好好好好好好好好好好好好好好好32个赞

2017-08-18 11:38:19
来自一株草5**的评论:

书很详细,作者在这方面很有经验,阅读后能学到不少东西,有些关键点作者都指出来了,读后有共鸣!

2016-11-01 21:18:12
来自匿名用**的评论:

应该还不错同学买的,我问他问题他就在这本书上查完了教我

2017-07-22 10:09:22
来自王天宫**的评论:

很实用,介绍得简要清楚,范例实用性强,正好是我需要的。很实用,介绍得简要清楚,范例实用性强,正好是我需要的。很实用,介绍得简要清楚,范例实用性强,正好是我需要的。

2014-12-14 10:34:47
来自推移算**的评论:

IBM SPSS数据分析与挖掘实战案例精粹 几天前买的,今天刚开始看,但是这个黄黄的东西是什么啊染了五六页纸...

2017-10-24 18:35:52
来自无昵称**的评论:

挺好的,看了些,前面是spss两款软件的基本操作介绍,后面是例子

2017-09-21 19:25:18
来自用户不**的评论:

数据分析与挖掘实战案例精粹中案例精辟,不仅能学会spss的操作,也会学会统计分析的经典模型。

2014-04-30 16:00:07
来自无昵称**的评论:

细细读真的可以学到很多,作者通过每个案例细细分析每个参数的含义,如何将数学语言联系到实际分析案例讨论中。让我这个菜鸟中新手都想着手做分析论文了。

2015-03-22 23:01:41
来自无昵称**的评论:

适合有数据分析底子的人学习 一开始学习的不建议

2015-01-26 21:31:19
来自无昵称**的评论:

肯定是全5分的。张文彤老师编的书,还是一如既往的好。50块钱买这么一本厚的书,值了。更关键的是,书里面传递出来的现实事例背后的统计分析思维,这个最重要。倘若看本书时能结合张老师在人大经济论坛上的培训视频(初级和中高级),那更是受益匪浅。强烈推荐本书。

2014-12-17 16:35:37
来自无昵称**的评论:

IBM SPSS数据分析与挖掘实战案例精粹(配光盘)不错的

2013-08-16 19:45:55
来自无昵称**的评论:

整体感觉真的很不错~头一天晚上下的订单,第二天中午就送到了,特别方便便捷~书肯定是正版的了,质量就不用说什么了,值得信赖!!!小票和发票都有,很正规,而且价格比其他网站上的要便宜,因此性价比很高,何乐而不为呢~!!!

2015-06-12 15:56:56
来自无昵称**的评论:

市面上SPSS的书很多,还在犹豫买不买的时候,看到张文彤老师的大名就立刻下单了。推荐的三个理由:第一,张老师在SPSS高级统计方面的确很有见地;第二,目前市面上在新版本界面的著作不多;最后,书中很多实例,既帮助操作,又加深理解。

2013-07-26 21:47:51
来自捌捌捌**的评论:

一直想找一本案例多的操作书,无疑这些书比较让人满意,数据分析与工具操作还不错。值得好好学习一下,按图操作具体案例。可以收藏学习使用。

2017-11-06 14:34:50
来自无昵称**的评论:

首先作者的名字让我选择了这本书,但也是这个选择让我不能理解大家的思想。这本书偏向于见建模,是站在一个已经掌握了SPSS基本知识,方法的基础上编辑的专业书。有很强计算机基础、并且向解决生活中一些数据分析的人建议购买。初学者不建议购买。

2013-08-17 16:18:48
来自无昵称**的评论:

习第二部分影10响因素发现与数值预测第章酸奶饮K料新产品口M味10测试研究案例案例背景数据理解不同品牌的评分差异IBM SPSS数据分析与挖掘实战案例精粹(配光盘)推荐语  业内资深专家十余年实战经验总结,从上千个真

2015-10-16 08:33:59
登录后即可发表评论

免责声明

更多相关图书
在线咨询