Stata 环境下的数据管理实务手册图书
人气:9

Stata 环境下的数据管理实务手册

数据管理是介于原始数据收集和统计分析之间的一项重要工作,其包含了数据分析中那些挑战性的方面。《Stata环境下的数据管理实务手册》从Stata入手,展示了Stata在管理数据工作中的作用,而非仅仅是其在统计上的优...
  • 所属分类:图书 >管理>管理信息系统  
  • 作者:[美][迈克尔·N·米歇尔Michael] [N.Mitchell]
  • 产品参数:
  • 丛书名:--
  • 国际刊号:9787300182391
  • 出版社:中国人民大学出版社
  • 出版时间:2016-05
  • 印刷时间:2016-05-01
  • 版次:1
  • 开本:128开
  • 页数:--
  • 纸张:胶版纸
  • 包装:平装
  • 套装:

内容简介

数据管理是介于原始数据收集和统计分析之间的一项重要工作,其包含了数据分析中那些挑战性的方面。《Stata环境下的数据管理实务手册》从Stata入手,展示了Stata在管理数据工作中的作用,而非仅仅是其在统计上的优势。

编辑推荐

一本非常实用的社会统计软件Stata数据管理的指导书!

有效提升大数据时代的数据管理能力和处理能力!

社会科学工作者、数据工作者的数据管理参考书!

手把手逐步演示数据管理的流程,易上手,易操作,突出实务!

国际Stata出版社授权,中国人民大学中国调查与数据中心翻译,、经得起检验的数据管理实务手册。

一本生动可读的数据管理书。作者就像是一个坐在对面娓娓道来的讲故事的人,将数据管理的流程和步骤一一展现,让我们重新认识到Stata在数据管理方面的迷人魅力。大数据时代,让数据为我所用,易用,乐用,是这本书的一个出发点。

该书的翻译也是可圈可点的,,流畅,译者唐丽娜不亏是科班出身并长期致力于社会统计的专家,她在社会数据的管理与统计方面的专业经验,以及在CGSS(中国综合社会调查)项目中丰富的实操经验,也极大保障了这本书的翻译质量。

作者简介

迈克尔 N 米歇尔(Michael N. Mitchell),是一位医疗卫生服务领域的高级统计师。12年来,他一直在加州大学洛杉矶分校学术技术服务部门的统计咨询组工作。所著书籍有A Visual Guide to Stata Graphics,Interpreting and Visualizing Regression Models Using Stata,Stata for the Behavioral Sciences等。

唐丽娜,社会学博士,就职于中国人民大学中国调查与数据中心。研究领域为宗教社会学、社会调查方法与技术、社会科学数据管理及数据可视化、数据库建设。

目录

及时章 入门介绍

1.1 本书的使用

1.2 本书的概要

1.3 本书使用的案例

第二章 读取和录入数据

2.1 简 介

2.2 读入Stata数据

2.3 保存Stata数据

2.4 读取逗号或制表符作分隔符的文件

2.5 读取空格作分隔符的文件

2.6 读取固定格式文件

2.7 读取一条观测值包含多行原始数据的固定格式的文件

2.8 读取SAS XPORT文件

2.9 读取数据时的常见错误

2.10 在Stata数据编辑器中直接输入数据

2.11 保存逗号或制表符作分隔符的文件

2.12 保存空格作分隔符的文件

2.13 保存SAS XPORT文件

第三章 数据清理

3.1 简 介

3.2 数据的双录

3.3 单个变量检查

3.4 用分类变量检查分类变量

3.5 用连续变量检查分类变量

3.6 用连续变量检查连续变量

3.7 修正数据中的错误

3.8 识别重复录入

3.9 关于数据清理的总结性思考

第四章 给数据加标签

4.1 简 介

4.2 描述数据

4.3 给变量加标签 4.4 给取值加标签

4.5 标签的作用

4.6 用不同的语言给变量和取值加标签

4.7 给数据添加注释

4.8 格式化变量的显示

4.9 改变数据中的变量顺序

第五章 创建变量

5.1 简 介

5.2 创建和修改变量

5.3 数值表达式和函数

5.4 字符表达式和函数

5.5 重新编码

5.6 给缺失值编码

5.7 虚拟变量

5.8 日期变量

5.9 日期-时间变量

5.10 变量间的计算

5.11 个案间的计算

5.12 更多的使用egen命令的例子

5.13 把字符型变量转换成数值型变量

5.14 把数值型变量转换成字符型变量

5.15 变量重命名和变量排序

第六章 合并数据

6.1 简 介

6.2 添加数据

6.3 添加数据时存在的问题

6.4 一对一匹配合并数据

6.5 一对多匹配合并数据

6.6 合并多个数据

6.7 更新合并

6.8 合并数据时的其他选项

6.9 合并数据时的问题

6.10 连接数据

6.11 交叉合并数据

第七章 处理分组的观测值

7.1 简 介

7.2 为每个分组获取独立的结果

7.3 分组独立计算数值

7.4 组内计算:加下标的观测值

7.5 组内计算:跨观测值计算

7.6 组内计算:求和

7.7 组内计算:更多示例

7.8 比较by命令和tsset命令

第八章 改变数据形状

8.1 简 介

8.2 宽数据和长数据

8.3 长数据转换成宽数据

8.4 长数据转宽数据时的问题

8.5 宽数据转换成长数据

8.6 宽数据转长数据时的问题

8.7 多层次数据

8.8 延展数据

第九章 数据管理编程

9.1 简 介

9.2 对数据管理长期目标的建议

9.3 执行do文件和制作日志文件

9.4 数据检验的自动化

9.5 合并do文件

9.6 介绍Stata中的宏

9.7 使用Stata中的宏

9.8 通过变量循环实现命令的重复执行

9.9 通过数字循环实现命令的重复执行

9.10 任何数据管理都能用循环实现命令的重复执行

9.11 获取Stata命令保存的结果

9.12 把estimation命令的结果保存为数据

9.13 编写Stata程序

第十章 附加资源

10.1 本书的在线资源

10.2 搜索并安装其他程序

在线预览

有个滤油机公司曾经做过这么一则广告:一个机修工一边修理一台发动机一边说, 如果能够定期给发动机换油,就可以不用修理它。那个机修工说:“你可以现在花钱,也可以等将来再花钱。”这里的暗示是你要么现在花3美元在一个滤油器上,要么将来花3 000美元去修理发动机。我觉得这是一个很好的类比,双录数据的努力(成本)相当于广告中滤油器的费用。开始的数据双录代价很小(在数据录入过程中拿出一定的时间来清理数据),但如果一开始只是单录数据,后期就需要付出更大的代价来清理数据(检查所有变量中可能出现的错误和不一致的地方)。如果你自己正在录入一份问卷或拿到其他的已经搜集好的原始资料,我强烈建议进行数据双录。本节将介绍如何用 Stata实现数据的双录。

数据双录,顾名思义,就是把同一数据录入两次,且保存成两个不同的数据文件。然后把两个数据文件做比对。如果出现不一致的地方,就意味着数据录入时出错了,然后可以通过检查原始资料(如原始问卷)找到正确的取值来纠正发现的错误。如果比对以后没有出现不一致的地方,也不一定证明录入的数据是正确的;因为也有可能两次数据录入的时候出错的方式是一样的。在大多数情况中,很难想象在两次录入出现一模一样的错误,这种事情不会经常发生。比如,假设调查用的是纸笔问卷,答案都是手填的,且两次是同一个人录入。及时次录入的时候把数字4误认为数字9,如果是同一个录入员,有可能把以后遇到的所有4都误认为9。这一点提示我们:独立双录数据是必要的,这样能够减少录入数据时重复犯错的可能性。

媒体评论

有人说收集数据就像收垃圾一样:收集之前就应该想好怎么处理它。

——罗素.福克斯,马克思.哥白尼和罗伯特.虎克

网友评论(不代表本站观点)

来自shoulde**的评论:

在看

2016-06-29 08:46:58
来自无昵称**的评论:

1万个赞

2016-07-01 22:53:46
来自无昵称**的评论:

非常满意!

2016-07-17 16:35:11
来自owllj**的评论:

一本很实用的书!好!!!!!

2016-07-21 11:24:53
来自王佳兵**的评论:

学术用书

2016-07-27 09:14:06
来自dreamss**的评论:

hao

2016-08-14 14:17:15
来自匿名用**的评论:

整体上感觉还不错。

2017-07-27 11:14:15
来自无昵称**的评论:

纸张很好!

2017-08-29 16:42:18
登录后即可发表评论

免责声明

更多相关图书
在线咨询