应用统计学图书
人气:72

应用统计学

《应用统计学》介绍经济与管理学科中常用的统计分析理论与方法。《应用统计学》分七章。第1章为统计推断的基本内容,主要包括参数估计与检验,方差分析;第2章较为系统地介绍非参数统计检验的基本方法和原理;第3...
  • 所属分类:图书 >经济>统计/审计  
  • 作者:[吴和成]
  • 产品参数:
  • 丛书名:南京航空航天大学研究生系列精品教材
  • 国际刊号:9787030455406
  • 出版社:科学出版社
  • 出版时间:2016-06
  • 印刷时间:2015-09-18
  • 版次:31
  • 开本:16开
  • 页数:--
  • 纸张:--
  • 包装:平装
  • 套装:

内容简介

《应用统计学》介绍经济与管理学科中常用的统计分析理论与方法。《应用统计学》分七章。第1章为统计推断的基本内容,主要包括参数估计与检验,方差分析;第2章较为系统地介绍非参数统计检验的基本方法和原理;第3章主要介绍线性回归分析的理论和方法;第4章简要介绍非线性回归分析的基本原理和方法;第5章介绍主成分分析;第6章介绍因子分析模型;第7章介绍马尔可夫链的基本内容。

编辑推荐

《应用统计学》可作为经济学和管理学研究生的应用统计学教材,也可作为从事相关专业教学和研究的教师参考用书。

目录

前言

第1章统计推断

1.1随机变量及其分布

1.1.1常用的随机变量及其分布

1.1.2随机变量的矩

1.1.3分位点

1.2抽样分布及其常用统计量的分布

1.2.1简单随机样本

1.2.2抽样分布

1.3参数估计与假设检验

1.3.1参数估计

1.3.2参数假设检验

1.3.3假设检验中的两个问题

1.4方差分析

1.4.1单因素试验的方差分析

1.4.2双因素试验的方差分析

1.5本章小结

问题与思考

第2章非参数统计分析

2.1符号检验

2.1.1两个总体分布是否相同的符号检验

2.1.2总体中位数Me的检验

2.1.3数据序列的趋势存在性检验

2.1.4威尔科克森符号秩和检验

2.2秩和检验法

2.3多个样本的检验

2.3.1克鲁斯凯沃利斯单向方差秩检验

2.3.2费里德曼双向方差分析

2.4秩相关分析

2.4.1斯皮尔曼秩相关系数

2.4.2肯德尔 τ相关系数

2.5χ2检验法

2.5.1拟合优度检验

2.5.2独立性检验(列联表分析)

2.6正态性的检验法

2.7本章小结

问题与思考

第3章线性回归分析

3.1一元线性回归分析

3.1.1参数β0,β1的估计

3.1.2误差项ε的方差σ2的估计

3.1.3拟合回归线的性质

3.1.4正态误差回归模型

3.1.5线性回归模型中自变量与因变量之间联系的描述测度

3.1.6一元线性回归建模流程

3.2多元线性回归模型

3.2.1多元回归模型

3.2.2回归系数的涵义

3.2.3回归分析推断

3.2.4预测与控制

3.2.5自变量与因变量线性相关程度的度量指标

3.2.6多元线性回归模型中自变量的选择问题

3.3回归诊断

3.3.1残差及其性质

3.3.2误差项的异方差

3.3.3误差序列自相关性

3.3.4自变量的多重共线性

3.3.5异常点与强影响点

3.4含定性自变量的回归模型

3.4.1仅含定性自变量的回归模型

3.4.2对一个定量自变量和一个二值定性自变量的回归

3.4.3对于一个定量自变量和一个多值定性自变量的回归

3.4.4对于一个定量自变量和两个定性自变量的回归

3.5本章小结

问题与思考

第4章非线性回归分析

4.1可线性化的非线性回归模型

4.2多项式模型

4.2.1一元多项式模型

4.2.2二元多项式模型

4.3因变量为指示变量的回归

4.3.1回归模型

4.3.2关于误差项问题

4.3.3参数估计

4.4逻辑斯蒂回归模型

4.5本章小结

问题与思考

第5章主成分分析

5.1随机矩阵和随机样本

5.1.1随机矩阵

5.1.2随机样本

5.2总体主成分

5.2.1一般形式

5.2.2标准化变量的主成分

5.3样本主成分

5.4举例

问题与思考

第6章因子分析

6.1正交因子模型

6.2参数估计

6.2.1主成分法

6.2.2主因子法

6.2.3极大似然估计法

6.3因子旋转

6.3.1基本原理

6.3.2计算过程

6.4因子得分

6.4.1加权小二乘法

6.4.2回归分析法

6.5应用举例

问题与思考

第7章马尔可夫链

7.1随机过程的基本概念

7.1.1随机过程的定义

7.1.2有限维分布族

7.1.3独立增量过程与平稳过程

7.2泊松过程

7.2.1计数过程

7.2.2泊松过程的定义

7.3马尔可夫链

7.3.1马尔可夫性

7.3.2马尔可夫链的定义

7.3.3C-K方程

7.3.4遍历性

问题与思考

参考文献

附录

在线预览

第1章统计推断

房价问题是当前热门的话题之一。一个城市房价的均价总是扑朔迷离。一个房价均价每平方米8千元的经济较为发达的省会城市,可能对于年轻人具有较大的吸引力。现实却是想要购买每平方米1万元房子的愿望,也可能只有在城郊结合部才能实现。事实上,需要弄清楚的是这个城市房子均价的变化区间、不同楼盘均价之间的差异程度、在某一价位以上的楼盘占比多少、不同区位楼盘均价之间的差异及其差异的变化趋势等。当不能获得全部楼盘销售均价的数据时(实际上难以得到真实的数据),你如何来解决刚才提到的问题呢?

1.1随机变量及其分布

随机试验的结果未必都是数量化的,如检验产品是合格品还是不合格品,调查居民对某一改革措施赞成还是反对等,这些实验的结果并不是一个数值。为了研究随机实验的结果,揭示随机现象的统计规律性,需要将随机实验的结果数量化,即需要引入随机变量概念。

为理解随机变量的涵义,从一个统计学文献中常用的一个例子,即抛掷硬币以观察正反面出现情况的这一试验开始。例如,将硬币连续抛掷三次(看成一次随机试验),则所有可能结果的集合为这里,用H表示正面,T表示反面。显然,当硬币均匀时,这8个结果的出现等可能。将试验所有可能结果组成的集合Ω称为样本空间。如果仅将注意力集中在正面出现的次数上,如以X表示这一试验中正面出现的次数,则X可能的取值为0,1,2,3。且易知,X取这4个数的概率分别为1/8,3/8,3/8和1/8。事实上,这些概率值对应着试验结果出现的概率。例如,X=1对应着试验结果HTT,THT或TTH的出现,则X=1的概率等于试验结果HTT,THT或TTH出现的概率之和。因此,X是定义在样本空间上的一个实值函数。

随机变量的严格定义如下:设E是一个随机试验,S={e}为其样本空间,如果对于S中的每一个样本点e,有一个实数X(e)与之对应,则称这个定义在样本空间S上的实值函数X(e)为随机变量。

随机变量X的分布函数定义如下:对于任意的实数称函数

为随机变量X的累积分布函数(简称分布函数)。实际上,F(x)是随机变量X取值不超过某一特定值的概率,故有累积之意。

容易看到,分布函数具有如下性质:

(1)F(x)是x的非减函数;

(2)limx→+∞F(x)=1;

(3)limx→-∞F(x)=0;

(4)P{a1.1.1常用的随机变量及其分布

1.离散型随机变量及其分布

一个多取可数个可能值的随机变量,称为离散型随机变量。对于一个离散型随机变量X,记,这里xi为X的可能取值,则pi>0,且对于所有的xi,有∑+∞i=1pi=1;X的分布函数。

下面介绍一些常用的离散型随机变量。

1)0-1分布

假定一个随机试验,其结果可以分为成功或失败,称这样的试验为伯努利试验。例如,试验的结果是成功,令X=1,否则,令X=0,则X的分布律为

这里,p为试验结果是成功的概率,且0随机变量X也称为伯努利随机变量,如果其分布律由上述公式给出,称X服从0-1分布,记为X~b(1,p)。

在实践中,对产品进行质量检验,每抽出一件产品,只有两种结果,即要么是合格品,要么是不合格品,如记产品的合格率为p,则产品的质量检验问题可以用0-1分布来描述。

2)二项分布

若进行n次独立的伯努利试验,其中每次结果是成功的概率为p,结果是失败的概率为1-p。以X表示在n次独立的伯努利试验中成功出现的次数,则称X为具有参数(n,p)的二项随机变量,或称X服从参数(n,p)的二项分布,记为X~b(n,p)。其分布律为

例1.1已知某生产线生产的产品是废品的概率为0.1,且与任意的其他产品独立。现从生产线上随机抽取3件产品,则至多有一个废品的概率是多少?

解以X表示这3件被抽产品中的废品数,则X为服从参数(3,0.1)的二项随机变量。

例1.2某公司有7个顾问。假定每个顾问贡献正确意见的概率为0.6,且设顾问之间是否贡献正确意见相互独立。先对某项目可行与否个别征求各顾问意见,并按多数顾问的意见作出决策。试求作出正确决策的概率。

解以X表示7个顾问中贡献正确意见的人数,则X~b(7,0.6)。从而作出正确决策的概率为

例1.3某车间有80台机器,经过长时间的观察,得知每台机器发生故障的概率为0.01。设机器发生故障与否相互独立,又设每个维修工在同一时间只能维修一台机器,则配备3个维修工共同维修80台机器,与配备4个维修工每人承担20台机器维修任务,哪个方案不能及时维修的概率较小?

解(1)按照第1种方案,以X表示80台机器中需要维修的机器数,可易见,X~b(80,0.01),则不能及时维修的概率为

(2)按照第2种方案,以Ai表示事件"第i(i=1,2,3,4)个维修工承担的20台机器不能及时维修",则所求的概率为

由此可见,第1种方案较好。

注二项分布的概率计算可以调用excel中的函数BINOMDIST。

3)泊松分布

对于取值为0,1,2, 的随机变量X,如对某个λ>0,有

则称X为具有参数λ的泊松随机变量,或称X服从参数为λ的泊松分布,记为

泊松分布的一个重要性质是可以用来近似二项分布。事实上,如果二项分布参数中的n较大,而p较小,对于二项分布的随机变量,取λ=np,则

对于较大的n和较小的p,有

从而,对于较大的n和较小的p,有

例1.4假定某书一页上的印刷错误个数是一个具有参数λ=1的泊松随机变量,则在此页上至少有一个错误的概率为多少?

解以X表示此页上的错误数,则X~π(1),从而

例1.5假定每天在高速公路上发生事故的数目是一个具有参数λ=3的泊松随机变量,则今天没有发生事故的概率是多少?

解以X表示今天在此条高速公路上发生的事故数,则

例1.6(泊松分布在运营管理中的应用:排队)在生活和工作中排队是常见现象,如在银行、超市、餐饮店等场所都会遇到排队的情况;再如,货车等待装货、生产线上的零件排队等待装配等。通过排队模型,可以帮助公司管理人员掌握排队的特征。

每小时到达某加油站要求加油的汽车数服从均值为5的泊松分布,则

(1)接下来的1个小时内只有一辆车到达的概率是多少?

(2)接下来的3个小时内有多于20辆汽车到达的概率是多少?

某ATM机使用人数服从泊松分布,每间隔5分钟平均有1.5个使用者,则

(1)在接下来的5分钟内没有使用者的概率是多少?

(2)接下来的10分钟内有3个或3个以上使用者的概率是多少?

作者可自行练习。

注也可以调用excel中的函数POISSON进行计算。

4)几何分布

设进行独立试验直到首次出现成功为止,其中每次试验成功的概率都是p,以X表示直到首次成功所进行的试验次数,则称X为具有参数p的几何随机变量,或称X服从参数为p的几何分布,记为X~g(n,p)。其分布律为

例1.7对产品进行检验,直到检测到次品为止。设产品的合格率为0.9,求直到第11个产品才检测到次品的概率。

解以X表示首次检测到次品时所检测的产品数,则X~g(11,0.9),由此

2.连续型随机变量及其分布

在某型号灯泡的寿命试验中,每一个被测试灯泡的寿命是一个非负实数,它可以取到某个区间中的任意一个数。同样该型号灯泡的寿命在某一范围内取值的概率也是客观存在的。将这样能取到一个区间中任意一个数的随机变量,称为连续型随机变量。

连续型随机变量的分布函数为

这里,f(x)是连续型随机变量X的分布密度函数。

1)均匀分布(记为X~U(a,b))

密度函数为

2)指数分布(记为X~E(λ))

密度函数为

1.8已知某种轮胎的使用寿命X~E(0.1)(单位:万公里)。现随机抽取这种轮胎5只,试求至少有两只轮胎的行驶距离不足30万公里的概率(1公里=1千米)。

解以X表示任意一只这样的轮胎的使用寿命,则其寿命不足30万公里的概率为

于是5只轮胎中至少有两只轮胎的行驶距离不足30万公里的概率为

3)正态分布

密度函数为

称为标准正态分布的密度函数,对应的随机变量以Z表示,且记与之间的关系为这里,为标准正态分布Z的分布函数。

由正态分布的密度函数图像(图1.1)可以看到,此曲线由均值μ和标准差σ决定,事实上,μ决定了密度函数曲线的位置,也称位置参数;决定了曲线的形状,也称尺度参数。

图1.1正态分布

正态随机变量的3个重要数据:若X~N(μ,σ2),则

我们可以看到,X的取值几乎落在以均值为中心,3倍的标准差为半径的对称区间中。此性质也称为3σ准则,其在产品的质量控制中有着重要应用。

例1.9(招生录取线的确定)某学校近年招生情况看好,申请者越来越多,因此,录取标准需要提高。经学校管理部门反复论证,制订出一个录取条件,即申请者的入学分数必须在前1%以内。如果入学分数服从均值为490,标准差为61的正态分布,则录取的分为多少?

解以X表示申请者的入学分数,则X~N(490,612)。记录取分数线为x0.01,则有

这里,查附表1得x0.01-49061=2.3263,即x0.01=632。

实际上,在上述常用分布的概率计算中,都可以运用excel统计计算中的相应函数,请读者思考。本例中,可以运用excel中的函数NORMINV,立得x0.01=632。

1.1.2随机变量的矩

若E(Xk)存在,则称之为随机变量X的k阶原点矩,k=1,2, ;

若E(X-E(X))k存在,则称之为随机变量的k阶中心矩,k=2,3, 。

特别地,称随机变量X的一阶原点矩E(X)为随机变量X的数学期望,也称为均值;称随机变量X的二阶中心矩E(X-E(X))2为随机变量X的方差,称E(X-E(X))2为随机变量X的标准差。

在实践中常用的当属随机变量的数学期望与方差。

下面给出常用随机变量的数学期望与方差。

1.离散情形

网友评论(不代表本站观点)

来自无昵称**的评论:

很好。

2016-01-02 13:09:58
来自charlie**的评论:

内容前沿。

2016-10-04 23:13:00
登录后即可发表评论

免责声明

更多相关图书
在线咨询