人口统计学变量分析实用13篇

人口统计学变量分析
人口统计学变量分析篇1

2012B292)、东北电力大学博士科研启动基金项目“推动战略性新兴产

业发展的人力资源开发研究”(项目编号:BSJXM-201114)、吉林市科

技局软科学项目“吉林市创新型城市建设研究”(项目编号:201243206)

的阶段性成果

中图分类号:F272.92 文献标识码:A

内容摘要:本文介绍了人-组织匹配的三种形式及测量量表,并通过问卷调查的方式对不同城市的553名企业员工进行了调查,从性别、年龄、学历、职位和工作年限等五个人口统计学变量来探讨员工对以上三种匹配是否存在显著差异,最后对结果进行了分析,提出了有益的管理建议。

关键词:人-组织匹配 性别 年龄 学历 职位 工作年限

人-组织匹配的概念与测量

(一)人-组织匹配的概念

匹配,又称契合,指的是一种相称、适应或胜任的状态。人-组织匹配,是指个体特质与组织整体之间协调一致的状态(Gregory等,2010),它从系统的角度看待人与组织之间的关系,因此受到了国内外学者和管理者的广泛关注,目前已成为人力资源管理领域的重要课题。

Chatman(1989)认为人-组织匹配是人与组织在规范、价值观方面的高度契合和一致。Muchinsky和Monahan(1987)认为匹配包含两种类型:一致性匹配和互补性匹配。一致性匹配是指个体在目标、价值观以及态度等方面与组织中的其他成员或组织文化具有相似性,互补性匹配是指个体拥有的独特资源可以满足组织的需要。Caplan(1987)则从人与组织互相满足对方需要的角度,将人-组织匹配分成个人需求与组织供给相匹配以及工作要求与个人能力相匹配。需求-供给匹配是指当组织满足个体的需要和偏好时,才能出现人与组织的匹配;要求-能力匹配是指当个体拥有组织所要求的能力时,才能出现人与组织的匹配。

Kristof(1996)在前人研究的基础上,对人-组织匹配的不同类型进行了整合,提出了人-组织匹配的整合模型,指出人-组织匹配包括一致性匹配和互补性匹配,一致性匹配指价值观匹配,互补性匹配则进一步分成需求-供给匹配和要求-能力匹配。Cable 和 DeRue(2002)以及Hinkle和Choi(2009)的研究也表明人与环境匹配是三维度的。由此,可以看出,人-组织匹配的完整涵义包括人与组织在三个方面的匹配,即价值观匹配、需求-供给匹配和要求-能力匹配。

(二)人-组织匹配的测量

对于人-组织匹配的测量,本文选用的是Cable 和 DeRue(2002)的英文测量量表,并采用“双向翻译”的方法将其转化为中文量表。具体做法是:首先请一位在国内获得博士学位并已在美国工作8年的专业人士将量表翻译成中文,然后再请英文专业的老师将其回译成英文,最后由专门研究组织行为学和人力资源管理领域的专家将其与原文进行了对比,来确保量表具有良好的内容效度,从而形成了中文版量表。具体内容如表1所示。

人口统计学变量的人-组织匹配差异分析

(一)样本的描述性统计分析

本研究以企业员工为调查对象,通过问卷调查的方式获取数据,调查范围涉及吉林、长春、成都、上海、北京、广州、深圳、沈阳、石家庄等多个城市,行业涉及化纤、电信、汽车制造、IT等多个行业,共收回553份有效问卷。研究样本的详细信息如表2所示。

(二)样本的T检验与方差分析

独立样本T检验是利用来自两个正态总体的独立样本数据,来推断两个总体的均值是否存在显著差异的一种统计推断方法。给定显著性水平α后,首先需要利用F检验来判断两总体方差是否相等。如果F统计量的p值大于给定的显著性水平α,则可认为两总体方差并无显著性差异,此时可进一步观察方差相等条件下的t检验结果,如果t统计量的p值小于或等于给定的显著性水平α,则可认为两总体均值之间存在显著性差异。相反,如果p值大于给定的显著性水平α,则可认为两总体均值之间不存在显著性差异。如果进行F检验时,F统计量的p值小于给定的显著性水平α,则认为两总体方差有显著性差异,此时需观察方差不相等条件下的t检验结果。

独立样本T检验是对两组数据均值是否存在显著差异的统计检验,如果组别在三组以上,则需要采用方差分析。方差分析所研究的是分类型自变量对数值型因变量的影响。当只涉及一个分类型自变量时,该分析称为单因素方差分析;涉及两个或两个以上的分类型自变量时,则称为多因素方差分析。本研究中主要采用了单因素方差分析的方法来推断总体均值之间是否存在显著差异,如果存在显著差异,接下来就要确定自变量的不同水平对因变量的影响程度如何,哪些水平的作用明显区别于其他水平,哪些水平的作用不显著。这就要用到多重比较的分析方法,多重比较是利用样本数据,对各个水平下的总体均值逐一进行两两之间的比较检验。由于所采用的统计量不同,多重比较有许多具体方法。方差相等时常采用LSD法比较,方差不相等时常采用Tamhane法比较。

本文采用独立样本T检验和单因素方差分析对研究样本的性别、年龄、学历、职位和工作年限进行统计分析。其中,对于员工的性别采用独立样本T检验,对于员工的年龄、学历、工作年限和职位采用单因素方差分析并进行两两比较,具体检验结果如表3、表4、表5、表6、表7、表8、表9、表10、表11所示。置信度水平为95%,两两比较只列出在统计上有显著差异的结果。

结果与分析

(一)性别的独立样本T检验

独立样本T检验结果表明(见表3),性别对价值观匹配、需求-供给匹配是有显著差异的,要求-能力匹配则无显著差异。男性与组织匹配程度更高,这可能与中国文化中男性占主导地位有关,长期以来人们形成了“男主外、女主内”的传统观念,导致了男性更注重工作和事业,女性更注重家庭。因此,组织给男性赋予了更多的权力和报酬,男性也更认同组织给自我带来的成就感和满足感。虽然随着女性受教育水平的提高,女性的工作能力与男性一样,都能满足组织工作的要求,但“性别歧视”现象仍然存在,使得女性在企业中总体地位不高,影响力小于男性,从而表现出了对企业价值观和企业回报的不认同。

(二)年龄的单因素方差分析

单因素方差分析表明(见表4),年龄对所有测量变量产生了显著的影响。也就是说,不同年龄的人在认同组织价值观、组织供给与个体需求、个体能力与工作要求等方面的匹配程度是不同的。从表5中可以看出,26-30岁的员工比较特殊,他们在所有测量变量上都与其他年龄组的员工有显著差异,与40岁左右或者年龄更大的员工差异最为显著,这可能是因为26-30岁的员工是80后,大部分为独生子女,个性强,习惯以自我为中心,经济转型及就业、住房等巨大压力使其处在不稳定的生活状态,价值观有了巨大改变,这些可能都是造成80后员工不同于老员工的原因。

(三)学历的单因素方差分析

单因素方差分析表明(见表6),学历对价值观匹配、需求-供给匹配、要求-能力匹配等因素均产生了显著影响。从表7中可以看出,本科以下的员工在价值观匹配、需求-供给匹配、要求-能力匹配方面要显著高于本科以上的员工。这可能是因为过去教育资源匮乏,年龄较大员工接受的学校教育较少,因而导致学历层次较低,但是这些员工通过多年的工作,积累了丰富的职业技能,在组织中可能也从事管理者的工作,因此对组织的整体认同感更高。

(四)职位的单因素方差分析

单因素方差分析表明(见表8),不同职位的员工在价值观匹配、需求-供给匹配、要求-能力匹配等方面有显著不同。从表9中可以看出,基层技术工人在三种匹配程度上均与其他职位员工差异较大。这可能与目前工人的地位较低、待遇较差有关,在调查中得知,东北地区的一些大型国有企业,很多工人的收入低于2000元,因而他们组织认同感低,工作积极性不高。

(五)工作年限的单因素方差分析

单因素方差分析表明(见表10),不同工作年限的员工在价值观匹配、需求-供给匹配、要求-能力匹配的感知是不同的。从表11中可以看出,工作10年以上的员工在价值观匹配、需求-供给匹配、要求-能力匹配等方面的感知都显著高于工作10年以下的员工。这可能是因为在一个组织中工作时间越长,对组织的情感越深厚,认同感也更高的关系。同时,工作年限越长,工作能力越能得到提高,员工从组织得到的回报也越高,这与我们的认知是相同的。

管理建议

通过以上分析,在进行企业管理时应该注意以下问题:

一是人-组织匹配的性别差异反映的可能是公平问题。因此,管理者应避免戴“有色眼镜”,消除“性别歧视”。随着教育程度的提高,女性也可以“委以重任”,发挥潜力。二是80后员工在人-组织匹配方面呈现出不同的特征,如何对新生代员工进行有效管理,应引起管理者的高度重视。三是制造性企业的产品质量往往与基层技术工人关系很大。基层技术工人与其他层次人员在人-组织匹配程度上差异较大,可能在某种程度上反映了他们对于工作报酬和工作内容的不满。因此,提高基层技术工人的报酬,增加教育和培训的机会,增强他们与组织的匹配度。四是员工在一个组织工作时间越长,与组织的匹配程度越高。如何提高员工的忠诚度、降低离职率是企业管理者着重考虑的问题。五是人-组织匹配程度因为采用主观填答的方式,在某种程度上反映了人们对组织的认同感。如何增强员工对组织的认同,可能人性关怀更为重要,“海底捞”的做法值得借鉴。

参考文献:

1.Gregory B T, Albritton M D, Osmonbekov T. The Mediating Role of Psychological Empowerment on the Relationships between P–O Fit, Job Satisfaction, and In-role Performance. Journal of Business and Psychology. 2010, 25(4)

2.Chatman J A. Improving interactional organizational research: A model of person-organization fit. Academy of Management Review. 1989, 14(3)

3.Muchinsky P M, Monahan C J. What is person-environment congruence? Supplementary versus complementary models of fit. Journal of Vocational Behavior. 1987, 31(3)

4.Caplan R D. Person-environment fit theory and organizations: Commensurate dimensions, time perspectives, and mechanisms. Journal of Vocational behavior. 1987, 31(3)

人口统计学变量分析篇2

随着统计学和统计软件的发展,统计分析技术被越来越多地应用于实际生活。我国作为一个人口大国,了解我国的人口状况是关系国计民生的一项重大工作。所以,研究多元统计分析技术在人口研究中的应用有着深远的意义。

一、应用于人口研究的多元统计方法

作为一门专业课程,多元统计分析提出了大量的统计方法。如多元线性回归分析、logistic回归分析以及因子分析和聚类分析等。

1.多元线性回归分析在人口研究中的应用

多元线性回归模型主要用于研究一种变量受多种因素影响时的状况。而在人口研究中,多元线性回归模型主要用于人口老龄化以及城乡收入水平的影响因素等问题。例如利用多元线性回归模型研究人口老龄化问题的分析步骤如下:

(1)通过分析与人口老龄化有关的变量,我们确定人均国内生产总值、养老保险人数,失业人口人数、人口密度和政府医疗支出作为老龄化问题的影响因素(依次用X1、X2、X3、X4、X5来表示),并通过抽样调查或查阅年鉴的方法获得回归分析所需的数据,采用多元线性回归的方法进行定量分析。

(2)建立多元线性回归模型:Y=A+b1X1+b2X2+b3X3+b4X4+b5X5+e.其中b1、b2、b3、b4、b5为回归系数,A为常数项,e为残差。利用SPSS进行逐步法分析确定系数及常数项。

(3)对各变量进行显著性检验,确定模型并结合实际意义进行分析。

2.logistic回归分析在人口研究中的应用

logistic回归分析的用途主要包括三个:一是寻找特殊因素因素;二是预测;三是判别,例如预测某一个体属于某一情形的概率。logistic回归分析在人口研究中主要用于人口预测。

3.因子分析和聚类分析在人口研究中的应用

因子分析是指从影响研究变量的众多影响因子中提取出公共因子的统计方法。因子分析能够将具有相同本质的影响因子归入同一个公共因子,从而减少研究变量的数目。聚类分析则根据研究对象的特征,对研究对象进行分类,从而达到减少研究对象的目的。因子分析和聚类分析主要用于研究人口迁移影响因素、人口发展水平等问题。

二、多元统计分析技术在人口研究中的应用现状

在20世纪80年代,我国的人口研究中很少使用多元统计分析技术。进入90年代后,随着各种多元统计分析方法的引入和统计分析软件的使用,统计分析技术在人口研究中得到了广泛的应用。多元统计分析技术能够定量分析经济因素、社会因素和人口因素之间的关系,从而更好地解释人口现象。

1.我国人口研究中多元统计分析的特点

我国人口研究问题中多元统计分析技术的应用呈现出多样化的特点,主要表现在统计方法的多样性和统计分析内容的多样性。前面提到的多元线性回归方法、logistic回归分析方法以及聚类分析等多元统计分析方法在我国人口研究中都有应用。统计分析内容更是涉及生殖健康、居住类型以及人均收入水平等生活的各个方面。

2.我国人口研究中多元统计分析数据特点

我国在人口研究中的多元统计分析数据主要来源于抽样调查和典型调查等,统计分析的单位主要是以个人和家庭等个体单位为主。在数据类型方面,我国人口问题研究中的多元分析数据以横截面数据为主,时间序列数据极少用到。

三、我国人口研究中多元统计分析技术存在的主要问题

由于多元统计分析技术在我国人口研究中的应用时间比较短,很多人口研究人员对多元统计分析技术也没有经过系统的学习,在实际应用中难免会出现一些问题。

1.人口研究中多元统计分析方法使用错误

统计方法主要由研究目的和研究数据决定。但在实际应用中,由于研究人员难以正确区分各个统计方法,从而出现随意选择的现象。通过查阅用多元统计方法研究人口问题的相关文献我们发现,在进行人口问题研究时使用最多的就是多元线性回归模型。虽然多元线性回归模型具有易于理解和分析简便的特点,但它主要是研究一个目标受多个因素影响时的情形。很多文献没有注意到这个问题,从而错误地使用了该方法。

2.多元统计分析中缺乏评价和检验

评价和检验是多元统计分析的一个重要内容,因为很多统计方法只有结合实际,才能更好地确定自己的模型建立是否恰当,才能更好地解释模型中各个变量的实际意义。但在人口研究的实际应用中,很多研究人员只是注重对统计结果的分析,而忽略了模型的检验和评价。

对模型的评价主要是指模型对观测数据的拟合程度,每一种多元统计方法都有相应的模型评价方法和指标。对模型的检验主要是指显著性检验,从而判断该模型中各变量之间的关系是否存在。因此,模型评价和检验是多元统计分析不可分割的一部分,读者也只有通过这些内容才能更好地理解人口研究报告中所描述的现象。然而通过统计可以发现,很多有关人口研究的统计报告都缺乏模型评价和检验者方面的内容。

四、结束语

多元统计分析中的很多方法都适用于人口研究。近年来,随着统计学科和计算机技术的发展,多元统计分析技术在人口研究中也得到了广泛的应用。我国人口研究对多元统计分析技术的应用呈现出多样化的特点,多元统计分析的数据来源以抽样调查和横截面数据为主。但由于我国人口研究中多元统计分析技术的引入比较晚,在实际应用中仍存在较多的问题需要改善。

参考文献:

人口统计学变量分析篇3

〔实例1〕某调查报告称,某村2001年出生婴儿10人,其中男婴6人,女婴4人,出生性别比高达150,严重失调。

〔实例2〕某乡给某村下达人口计划,其中一项指标是计划生育率,要求当年的计划生育率不低于95%,而该村一般每年出生不足20人。

〔实例3]某地计生委根据群众举报,查出某县一个超生5胎的情况,据此称该县超生问题严重。

〔实例4〕某县总人口不足50万人,近年来在孕妇中推广服用“福施福”。上级要求检查服用“福施福”后,人口缺陷发生率是否逐年下降。还有不少地方把孕产妇死亡率是否逐年下降当作生殖健康服务工作的考核内容。

这几个例子所出现的问题都是以个案或少量发生的情况,说明一个地方宏观的情况。人口和计划生育统计所分析的对象(人口)或事例具有群体性,这个群体是由每个个体的人或事件集合而成。每个个体是否发现这种现象是偶然的,作为表现群体规律的统计数据,只有当群体具有相当的规模后才有意义。群体的规模太小,尽管对每个个体的统计是准确的,指标的计算也是正确的,但计算结果并不能客观地反映群体的规律。

如实例1,一个村的出生人数仅为10人,计算的出生性别比要么是100(“绝对平衡”),要么就是男女比例严重失调。实例2中计划生育率受出生总数的影响,要么计生率正好100%,只要有一个计划外出生,计划生育率就低于95%。例4涉及的出生缺陷发生率或孕产妇死亡率一般统计时均以10万作为分母,对于一个县,每年出生几千人或1万多人,即使按照出生缺陷、孕产妇死亡发生的平均水平,每年也只有几例,偶然性很大,在统计数据上很难表现为逐年下降。至于例3,以一个特例说明全县的情况,更是欠妥。各种人口和计划生育统计教材上并未说明各项统计指标适用的人群至少要达到多少,但一般说来这些统计指标绝大部分不能用于分析规模在几百人到一千多人的村级情况,许多指标在县、乡级使用也不太合适。多年来各级是通过报表收集人口和计划生育统计数据。报表由上级制发,基层单位按统一的口径填报每个项目,然后逐级汇总、上报。这样以来,上、下级的报表式样相同,只是数量大小有差别,于是,上级单位计算哪些指标,下级单位“照葫芦画瓢”计算相同指标。特别是实行人口与计划生育目标管理责任制后,各项工作任务和责任要逐级分解、落实,相应地,工作指标也被层层分解,上一级控制的指标(如出生率、计划生育率)也被一直套用到基层单位。在这种情况下,群体性的要求很容易被忽视。

2 自然属性与社会属性

〔实例5〕1995年8月,在全国上半年人口形势分析会上,某省计生委分析本省当年上半年二孩出生数量比上一年同期减少的原因时称,由于自当年起全省广泛推行“三结合”,许多群众为了发家致富,主动退出二孩指标,于是二孩出生明显减少。笔者的同事立即对此理由提出了置疑:既然是主动退出二孩指标导致二孩出生减少,那么原来应在1995年上半年生育二孩的妇女至少在1994年上半年就应退出二孩指标,而那时候,该省并未开展计划生育“三结合”;至于1995年上半年开展“三结合”后退出的二孩指标,其二孩出生减少的效果应在1996年以后才能表现出来。群众退出二孩指标与二孩出生数量的减少在时间上出现了“矛盾”。

〔实例6〕许多文章分析妇女受教育程度越高,生育的孩子越少。

这两个例子说明分析人口出生数量的变化应考虑人口的自然属性和社会属性。人口首先是生物意义上的人口,具有自然属性,同时,人口生活、存在于一定的社会环境中,具有社会属性。人口现象的发生既受自然属性的影响,也受社会属性的影响。从根本上说,社会属性对人口现象的影响和制约是有条件的、间接的。而自然属性的影响和制约是无条件的、直接的。社会属性的影响和制约常常要通过自然属性来实现。在分析人口现象的时候,首先要解释人口的自然属性,然后再解释社会属性。就实例5而言,从妇女退出二孩指标到二孩出生减少,至少间隔10个月,即妇女的怀孕期,无论推行“三结合”力度多大,妇女10个月的怀孕期不能缩短。退指标的发生与出生数的减少在时间上不“同步”,至少要“滞后”一年。也就是说,1995年上半年因开展“三结合”妇女退出二孩生育指标不会影响这个时期的二孩出生数量。关于实例6,一个人的受教育程度属于社会属性,妇女受教育水平提高,的确会影响其生育行为。然而,影响生育的自然因素,直接因素是避孕节育行为,具体地说,影响生育的生物因素包括推迟结婚(不发生性行为)、采取避孕措施和流产(终止妊娠)。妇女文化程度影响到上述生物因素发生变化(如文化程度高,能够更好地掌握避孕知识,可以提高避孕的有效性,减少怀孕的可能),并通过上述因素影响生育孩子的数量。直接讲文化程度与孩子数量的关系,未免有些牵强。

3 定量与定性

〔实例7〕各地每年都要分析当年的人口形势,将当年的数据与上一年的数据进行对比。许多分析报告在列举了对比数据后得出结论:“今年的工作比上一年有明显的进步,取得了巨大的成绩,上了一个新台阶”。但如果我们仔细察看各项指标的数量,发现变化并不大,如计划生育率由88.5%上升到89%,出生率由15.4‰下降为14.9‰(这其中由于人口年龄结构的变化也能导致出生率下降),多孩出生由165人减少为149人,多孩率由2.2%下降为2%等等。根据这些数据的变化,得出的定性结论应当是:“工作稳步发展,人口增长保持平稳的态势”。人口和计划生育的统计分析主要是指对数据的分析,并由“定量”的描述引申到定性的判断。如果忽视定性的分析,那么,所谓定量分析不过是数量变化的文字描述而已。把握好定性分析的关键在于,定性分析应以定量分析为基础,即“定量”在前,“定性”在后。那种先“定性”,再计算数量变化的做法,违背了“定量”与“定性”的基本规律。这样进行的定量分析,只是给定性的结论加一些数量的点缀。

4 模糊和精确

〔实例8〕某地区的一份材料称,根据20年来每年总和生育率的变化,推算本地区20年来少生了1831275人。

〔实例9〕某县计生委利用农村赶集日人口比较集中的机会,出动服务车,设置咨询台,向群众宣传计划生育知识,提供咨询服务。县计生委的汇报材料称,“一个月来在集日上接受宣传、咨询的群众累计达到127328人次”。

乍一看,实例8和实例9中的人数和人次数的统计和计算十分认真仔细,数字如此精确,令人钦佩。但转念一想,不免生疑:实例8中利用总和生育率计算少生人口,需要以年龄别生育率与分年龄妇女人数相乘计算出生人数,一般来看,每个年龄组的计算结果都不会是整数,只好四舍五入。每一年若干个年龄组累计下来,个位数已经含糊不清了。再把20年的少生人数累计起来,怎么可能精确到个位数呢?况且20年间,该地区的人口并非处于“封闭状态”,各年龄组人数因为人口迁移而变化,也会影响到计算少生的数量。至于实例9,在一个开放的、人们频繁走动的集市上,如何判定哪个人接受了宣传,哪个人接受了咨询,并没有一个客观的标准;即使有标准,实际操作中也很难把握,因此,根本没有可能逐人统计。实例8、实例9中看似精确的数据令人感到滑稽,倒不如模糊一些,说“20年大约少生了18万人”,“一个月在集市上接受了计划生育宣传、咨询服务的人次达10余万”,或许有几分可信。从某种意义上讲,人口和计划生育所涉及的是宏观层面的事情,与此相应的统计数据所反映的是大致的状态或趋势,没有必要也没有可能做到精确。许多同志在应用统计方法时,往往注意的是方法本身的定义和计算过程,而对计算中数据的来源不了解。人口和计划生育统计属于社会经济统计范畴,很多数据是通过抽样调查获得,允许有一定的误差;即使是全面的调查(如人口普查、全局报表),在实施过程中,也会遇到这样、那样的干扰或影响,存在着调查误差,这是无法完全避免的。从某种意义上讲,数据存在一定的误差,这是人口和计划生育统计的特点之一。

5 原因与结果

〔实例10〕最典型的例子莫过于“人口出生率每降低1个千分点,人均GDP提高多少个百分点”的说法。这种说法的依据是利用相关分析法对全国各省的人口出生率和人均GDP的数量变化进行计算,得出二者之间的函数关系式和相关系数。把人口出生率作为自变量,看自变量的单位变化影响因变量(人均GDP)变化的数量大小。

在这个例子中相关分析法本身以及有关的数据都是正确的,然而,用这样一个函数式来解释人口增长与经济增长的相互关系是有问题的。其一,就统计方法来说,相关分析只反映变量之间的相关关系,而不说明因果关系;其二,人口增长与经济增长固然相互影响,但从本质上来说,是经济发展影响人们的思想,进而影响人们的生育行为,最终导致生育率下降,人口增长率降低,即经济增长是“因”,而人口增长是“果”。颠倒了因果关系,不仅逻辑上讲不通,数量上的“相关性”也失去了意义。

笔者在多年的工作中体会到,由于人口和计划生育所具有的特点,人口和计划生育统计分析方法的应用和统计数据的解释有别于其它部门和领域对于统计的一般要求。正确地应用统计分析有助于我们认识人口和计划生育的特点和规律,只有科学地认识和把握人口和计划生育的特点和规律,才能避免在统计分析中陷入误区。

社会科学实证研究中的统计分析方法应用

郑真真 (北京大学人口研究所 副教授)

统计学的应用随着微型计算机的普及越来越广泛,在社会科学实证研究中几乎是无处不在。有了一定规模的数据和一个统计分析软件,就可以很方便地进行各种估算和分析。然而由于统计分析方法本身并不像加减乘除那样简单,而一些统计分析软件已经发展到几乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情况下操作并得到结果,可能出现对统计分析方法误用或滥用的现象。本文仅对一些统计分析中比较常见的问题进行讨论,以引起各方面的重视。

1 描述性统计

描述性统计是社会科学实证研究中最常用的方法。准确、全面、正确的描述是所有实证分析的基础,如果对某个事件或某种现象的描述不清楚或存在偏差,那么其后的所有分析都将是值得怀疑的。一项研究能够将所研究的现象或对象描述清楚,就是一个极大的贡献;而描述的偏差可能会引起公众或学术界对某些社会现象的误解,甚至误导政府决策。但是因为描述性统计所用方法简单易得,往往没有得到足够的重视。

均值的局限 普遍用于描述样本集中趋势的测量之一是均值。它对于近似正态的对称分布样本来说是比较好的测量,对于不对称分布则不然,尤其会受到极端值的影响。两个分布完全不同的样本可能会有相同的均值,因此均值在某种程度上抹杀了样本内部的差异,而往往这种内部差异正是需要我们进行深入研究的、或应当引起人们注意的。为了弥补均值的这个缺陷,一般在报告均值的同时也报告方差,或用直方图/散点图的形式描述分布,以提请读者注意群体内部的差异。

不同群体的可比性 在描述性统计中,往往涉及到对不同时期或不同人群的总体描述,以反映社会变化或地区差异。在社会科学中、尤其是人口研究中,不少事件的发生都是与年龄密切相关的,如我国妇女大部分在35岁以前完成了生育,从而导致35岁以上育龄妇女中极高的避孕现用率。在这种情况下,两个样本之间存在避孕现用率的差异可能只是年龄结构的差异,而不是年龄别避孕现用率的差异。又如在报告流动人口犯罪问题时,给人的印象往往是流动人口犯罪率高于常住人口,但忽视了流动人口的年龄和性别构成与常住人口完全不同,且青年男性是犯罪率较高的人群。这种对两个不同群体的比较往往会导致错误的结论。

绝对数的使用 由于中国人口数量巨大,调查研究也比较容易得到大容量的样本,所以对任何小概率事件用绝对数报告都会出现惊人的巨大数字,单纯对绝对数的强调往往会产生戏剧性的效果。比较合理的方式一般是在报告某事件绝对数的同时,给出该事件的发生率或占研究人群的比例。

小样本的代表性 在一次抽样的小样本中求得的率或比例会非常不稳定,与另一次抽样的结果可能会有较大差距。因此当研究仅限于从小样本获得的资料时,应当在报告比例的同时也报告样本量。

2 双变量统计分析

在社会科学研究中,首先分析的往往是两个变量之间的关系,如用相关或列联表等方法。一般在确定两个变量之间确实有某种关系,如在经过统计检验后证实两变量有显著相关关系,进行更进一步的分析才有意义。因此,双变量统计分析在实证分析中占有重要地位。但是,由于在应用中对有些问题的忽视,双变量统计分析也很容易出现偏差或错误。

卡方检验的局限 在利用列联表对两个定序/定类变量进行相关分析时,需要进行统计检验来判断两个变量的相关是否有统计上的显著意义。不少研究结果都用卡方检验的显著性报告相关状况。但值得注意的是,卡方统计量的计算本身是有局限性的,样本越大,卡方值就会相应增大,因此大样本的卡方检验很容易得到显著结果。所以一般在报告卡方检验结果以说明两变量是否显著相关时,还应当同时报告相关强度,即相应的相关系数,如Gamma,Lambda等。

统计意义上的显著与差别的实际意义 在检验两个定距变量的均值差别是否具有统计上的显著性时,也存在相似的问题。由于样本量越大,样本均值分布的方差就越小,因此常用的t检验结果就越可能显著,任何细微的差别都可能有统计上的显著性。但有时具有统计意义显著性的差异,在实际生活中可能意义并不大,如同在两个草堆之间找出一根草的差距,对判断两个草堆的大小没有实际意义。因此,对任何检验结果都应当有符合实际的解释和说明。

虚假相关问题 双变量分析中的虚假相关问题,几乎在所有关于社会科学研究方法的教科书中都会涉及到,在统计分析方法的教学中也被视为经典问题。但是多少年来,人们仍然在不断地重复着这个“经典的错误”,即认为可见的或统计检验结果显著的相关就是真正的相关;更为大胆的做法是把这种相关关系推向因果关系。我们知道,对于有的变量来说,即使是经过检验判定两者具有统计上显著的相关关系,也不一定存在实际意义上的关系,因为可能有未考虑到的变量或不可测量的变量在同时对两个研究变量起作用,有时甚至可能完全是偶然的巧合。例如,火灾的大小是以火灾损失来衡量的,而参加灭火的消防员人数是与火灾大小有关的,火灾越大,出动的消防员就越多,但凡是具有常识的人都不会根据出动消防员人数和火灾损失两个变量之间的高度相关,断定出动消防员越多火灾损失就越大,因为火灾的规模是决定因素(但很难直接衡量)。在有关人口科学研究中也有报告虚假相关的现象,如人口增长率的降低导致了经济增长的提法就是一例。因此,在分析相关关系时,应当根据理论、知识、经验、甚至常识来判断这种分析是否有意义、是否存在其他变量的作用(称为外在变量),避免得出有悖于常理的分析结果。有些虚假相关是可以通过统计分析方法判别的,如在控制了另外一些变量后观察两个变量的偏相关,或在双变量分析的基础上,进一步用多变量分析深入研究。

3 多变量分析

回归分析是多变量分析中应用最多的方法,尤其是逻辑斯蒂回归更是被广泛地应用。在众多应用中,比较明显的问题是使用方法是否得当和对结果的报告和解释是否规范、合理(见2002年第2期《人口研究》刘金塘文)。此外还有一些应当引起注意的问题。

分析框架的重要性 在社会科学研究中,各变量之间往往存在错综复杂的关系,如果在进行回归分析之前没有一个清晰合理的分析框架,那么回归的结果有可能会引起质疑。一般应在报告回归分析结果之前,介绍该分析的框架,如各变量的定义、各自变量与因变量的假设关系及其理由等,对建立的回归模型做出合理性论证。有一些变量可能是作为控制变量纳入回归模型的,如性别、年龄等,最好事先解释清楚。对假设因果关系的模型,应当至少能够说明:(1)该因果关系在理论上是正确的、在实践中是合理的;(2)从事件发生的时间上来说,应当是原因发生在先、结果发生在后。如有些回归分析中,未加说明即把所有与因变量显著相关的变量都囊括在自变量中,甚至有些自变量与因变量有明显的互为因果关系,显得分析逻辑混乱;还有的论文在简单介绍研究背景和数据来源之后,急于建立因果关系并推出回归分析结果,然后再根据各变量在回归模型中的显著性一一说明,这相当于事后解释;这些做法都是错误的。

在具备“奔4”微机和较易操作的软件的今天,转瞬间就可完成一次回归分析,但是在此之前,需要有大量的前期准备工作,包括文献检索和理论框架构建,才能确保统计分析的科学性。

分析方法应用的条件 每种多变量方法都有各自的前提条件或假设,如果这些条件不具备或者假设不成立,该方法的应用就成问题。如Pearson相关是考察线性相关关系,多元方差分析只能辨别线性相关因变量的多元差异,线性回归分析假设自变量与因变量之间为线性关系,因子分析方法也是建立在各变量具有一定的线性相关基础之上的;另外,在逻辑斯蒂回归中,每个分类都应保证有足够的频数,如果频数太少就会影响参数估计的稳定性;等等。尽管一般不在报告分析结果时说明各种假设是否成立或条件是否满足,但是在进行分析时应当自觉地进行考察。如果不能满足条件或假设不能成立,就对数据进行转换或调整后再分析,或者改变分析方法。

多变量分析结果的展示和解释 多变量分析的结果一般是通过列表来展示的。现在一种并不少见的做法是直接把统计软件的输出直接复制到论文中,我们往往会在文章中看到包括回归参数估计、参数标准差、检验统计值、检验显著性、偏相关系数等等n行m列的大表,使人有目不暇接的感觉。实际上参数标准差和检验统计值是提供给分析者的信息,没有必要列在结果中;如果不是有特别需要的话,偏相关系数也不是关注重点;最主要的应当是回归参数估计及其显著性。

在列出分析结果之后,应当对结果的实际意义进行解释和讨论,而不是复述分析结果的数学意义。此外,在多元统计分析中一个常见的问题是分析者对变量作用不具有预期统计显著性的失望,因此绕开不显著的变量,甚至对数据或模型进行各种调整以获得显著结果。其实,统计分析结果不显著往往也是有实际意义的。例如在分析我国高龄老人的地区分布时发现,高龄老人比例与当地医疗卫生指标没有显著关系,这说明我国医疗系统还没有具备延长老人寿命的功能;另一方面也说明这些高龄老人的存活不是主要靠医药维持的。所以,在解释分析结果时,只要是在分析框架中涉及并参与分析的变量,无论作用显著与否,都应当给予充分的讨论;对于那些由于知识或信息的限制难以下结论的结果,可以作为问题提出,以便进行更有针对性的进一步研究。

此外,任何方法都有其局限性,分析结果也不会十分完美。因此在讨论结果的同时,也应当就此向读者说明。例如当一个多元线性回归分析的确定系数较低时,需要指出该模型有限的解释能力,探讨可能存在但没有纳入分析的更重要的影响因素。

不必求最新、只求最合适 有些研究生在撰写学位论文时,常常因为自己没有应用最新的统计分析方法而感到忐忑不安;在评论某项研究的创新性时,有时也出现把学术创新和应用新方法混为一谈的现象,例如认为应用描述性统计方法的研究水平低于应用解释性或预测性方法的研究。新方法是层出不穷的。但是,出现了新方法并不意味着传统方法就不再适用,而是各有千秋。统计分析方法是工具,哪件合适就用哪件,能用锤子解决的问题不必开冲床。有时越是复杂的方法,假设条件也会相应较多,应用的局限性更大。因此,盲目追求方法的新颖并不是高水平研究的保证,真正需要注意的是使用最合适的方法。而对所用方法的真正了解,是正确运用统计分析方法的前提。

总和生育率的内在缺陷及其改进

郭志刚 (北京大学社会学系、北京大学中国社会与发展研究中心 教授)

1 总和生育率的应用目的及评价原则

年龄别生育率及其概括性指标总和生育率(TFR)是生育研究中最常用的指标体系。但是现在它们面临很多实际问题。本文不讨论出生漏报导致统计失实的问题,因为其性质并不在于统计方法,而是一个社会问题。本文只局限于这一指标体系内在的有效性问题的方法论讨论。一个指标是否有效应该以研究目的为标准来判断,因此这一讨论将结合当前实际工作的需要来进行。

统计指标有两种功能:一种是对调查对象本身特征的直接描述,另一种则用于推断估计。很多情况下,统计指标同时承担着这两种功能,比如样本统计量反映了样本对象的特征,同时又服务于推断估计总体参数。既然是一种估计,自然会有推断偏差或误差。评价不同估计的优劣是看谁的偏差或误差更小。

那么通常我们应用TFR到底要反映什么?一是为了在控制育龄妇女结构的条件下概括时期生育水平,二是作为终身生育水平的估计。(注:在这一方面,总和生育率与人口的粗再生产率和净再生产率的性质类似,后两个指标中只不过又控制了下一代的性别和死亡因素的影响而已。)两种性质都反映在各年龄组生育率的合计上。通常,不同基数的相对数指标不可以直接相加(注:如男性平均年龄加女性平均年龄没有意义。)。为什么年龄别生育率可加,是因为设置了假设队列的概念。TFR主要不是平均的概念(注:早期将其翻译为平均生育率的确是错误的。至于年龄别生育率对妇女其他差别所做的均质假设,其实存在于所有汇总指标之中,而不论其分组有多细,但是都不会因此而称为“平均××率”。),而是总和的概念(即假设队列经过所有年龄后生育总和)。因此,TFR一身兼两任,其内容为时期生育率总和,其形式为队列终身生育水平。从前一种意义上使用时描述了该时期生育水平,从后一种意义上使用时则是假设队列终身生育水平的估计(注:但这种估计从原理上不同于一般统计量从样本推断总体的情况,但有关评价原则却是类似的。)。其值实际上涉及了35个实际队列,并且只有在生育水平及年龄模式长期不变的苛刻条件下,它才真正与实际队列终身生育水平相吻合(但是队列仍是泛指的)。尽管这一假设队列与真实队列并不能很好对应,但起码可以及时提供一种队列终身生育的估计来满足实际需要。

2 缺陷一:总和生育率对终身生育水平的背离

表现A:最早对TFR的批评是由于其剧烈的时期波动。一逢时期突发事件(如中国1958~1961),实际生育量发生了变化,TFR就会大幅度下降。应该说,批评并不是指向其描述时期生育水平的功能,而是指向其作为终身生育估计的功能。因为,这时TFR的下降只是由于时期特殊原因影响,并不意味着终身生育水平真的下降。实际上,时期效应一过,TFR马上便会出现反弹(即常说的生育补偿),然而反弹的水平也并不能标志终身生育水平真的那样高。总之,TFR短期内剧烈波动时,将其作为终身生育率估计来理解很成问题。其中最引人注目的是,反弹年份的分孩次TFR(i)会超过1,特别是一孩TFR(1)会大大超过1(注:1982年全国1‰人口生育率抽样调查数据显示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作为队列估计,即是说每人生育一个半一孩,显得很荒唐。)。人口统计学对此采取的对策是,避免采用这些年份的TFR来作为终身生育水平的估计,或者采用若干年份的TFR的平均值来作为终身生育水平的估计,希望将欠年与盈年的误差相抵消。

表现B:然而,有时即使社会中似乎并没有什么特殊事件,TFR也会背离终身生育水平。但是,往往只是在TFR提高时才会受到一定关注(注:如1983年左右中国人口学界对TFR的讨论。)。理论分析可以证明,这种背离既可以是正的,也可以是负的。特别是在负偏离的情况下,往往可能持续较长的时间。并且,这种负背离实际上正是当前所面临的实际情况,因此特别需要重视。

这种背离产生的原因是婚育年龄的变化,或者说是队列的年龄别生育模式的改变。而负偏离则对应着婚育年龄的推迟。与时期突发事件对婚育年龄的推迟的暴发性影响不同,生育模式的自身转变具有较长时期的持续性、变化上的渐进性、现象的隐蔽性等特征,并且它并不一定伴随生育补偿现象。甚至有时人们根本没有意识到这种偏离的存在。

人口统计学早就揭示出,晚婚晚育可以延缓人口增长,但这是从长期人口发展的角度来证明的。而晚婚晚育对年份TFR有什么影响,则很少有人涉及。从理论上说,取得同样的终身生育总量,可以有不同的进程表。即假定各队列的终身生育数量不变,从某一时期开始各队列的生育年龄开始推延,这一过程可以持续较长一段时期,直至最终稳定在一个新的生育模式上。我对此做过一些模拟计算,在这种情况下,生育模式转变时期中每年的TFR一定会低于事先所设的队列终身生育量,而这段时期两端及以外各年份的TFR则可以等于事先所设的终身生育水平。这表明,即使将整个转变过程或更长时期中各年的TFR都加在一起平均,得到的还是—个偏低的终身生育估计。

更普遍的情况是生育模式的变化与终身生育量的变化同时发生,这时TFR下降同时受这两个因素变化的影响,由生育模式变化导致TFR对终身生育水平的偏离便较难分析。

实际问题:实际工作需要不允许我们等很多年再提供真实队列终身生育统计,而现在只有TFR一种估计方法,并且我们知道TFR还会经常偏离队列终身生育水平,因此急需寻找一种更好的估计来取代它。否则尽管当前TFR的值虽然很低,即使不论统计失真问题,我们也不知道这是否仅仅反映TFR发生了负偏离,那么我们凭什么肯定生育率已经下降到更替水平了。我们又怎么能知道,当生育年龄推迟告一段落时,TFR向终身生育水平回归时会回升多少。要知道更替水平的真正概念是实际上某队列与其终身生育后代数量的比(注:从这个意义上,净人口再生产率等于1仅是一种时期估计的标准,并且也服从上述偏离,并不是真正的更替水平。)。

有关改进:Bongaarts和Feeney(1998)提出了去进度效应总和生育率(TFR')。该方法旨在提供一种根据时期数据对终身生育水平的较好估计(注:Bongaarts和Feeney(1998)警告说,这一方法不适用于那种特殊时期效应(即重大灾害等)的年份。)。郭志刚(2001)对此进行了介绍,并用中国多年生育数据对该方法进行了检测和评价,结果是TFR'作为终身生育水平的估计的确大大优于TFR(注:郭震威(2000)认为TFR'不伦不类,既不是时期生育指标,又不是终身生育指标,是个尴尬的指标。我认为,它只是应实际需要而产生的另一种根据时期生育信息对终身生育水平的新估计而已,其实这没有什么可尴尬的。统计中凡是不能直接测量的时候,都得采用估计来代替。真正有意义的问题是,它是否比传统TFR更接近于终身生育水平。)。

该方法基本原理可以这样来理解:现实中生育模式转变时,除了导致该年生育数量有所变化以外,还会有其他共生现象,如分孩次的平均生育年龄(MACi)也会变化(注:Bongaarts和Feeney(1998)强调要用分孩次的平均生育年龄,而不能用总的平均生育年龄,因为后者会抹煞实际变化。)。MACi实际上是生育模式转变的测量值,可以在理论上建立其变化量与时期生育变化量之间的函数关系。TFR'便是在常规分孩次TFR(i)的基础上利用MACi的变化信息来调整,得到去进度效应的分孩次TFR'(i),然后再汇总为TFR'。经过调整,TFR'可以在相当程度上修正TFR距终身生育水平的偏离,因此TFR'更接近于队列终身生育水平(这里队列仍是泛指的)。也就是说,我们可以用TFR'来替代TFR原来所承担的终身生育估计的功能,而TFR还可以继续承担描述时期生育水平的功能,TFR'与TFR之差可以作为生育推延对当前生育水平影响的估计(注:我曾当面请教Bongarts,问TFR'方法是否可应用于预测模拟,他毫不犹豫地回答说不能。)。

我认为,尽管TFR'指标还有继续改进的余地(注:比如某一年的MACi的计算还要前一年和后一年的数据,因而多少丧失了一点及时性。然而,我自己曾尝试过另外的计算,比如只用前一年和当年两年的信息,调整的结果也并不差。),但显然Bongarrts和Feeney为解决这一估计问题指出了极富于科学价值的方法论途径。并且,这一新指标不仅可以用于监测队列终身生育水平,也可以用于分析以往的生育数据(郭志刚,2000),帮助我们更好地理解我国的生育转变史和计划生育史。

3 缺陷二:总和生育率不能控制育龄妇女的孩次结构

对某些重要因素进行统计控制可以为不同年份或不同地区的比较提供更大的可比性。尽管TFR控制了育龄妇女的年龄结构,但是它并没有控制育龄妇女的孩次结构。然而,当前许多人口模拟研究都不能再忽略育龄妇女的孩次结构问题,否则会有损其研究结果的有效性(注:比如,与调整生育政策相联系的人口模拟如果忽略现有一孩的妇女人数,便无法计算由于多年积累在一孩的这批妇女在政策调整时将产生的特殊生育效应。另外,有关生育政策后果方面的研究(如四二一家庭结构)也有类似问题。)。

问题的表现:实际上生育过程是严格的递进事件,也就是说,只有未生育者才能生育一孩,只有生育过一孩且尚未生育二孩者才能生育二孩。而常规生育率则是以年龄别所有妇女总数作为基数,因而没有容纳育龄妇女的曾生孩次信息,也就不能控制曾生孩次这种结构影响。因此,比较孩次结构差别较大的年份或地区之间的年龄别生育率(或TFR),便不能区分其差异到底是出于生育水平不同还是出于孩次结构不同。当其用于人口预测模拟时,如果假定两地区育龄妇女年龄结构相同,同样的系列生育率的假设会导致孩次结构十分不同的地区(代表着不同生育政策类型)将会有相同的出生人数,显然这严重地偏离实际情况。因此,面对当前的许多研究需要,基于年龄别生育率的TFR方法无论是用于比较分析上还是用于预测模拟,都会影响其结果的有效性(注:至于分孩次的年龄别生育率,只是对分子(即出生)划分了孩次类别,但是并没有对育龄妇女本身划分孩次结构。其基数没有控制孩次结构,因而从本质上说也没有控制孩次结构。)。

替代方法的产生:实际上,计划生育采取了分类指导原则后,便产生了多种生育政策类型,其显著特征便是孩次控制上的不同。在不同地区实施不同政策时,育龄妇女的孩次结构便取得了越来越重要的意义。从这一角度出发,导致Feeney(1985)和马瀛通等(1986)分别以不同思路创建了孩次递进生育指标体系。

他们的共同点在于采用孩次递进比作为生育测量的基础来构建指标体系。如前所述,每年的出生可以划分孩次。如果再将某一群体生育指标的基数由对应口径的年中妇女总数换成年初对应(即前一)孩次妇女时,便称为孩次递进比(注:实际上可理解为一种概率,如本年年初某年龄组(或孩次间隔组)只有一孩的妇女中在本年生育二孩的比例。)。然后,还可以将孩次递进比换算成递进总和生育率。

Feeney的模型突出地考虑了孩次递进间隔因素,不考虑年龄结构,因而常被称为间隔递进模型。而马瀛通等的模型则突出地考虑了年龄递进因素,因此常被称为年龄递进模型。

这两种方法不仅可用于在控制妇女孩次结构条件下的比较分析,也可以用于预测模拟(注:应该指出,其实中国人民大学人口研究所的老一辈人口学家早在1970年代所自行创建的标准(或可变)生育率预测法中也已经包含了控制孩次结构影响的思想(刘铮、邬沧萍、查瑞传,1981)。)。递进方法不仅可以在预测中控制孩次结构,而且应用于模拟预测时实际上比常规生育率方法更方便(注:这里的方便指,它只需要每年期初妇女的孩次别人口数便可以直接乘以递进比便得到对应的生育量,而不需要再计算其中妇女人数。)。由于递进比的概率性质,还能根本避免孩次别总和生育率出现的那种超过1的现象(注:尽管如此,Bongaats和Feeney(1998)认为这一类应用生命表方法的生育指标仍然没有真正控制生育进程变化的影响。)。

主持人评论

本期论坛邀请的三位专家都有多年从事人口统计和数据分析的经验,对人口学研究方法有很深的造诣。王谦副司长通过从多年工作中积累的大量实例,分析了在人口和计划生育工作中经常发生的统计方法和统计数据被误用的情况;郑真真副教授则对统计分析中比较常见的问题进行丁独到的分析和总结;郭志刚教授对总和生育率指标进行了深入全面的剖析,分析了其内在缺陷和改进方法。

王谦副司长通过10个典型实例说明在人口和计划生育实际工作中,统计方法和统计数据在五个方面经常被误用。这五个方面的问题有些属于统计分析中容易犯的错误,带有普遍性,如,错误地解释变量之间的因果关系,在统计分析中忽视定性分析与定量分析的关系,结论不是由统计分析中得出,使得定量分析只是定性结果的一种点缀。有些问题则由于人口与计划生育领域的特点而显得更为严重,如他指出的,大部分人口和计划生育统计指标在村一级或县、乡不适用是因为总体规模不够。统计所研究的是总体的数量关系而不是个别的数量关系,所以统计指标在一定的总体规模下才有意义,这是统计学中的基本概念,但是在实际中却经常被误用。我们经常看到的错误都是统计学上的一些“基本概念错误”,而不是“高深错误”。统计学上的概念和方法可能很简单,也容易理解,但是要在实际工作中正确地、恰如其分地运用并不容易,需要结合研究对象的特点。

郑真真副教授从另一个角度对描述性统计、双变量统计和多变量统计分析中经常被忽视的问题进行了讨论和分析。她不仅指出了问题的所在,而且告诉大家应该如何做,她所讨论的内容是大部分统计教科书上所没有的,具有很大的实用性,对于正确地应用统计分析方法具有很大的指导意义,具体的问题这里就没有必要再评述了。她的分析源于多年教学和科研工作的总结和升华,很多观点具有独到性,如对描述性统计的重视,多变量分析结果的展示和解释,不必求最新、只求最合适的方法。

王谦和郑真真从不同角度对统计分析和统计数据应用中出现的问题进行了分析,郭志刚教授则对人口统计中的一个重要指标-总和生育率进行了深入分析。他指出指标是否有效应该以研究目的为标准来判断,他从总和生育率对终身生育水平的背离和不能控制育龄妇女的孩次结构这两大缺陷出发,对问题的表现形式、实际工作中的需求以及改进方法进行了分析和介绍,其中渗透了他自己近年来对这一问题的研究结果和体会。我看完他的文章觉得获益匪浅,如90年代以来中国的人口调查所得到的总和生育率指标都非常低,这里面有统计漏报的问题,也有总和生育率指标自身的缺陷所带来的问题,在婚育年龄推迟时,总和生育率会低估终身生育水平。在以往的人口学研究中,对方法论的讨论和重视是不够的。研究方法的创新源于实践的需求,面对21世纪更加错综复杂的人口问题,我们需要研究方法的不断创新与发展,这是目前我国人口科学发展面临的一个巨大挑战。

三位专家的分析和讨论有很大的实用性,值得从事人口和计划生育的实际工作者和学者认真学习,但是毕竟他们不可能把所有的问题都归纳概括全面,这也不是本期论坛的初衷。我们希望通过本期论坛起到抛砖引玉的作用,引起同行对这一问题的重视。中国规范的人口学研究毕竟只有20多年的历史,有问题是可以理解的,统计分析方法的误用和研究的不规范在其他学科领域也同样存在,甚至有可能更严重,但是我们不能漠视这种状况继续下去,问题的解决需要全体同仁的重视和努力。我觉得目前至少可以加强以下几个方面的工作:

(1)提倡学术争鸣,鼓励同行之间开展批评,这将有利于学科的发展与规范;

(2)编审人员把好质量关,使在杂志上发表的文章符合学术规范,杂志上文章的示范作用往往比教科书要大得多;

(3)加强统计分析方法的教学工作。强调方法的适用性和在实际应用中应该注意的问题。

参考文献

1 刘铮,邬沧萍,查瑞传.人口统计学.中国人民大学出版社,1981

2 马瀛通,王彦祖,杨叔章.递进人口发展模型的提出与总和递进指标体系的确立.人口与经济,1986;1,2

3 姚新武.中国生育数据集.中国人口出版社,1995

4 郭震威.对“去进度效应总和生育率(TFR')方法”的一点看法.人口研究,2000;1

5 郭志刚.从近年来的时期生育行为看终身生育水平.人口研究,2001;1

6 郭志刚.时期生育水平指标的回顾与分析.人口与经济,2000;1

7 Feeney.1985.Parity progression projection.International Union for the Scientific

人口统计学变量分析篇4

普遍性是指人口普查是按地域性原则进行登记,某个地域范围内的全部人口都要参加普查登记。

个别性指的是人口普查登记以人为单位,要按照每个人的实际情况逐人逐项地填写普查表。

标准性是指人口普查必须以一个特定时间为标准,全国同时进行调查。不论普查员实际入户登记时间在哪一天,登记的都是标准时间的人口状况。集中性指的是人口普查工作必须在中央的集中领导下,按照中央一级普查机构的部署去组织实施。

统一性即人口普查工作要全国严格统一,包括统一的普查方案、统一的普查表、统一的填写方法、统一的分类标准、统一的工作步骤和进度等。

定期性就是人口普查总体上是一种静态调查,不能反映人口的变动情况,因此应该定期进行,世界大部分国家规定每隔五年或十年举行一次人口普查。

人口普查的统计实践理念

1.“数量理念”。统计实践的数量理念源于统计学本身。《不列颠百科全书》对统计学的定义是:统计学是“收集和分析数据的科学和艺术”。在人口普查实践过程中,始终是联系着人口的数量来进行的。因此,人口普查的统计实践理念首先是“数量理念”,并要善于量的计算和分析,从而体现其三大作用:一是为政府服务;二是为科学服务;三是为工商企业服务。

2.“不确定性理念”。“不确定性”理念是统计实践必须牢固树立的一个基本理念,是统计实践的基础。人口普查实践中的不确定性首先是存在大量的流动人口,其次是人户分离,很多人因为拆迁搬离后,并没有将户口一同迁走;还有一些人有一套以上住房;另外调查对象配合度降低等。我国传统教育自觉不自觉地制造同一种思维模式下的高度集中和思维统一,习惯于让学生去寻求“唯一正确的答案”,这从根本上不符合“不确定性”理念,统计实践应该努力培养学生思维的发散性、新颖性和独特性。

3.“质量理念”。事物的量有数量和质量两个方面。如果忽视了质量,由于对量的片面认识也容易导致严重的后果。因此,人口普查的统计实践理念还必须具有“质量理念”,质量理念是对事物量的认识的丰富和深化。人口普查的“质量理念”是对人口数量认识的更高境界,只有达到这一境界,我们才可以说,我们知道了人口真正的量。

4.“变异性理念”。变异是存在于自然界和社会经济领域十分普遍的一种现象。人口普查中的变异无所不在,如人口统计的数据与期望结果之间有变异等。变异并不可怕,重要的是要能对变异的量进行科学的描述,并要从这种差异中发现变化的趋势和规律,有利于纠正以静止的观点看问题,同时处变不惊,促进人口统计质量的提高,这是统计显著性检验的重要内容。

5.“置信性理念”。统计是“容错”的,误差是不可避免的,变异是无处不在的,因此,人口统计的结论通常不具有唯一性。但误差会降低估计的精确度,变异可降低估计的可信度,而过低的可信度和精确度会使统计分析结果失去使用价值,这就是置信性的问题。人口统计分析通常这样陈述自己的分析结果:我们有90%的把握程度使实际值落在预期目标的一个标准误差范围内。这实际上给出的是一个置信区间,与逻辑思维由因果关系得出的确定性结果相比较,置信区间是给出与一定概率相对应的总体特征的估计范围,或是用以判断是否应该接受原假设,这是对统计思维结果最好的表述方式,这样的结论更符合科学的标准。

人口普查与高职统计实践教学

综合上述人口普查的基本特征和统计实践理念,结合本次人口普查,我们发现高职统计实践教学以下三方面的能力培养很重要:

1.融通能力。统计只是一种获取信息的手段和工具,统计的目的是解决社会经济问题。在人口普查中,“入户难、进门难”的现象仍时有发生,这也成了人口普查中的一大难题。此时除了大力抓好宣传工作外,学生普查员的交流融通能力就显得尤为重要。我们的学生普遍知识面狭窄,视野不够开阔,融通能力差,综合分析问题能力相对低下,所以除业务知识外,我们还应加强对学生普查员入户技巧、现场询问等技能的辅导。如果学生普查员熟悉掌握了调查方案、流程及指标,又能语言文明、行为礼貌地入门,自然会赢得调查对象的信任和支持,“入户难”就会转化为“门易进”了。因此加强对学生融通能力的培养至关重要。

2.观察能力。“观察”是指在不进行人为干预的前提下,将实际发生的经济现象及其过程客观地记录下来。统计实践过程是从发现问题开始的,因此,观察能力的强弱也是实践的关键。如学生普查员在访户时,要善于观察家庭生活环境,观察调查户的表情,通过观察多问问题,一些热点问题和焦点问题往往是在细心观察的前提下问出来的。我们要有意识地培养学生在大量观察中发现问题的能力,走出课堂,面向社会,放手让学生积极地寻找和发现现实经济问题,把课堂教学与经济现实有机结合起来。

3.抽象能力。抽象是哲学的本质特点之一,抽象是认识复杂现象过程中使用的思维工具。在人口普查中,越往基层,统计力量越薄弱,技术装备越差,普查人员所面对的情况越复杂,所承担的任务就越重。往往一个人肩负统计、调查、普查等多重任务,常常会出现力不从心、顾此失彼的现象,很不利于普查数据质量的提高。这时的统计实践,抽象能力就显得尤为重要。这种抽象是以数字为工具,通过比较、分类、综合、平均等方法,从数据特征、数量界限和数量规律中提示人口方面的统计信息。

高职统计实践教学现状

1.从教学计划看。从教学计划看,实践环节所占用的时间普遍不足,甚至许多学校根本没有实践环节。通过调查浙江省的几个高职院校开设的统计课程,课程一般分为三个部分,即统计调查、统计整理和统计分析,统计调查占一个章节,统计整理占四到五个章节,统计分析占三到四个章节,加上统计概论约十多个章节,这样仅统计课程的理论部分就需要六十个课时左右,实践课就没有时间去安排。而统计调查、统计软件的使用又是统计工作的重中之重,缺少这方面的教学内容,学生缺少实际感悟,往往形成眼高手低、高分低能的局面。

2.从教学内容看。从教学内容看,教材不符合高职学生特点。高职统计教材大部分是本科教材的压缩,常常是从统计发展史到统计分析报告,样样俱全,既没讲透统计理论,也没有增进统计技能的操作。这样,高职学生失去了实践操作的特色,而教材使统计理论与实践相脱节,忽略了对学生基本统计能力素质的培养。

3.从教学方法看。从教学方式来看,传统的统计实践教学往往以课堂实验课为主。有演示性实验、验证性实验、计算性实验等。如验证性实验,教师往往在每次实验课时将实验相关知识、实验目的、实验要求等向学生进行较为详细复习描述之后,让学生去观察、去验证,在此同时,教师则在较长的时间里在教室内来回巡视和辅导,这种验证型的实验教学,给教师和学生一种机械工作和学习的感觉,一种枯燥乏味的感觉。其学生表现出来的结果是,在最初几次实验课之后,学习的新鲜感所剩无几,主动学习的积极性不能坚持,久而久之,使学生观察能力、抽象能力和动手能力得不到平衡发展。

4.从实训环节看。实训环节技能训练非常缺乏。统计学作为会计电算化、营销、工商管理、文秘自动化等专业的核心专业基础课,其应用非常广泛,统计知识已成为各类从业人员必须具备的基本知识和技能。面对新情况,我国的统计教育虽进行了一系列的调整和改革,但在高等职业教育课程设置中,计算机方面的只讲一些基本的操作,缺乏技能训练,未能将教学与统计分析软件运用结合起来,学生机械地记忆和应用复杂的计算公式,不会利用现代的手段来处理统计数据和分析。

高职统计实践教学改革策略

通过这次人口普查,许多学生深切感受了统计实践的重要性。在实践中学习,在实践中“学会”,才能成为社会进步所需要的人才。职业教育不是应试教育,要求学生能够将从老师那里学来的知识应用于实践,具备一技之长,在教学过程当中应以学生掌握相应技能为主,能够适应社会职业岗位为主,模拟实际工作环境,或者教师将学生带到实际工作岗位,进行现场教学,达到与岗位“零距离”接触。

1.重树教学理念,修订教学计划。高职院校注重的是培养应用型人才,高职学生学习统计的目的并不是进行统计理论研究,而是在自己的相关专业领域里实际运用。在修订教学计划时,要为统计课程实训、实践课留有足够的课时,且实践课时不能流于形式,统计学课程要成为实战操作课程。实践课要充分考虑工商管理等各职业岗位的实际需要,即从某个职业岗位群出发,进行职业分析,了解构成这一职业岗位工作的主要内容,明确支撑其职业或工作所需要的统计知识与技能,符合学生专业认知规律。实践教学可以在试验室和实训基地进行,亦可在课堂上进行案例讨论,这样既可以激发学生学习统计知识的兴趣,又有利于统计知识和统计观念在不同学科背景的人群间的传播、普及。

2.改革教学内容,坚持实用导向。目前高职院校的统计教材在内容安排上多是以“正文+复习思考题+练习题”的单一模式,且复习思考题及练习题多是对正文内容的一个简单重复。这类教材通用性比较强,但针对性不足,对培养学生的融能能力、观察能力和抽象能力等都是不适应的。

合格的高职统计教材内容应与职业定向性相一致。因此建议在选用教材时,应本着“实用、通俗、系统”原则,结合学生各自专业来选用统计学教材。但目前能结合各专业的统计学教材仍比较少,所以在使用教材时,应整合原有统计学教材内容,将教学背景放在企业经济和社会经济环境下,将统计和企业的实际决策紧密地联系在一起。如会计专业应结合如何应用统计知识购房买车,如何运用统计方法投资理财;市场营销专业应结合统计方法来确定营销对象的有关资料、确定市场潜量和销售潜量,并预测产品的销售情况,根据景气指数、居民消费价格总指数及国民经济宏观状况指导企业的营销实践活动;国际贸易专业应结合统计分析方法,来理解进出口贸易总额和社会总供给与社会总需求等指标在外贸企业中的指导作用,分析对外贸易数据与中国的经济增长关系,为促进对外贸易增长准备好第一手资料;金融专业要结合统计分析方法对银行做企业资信分析和贷款能力分析等等。

3.改变教学方法,理论与技能并重。理论知识来源于实践活动,又反过来指导实践活动,理论与实践在相互作用中共同发展。统计教学也是如此,实践的进行是检验学生掌握理论知识熟练与否的一个标准。统计实践教学要采取多样化的教学方式。

第一,“围绕实际问题情景法”

统计在日常生活中大量存在,比如人口普查、体育、风险投资等。围绕实际问题情景式法不同于传统的理论教学法,它属于实践活动的真实模拟,通过实际问题教学,消除理论和实际之间的鸿沟。教师以培养学生实践能力为中心,根据各章节的内容选用合适的问题为教学服务,引导学生的学习热情,充分发挥他们的主观能动性。围绕实际问题展开教学的过程中,一是问题应尽可能地蕴涵教材中的重要概念和原理,从而使学生在问题的自主讨论解决过程中加深和巩固理论知识的学习;二是教学中的实际问题应包含有复杂、模糊或亟待解决的内容。通过这样的实际问题,让学生在问题的发现和解决过程中建构知识,激发学生主动学习的兴趣。另外,为了让学生能够迅速地抓住问题的主旨,教师最好在实际问题后面给学生提供可以研究的方向,以供学生选择,也可以让学生自己列出具体项目。

第二,“统计模拟实验法”

人口统计学变量分析篇5

均值的局限普遍用于描述样本集中趋势的测量之一是均值。它对于近似正态的对称分布样本来说是比较好的测量,对于不对称分布则不然,尤其会受到极端值的影响。两个分布完全不同的样本可能会有相同的均值,因此均值在某种程度上抹杀了样本内部的差异,而往往这种内部差异正是需要我们进行深入研究的、或应当引起人们注意的。为了弥补均值的这个缺陷,一般在报告均值的同时也报告方差,或用直方图/散点图的形式描述分布,以提请读者注意群体内部的差异。

不同群体的可比性在描述性统计中,往往涉及到对不同时期或不同人群的总体描述,以反映社会变化或地区差异。在社会科学中、尤其是人口研究中,不少事件的发生都是与年龄密切相关的,如我国妇女大部分在35岁以前完成了生育,从而导致35岁以上育龄妇女中极高的避孕现用率。在这种情况下,两个样本之间存在避孕现用率的差异可能只是年龄结构的差异,而不是年龄别避孕现用率的差异。又如在报告流动人口犯罪问题时,给人的印象往往是流动人口犯罪率高于常住人口,但忽视了流动人口的年龄和性别构成与常住人口完全不同,且青年男性是犯罪率较高的人群。这种对两个不同群体的比较往往会导致错误的结论。

绝对数的使用由于中国人口数量巨大,调查研究也比较容易得到大容量的样本,所以对任何小概率事件用绝对数报告都会出现惊人的巨大数字,单纯对绝对数的强调往往会产生戏剧性的效果。比较合理的方式一般是在报告某事件绝对数的同时,给出该事件的发生率或占研究人群的比例。

小样本的代表性在一次抽样的小样本中求得的率或比例会非常不稳定,与另一次抽样的结果可能会有较大差距。因此当研究仅限于从小样本获得的资料时,应当在报告比例的同时也报告样本量。

2双变量统计分析

在社会科学研究中,首先分析的往往是两个变量之间的关系,如用相关或列联表等方法。一般在确定两个变量之间确实有某种关系,如在经过统计检验后证实两变量有显著相关关系,进行更进一步的分析才有意义。因此,双变量统计分析在实证分析中占有重要地位。但是,由于在应用中对有些问题的忽视,双变量统计分析也很容易出现偏差或错误。

卡方检验的局限在利用列联表对两个定序/定类变量进行相关分析时,需要进行统计检验来判断两个变量的相关是否有统计上的显著意义。不少研究结果都用卡方检验的显著性报告相关状况。但值得注意的是,卡方统计量的计算本身是有局限性的,样本越大,卡方值就会相应增大,因此大样本的卡方检验很容易得到显著结果。所以一般在报告卡方检验结果以说明两变量是否显著相关时,还应当同时报告相关强度,即相应的相关系数,如Gamma,Lambda等。

统计意义上的显著与差别的实际意义在检验两个定距变量的均值差别是否具有统计上的显著性时,也存在相似的问题。由于样本量越大,样本均值分布的方差就越小,因此常用的t检验结果就越可能显著,任何细微的差别都可能有统计上的显著性。但有时具有统计意义显著性的差异,在实际生活中可能意义并不大,如同在两个草堆之间找出一根草的差距,对判断两个草堆的大小没有实际意义。因此,对任何检验结果都应当有符合实际的解释和说明。

虚假相关问题双变量分析中的虚假相关问题,几乎在所有关于社会科学研究方法的教科书中都会涉及到,在统计分析方法的教学中也被视为经典问题。但是多少年来,人们仍然在不断地重复着这个“经典的错误”,即认为可见的或统计检验结果显著的相关就是真正的相关;更为大胆的做法是把这种相关关系推向因果关系。我们知道,对于有的变量来说,即使是经过检验判定两者具有统计上显著的相关关系,也不一定存在实际意义上的关系,因为可能有未考虑到的变量或不可测量的变量在同时对两个研究变量起作用,有时甚至可能完全是偶然的巧合。例如,火灾的大小是以火灾损失来衡量的,而参加灭火的消防员人数是与火灾大小有关的,火灾越大,出动的消防员就越多,但凡是具有常识的人都不会根据出动消防员人数和火灾损失两个变量之间的高度相关,断定出动消防员越多火灾损失就越大,因为火灾的规模是决定因素(但很难直接衡量)。在有关人口科学研究中也有报告虚假相关的现象,如人口增长率的降低导致了经济增长的提法就是一例。因此,在分析相关关系时,应当根据理论、知识、经验、甚至常识来判断这种分析是否有意义、是否存在其他变量的作用(称为外在变量),避免得出有悖于常理的分析结果。有些虚假相关是可以通过统计分析方法判别的,如在控制了另外一些变量后观察两个变量的偏相关,或在双变量分析的基础上,进一步用多变量分析深入研究。

3多变量分析

回归分析是多变量分析中应用最多的方法,尤其是逻辑斯蒂回归更是被广泛地应用。在众多应用中,比较明显的问题是使用方法是否得当和对结果的报告和解释是否规范、合理(见2002年第2期《人口研究》刘金塘文)。此外还有一些应当引起注意的问题。

分析框架的重要性在社会科学研究中,各变量之间往往存在错综复杂的关系,如果在进行回归分析之前没有一个清晰合理的分析框架,那么回归的结果有可能会引起质疑。一般应在报告回归分析结果之前,介绍该分析的框架,如各变量的定义、各自变量与因变量的假设关系及其理由等,对建立的回归模型做出合理性论证。有一些变量可能是作为控制变量纳入回归模型的,如性别、年龄等,最好事先解释清楚。对假设因果关系的模型,应当至少能够说明:(1)该因果关系在理论上是正确的、在实践中是合理的;(2)从事件发生的时间上来说,应当是原因发生在先、结果发生在后。如有些回归分析中,未加说明即把所有与因变量显著相关的变量都囊括在自变量中,甚至有些自变量与因变量有明显的互为因果关系,显得分析逻辑混乱;还有的论文在简单介绍研究背景和数据来源之后,急于建立因果关系并推出回归分析结果,然后再根据各变量在回归模型中的显著性一一说明,这相当于事后解释;这些做法都是错误的。

在具备“奔4”微机和较易操作的软件的今天,转瞬间就可完成一次回归分析,但是在此之前,需要有大量的前期准备工作,包括文献检索和理论框架构建,才能确保统计分析的科学性。

分析方法应用的条件每种多变量方法都有各自的前提条件或假设,如果这些条件不具备或者假设不成立,该方法的应用就成问题。如Pearson相关是考察线性相关关系,多元方差分析只能辨别线性相关因变量的多元差异,线性回归分析假设自变量与因变量之间为线性关系,因子分析方法也是建立在各变量具有一定的线性相关基础之上的;另外,在逻辑斯蒂回归中,每个分类都应保证有足够的频数,如果频数太少就会影响参数估计的稳定性;等等。尽管一般不在报告分析结果时说明各种假设是否成立或条件是否满足,但是在进行分析时应当自觉地进行考察。如果不能满足条件或假设不能成立,就对数据进行转换或调整后再分析,或者改变分析方法。

多变量分析结果的展示和解释多变量分析的结果一般是通过列表来展示的。现在一种并不少见的做法是直接把统计软件的输出直接复制到论文中,我们往往会在文章中看到包括回归参数估计、参数标准差、检验统计值、检验显著性、偏相关系数等等n行m列的大表,使人有目不暇接的感觉。实际上参数标准差和检验统计值是提供给分析者的信息,没有必要列在结果中;如果不是有特别需要的话,偏相关系数也不是关注重点;最主要的应当是回归参数估计及其显著性。

人口统计学变量分析篇6

作者简介:张翠芳,中共韶关市委党校讲师,研究方向:企业管理与绩效评价。

一、前言

人口既是生产者又是消费者,并通过这种两重属性与经济社会产生密切联系,现代系统理论将人类的生存发展作为一个大系统,而人口、经济、社会等都是其子系统,各子系统相互依存、相互渗透、相互影响。人口数量、人口素质、人口结构及人口分布等人口系统的情况及其变动对一个区域的经济、社会发展都具有重要影响作用,这种影响促进还是阻碍经济、社会发展难以凭空判断。

本文以广东省韶关市的人口数据为例,评价分析该地区的人口与经济、社会发展的协调性。韶关市位于广东省北部,属于经济欠发达地区,可将韶关市看作一个具有复杂功能的特殊系统,人口、经济、社会都可以看作这个系统中的子系统,以韶关市2000—2010年人口、经济、社会指标为例计算评价其人口、经济社会发展水平,并分析韶关市人口数量、结构、质量及空间分布是否与本市经济、社会发展水平之间具有协调性,全部数据来源于2011年韶关市统计年鉴。

二、评价人口、经济和社会发展的指标体系

全面、客观地评价人口、经济和社会的协调发展状况需要建立科学的指标体系,并应遵循以下四个基本原则:

1.科学性原则。即指标体系建立在科学的基础上,能够准确、全面、系统地反映人口、经济和社会发展的内涵。2.实用性原则。合理地选择指标,指标数据应易于统计,统计数据能确保权威性。3.完备性原则。指标体系作为一个有机整体,要能反映和测度被评价系统的主要特征。4.可行性原则。从实际情况出发,选择有代表性的综合指标和主要指标,那些在统计上无法量化、数据不易获得或相对不十分重要的指标可暂时不列入。

根据指标体系建立的相关原则,选取的指标如下:

三、人口、经济、社会各子系统综合发展水平的评价

采用主成分分析方法对各子系统综合发展水平进行评价,评价的原理及具体步骤如下:1.收集整理基本数据,采用Z—Score法对数据进行标准化,得到标准化后的数据;2.通过主成分分析法,求相关矩阵、特征根、特征向量和方差贡献率;3.求主成分及其得分;4.计算各主成分的得分与其特征值的乘积和得到各系统的综合发展水平值。本文利用SPSS软件处理上述数据,可自动将原始数据标准化、计算主成分得分。

下面以人口子系统为例,简述系统评价过程:

第一步,收集原始数据,2000—2010年人口子系统所选变量的值见表1,将表1中的6个变量数据粘贴至SPSS软件中,利用数据分析、降维、因子分析进行主成分分析。

第二步,分析软件输出的公因子方差见表2,表2给出了提取公因子后前后各变量的共同度,它刻画了全部公共因子对于变量Xi的总方差所作的贡献,说明了全部公共因子反映出原变量信息的百分比。例如,提取公共因子后,变量X1的共同度为0.980,即提取的公共因子对变量X1的方差做出了98.0%的贡献。从表2的数据可以看出,各个变量的共同度都比较大,说明变量空间转化为因子空间时,保留了比较多的信息,因此因子分子的效果是显著的。

人口、经济和社会子系统综合发展水平值见表5。由表5可以看出韶关市的人口、经济和社会子系统的综合发展水平趋势。2000—2010年人口子系统的综合发展水平值按时间顺序呈现先上升后下降的趋势,2005以前是上升趋势,以后呈下降趋势;经济和社会子系统的综合发展水平值按时间顺序呈现明显的上升趋势。2008年以后人口系统水平又变回负值,2010年水平与2000年相差不大,说明人口方面2005年以前是不断进步的,2005年之后水平呈现逐年退步趋势;经济、社会子系统的综合发展水平在2007年之后发展速度不断加快,这与韶关市经济、社会等各方面建设取得了与日俱增的进步密切相关。

四、人口、经济和社会子系统协调发展状况分析

韶关市人口、经济和社会子系统的综合发展水平值呈现出不同趋势,其中经济、社会子系统的变化趋势相同,而人口子系统综合发展水平值在2005年出现下降趋势,如果韶关市人口水平继续沿此下降趋势发展,人口问题可能会成为制约韶关市经济社会快速发展的不利因素。

导致人口系统综合发展水平值出现先升后降趋势的主要原因也反映了韶关市人口发展方面的一些问题:

首先,常住人口总量减少。尽管韶关市户籍人口每年都以低速增长,但常住人口数量自2005年292.26万人以后不断减少,2010年人口数量降至282.66万人,这主要是由韶关市劳动力流出数量大于流入所致。农村劳动力大量转移对于缓解资源压力、农民增加收入等方面发挥了重要作用,但过度转移对于当地的经济社会发展也会带来诸多负面影响,如本地农业生产劳动力减少、留守老人、留守儿童等一系列问题。高素质劳动力大量转移对本地经济发展也带来了不利影响,例如韶关市本地有多所技校,但是很多毕业生在就业时首选珠三角等经济发达地区,只有少部分毕业生留在本地工作,从而不利于韶关市工业发展。

其次,在校生人数呈下降趋势。尽管韶关市高等学校、中等职业学校、技工学校的在校人数在2000—2010年间呈增长趋势,但由于多年来人口只维持低水平增长率,小学在校生人数由2000年的338916万人降至2010年的207299万人,在校生总人数自2005年开始呈现下降趋势。这个问题也在一定程度上反映了韶关市当前人口结构的不合理现象。

第三,城镇化水平无显著提高。在人口指标体系中户籍人口中非农人口的比例自2005年之后一直下降,2000—2010年间韶关市城镇化水平变化不大,因此,韶关市在今后的发展过程中需要加快城镇化进程,以工业化带动城镇化,提高城镇化水平。

[参考文献]

[1]苏海红.青海省人口与经济社会协调发展问题研究[J].西北人口,2005(1).

[2]田成诗,盖美.关于人口与经济社会协调发展状态的研究[J].统计与信息论坛,2004(4).

人口统计学变量分析篇7

随着中国经济的发展,具有中华民族传统服装特色的服饰文化正逐步在设计界崭露头角,中国传统服饰文化源自生活,有着纯朴的艺术样式,在时尚舞台上显示出其独特的生命力,是设计灵感的宝贵源泉,成为服装设计风格中的一抹亮色。近年来,以中国传统服饰文化元素为依托的中式服装品牌无论是在款式的多样化、服装的品牌化以及市场化等方面都有了长足的发展,但相比于国外品牌,国内服装品牌在品牌意识和市场意识方面、在市场营销手段和市场运营水平方面都显得略逊一筹,如何在激烈的市场竞争中以终端消费需求为着眼点细分市场,充分了解目标消费群体的消费心理特征,根据消费者的消费需求设计适销对路的产品,才是提升企业竞争力、成功运作中式服装品牌的关键。

在市场竞争如此激烈的现代社会,细分市场是熟悉市场的前提。市场细分的方式和方法有很多,可以运用的变量也很多,营销学上比较常用的重要变量有地理变量、人口统计变量、心理变量、行为变量等,不同的细分变量有着不同的细分结果,营销人员一般要根据经验并结合实际情况选择细分变量。细分后的市场必须具有可衡量性、可达到性、实际价值性和行动可能性四个特征[1]。由于人口统计变量的易衡量性和其与消费者的购买欲望、使用频率等因素有密切联系,常用人口统计变量区分消费群体,本研究的目的是分析上海中式服装市场,初步选择性别、收入、年龄3个代表性人口统计变量为基础细分市场,分析每个目标消费群体的消费行为与消费心理特征,在此基础上,用因子分析的方法,通过对消费者的消费心理和生活态度、消费方式等方面的调查,进一步找出将消费者分群的内在因子。以下分析均运用SPSS Statistics17.0进行统计分析。

1 以人口统计变量细分市场

1.1细分市场

通过设计调查问卷**,选择性别、收入、年龄3个代表性人口统计变量初步细分市场,问卷发放400份,实际回收394份经济论文,有效问卷394份,频数分析结果如表1:

表1人口统计变量频数分析表

 

性别

频率

百分比

有效百分比

累积百分比

153

38.8

38.8

38.8

241

61.2

61.2

100.0

合计

394

100.0

100.0

月收入

频率

百分比

有效百分比

累积百分比

2000元以下

131

33.2

33.2

33.2

2001-4000元

38

9.6

9.6

42.9

4000-8000元

105

26.6

26.6

69.5

8000元以上

120

30.5

30.5

100.0

合计

394

100.0

100.0

年龄

频率

百分比

有效百分比

累积百分比

18-25岁

34

8.6

8.6

8.6

26-35岁

111

28.2

28.2

36.8

36-45岁

184

46.7

46.7

83.5

45岁以上

65

16.5

16.5

100.0

合计

人口统计学变量分析篇8

自然资源和生态环境是经济社会发展不可缺少的物质基础,而衡量一个国家的经济状况和经济能力,通常以国民生产总值GNP为标准,自然资源和生态环境对经济社会的贡献价值却并不包括在内。H.T.Odum等人创建的能值分析法,通过尽可能全面的整合研究经济社会和资源环境系统,计算分析生态-经济系统各项数据,以评估国家生态经济社会系统发展规模、发展水平、发展态势及其与资源环境的适宜性、协调性,为区域和国家经济社会发展提供科学依据。改革开放近30年来,中国经济社会发展取得了举世瞩目的成就,但日益严峻的资源枯竭、生态退化和环境污染问题,已对经济社会进一步发展构成障碍。本文采用能值分析的原理和方法,对中国自然-经济-社会复合系统展开分析,以研究其资源环境-经济社会系统发展现状,并对1985-2005年20年间中国经济系统资源环境利用的动态演变趋势展开分析。

1 能值分析理论与方法概述

生态经济系统能值分析法是美国生态学家H.T.Odum等人于20世纪80年代创建的,以动态、开放、整合的视角评估区域经济社会与资源环境可持续发展水平和潜力,是目前生态环保学界公认的最有发展前景的生态经济系统评价体系。该方法把生态环境系统与人类经济社会系统有机联系和统一起来,将生态经济系统内流动和储存的各种不同类别的能量和物质转换为同一标准的能值,定量分析研究资源环境对人类经济活动的真实价值,以及经济社会与资源环境的互动演变关系。其研究成果对于调整生态环境与经济发展关系、资源环境的科学评估与合理利用、国家经济方针政策的制定、国际经济关系的协调、人与自然的和谐共处,以及具体生产活动过程等,都具有科学的指导意义[1]。

1.1 能值与能值转化率

由于现实生态经济系统中物质类型复杂多样,因此,不同类别、不同形式的物资与生态环境、经济发展的关系往往难以找到同一种标准进行度量和比较,因此,H.T.Odum提出了能值(emergy)的概念,并说明:能值即“包被能”(embodied energy),产品形成所需直接或间接投入应用的一种有效能的总量;由于自然界中几乎所有物质的能量都来自于太阳能,某一物质的能值就是该产品形成所需的太阳能焦尔总量。太阳能值(solar emergy)单位为太阳能焦耳(Solar enjoule,缩写为sej)[1,2]。通过把生态经济系统中的各种不同种类、不可比较的物资转化成同一标准――太阳能值,对经济社会发展对资源环境的消耗、利用状况展开分析,以探索自然资源、生态环境和人类经济活动的相互关系和演变规律。能值转化率(emergy transformity)是将现实世界中各种纷繁复杂的物资转换为能值的媒介。在生态系统和人类经济社会系统中,低质量的物质能量总是通过相互作用和做功,转换成高质量、高等级物资所含能量。在能量转化链中,随着能量流动和转化,其数量逐步减少,能值逐渐增高[3]。因此,不同物质组成的物资所含的能值量并不相同。处于能量转化链高端的物资有更高的能值转化率。因此,能值转化率也是衡量能量等级的尺度[4~6]。[KG)]能值-货币价值(emdollar value,Em$)是指某种能值对经济的贡献折算成货币,即能值相当的货币价值。其折算方法是将当年国家GNP与其所利用消耗的所有能值的比值,得到能值-货币比率,即单位能值对GNP的贡献率。不同类别能值的流量与能值-货币比率的乘积,也就是该类能值在当年对国家GNP的贡献价值。由于每年国家能值消耗总量与GNP都不同,因此,每年的能值货币-比率都不一样,相同的能值量对GDP年贡献值也不相同。H.T.Odum曾用“宏观经济价值”(macroeconomic value)来表达能值相当的经济价值,以表示资源能值对经济的价值[1,7],我国很多学者也沿用这样的说法。

1.2 能值指标体系

能值分析指标体系(见表1)是生态经济系统综合分析社会经济发展决策的重要指标体系,在反映自然资源利用情况、环境与经济关系、人地关系的同时,综合反映自然-社会-经济复合系统的结构、功能和效率。可在绘制区域能值图、编制和计算区域能值分析表的基础上,计算、分析和利用能值指标体系,分析、评估区域生态环境和经济社会发展的协调程度。

2 基于能值的中国自然-社会-经济复合系统运营现状分析

能值分析能较全面的反映区域自然-社会-经济复合系统的结构、功能、效率和运营机制。本文利用目前为止最新出版的2006年中国统计年鉴公布的数据,按照能值分析的理论和方法,将2005年中国自然、社会、经济数[CM)]据转化为能值分析数据,研究当前中国生态经济系统运营状况,力求客观真实的反映其经济社会发展现状及其与自然资源、生态环境的关系。

2.2 能值计算分析表

依据H.T.Odum的能值分析法,利用2006年中国社会经济统计年鉴及2006年环境统计年鉴中2005的自然、经济、社会和环境数据,编制、计算与能值分析指标表,并作进一步分析。

2.2.1 可更新资源输入与可更新资源产品产出能值表

表2是根据2006年统计年鉴计算得出的2005年中国生态经济系统可再生资源输入与可再生资产产品能值分析表。外部输入的可更新资源能值量由地理位置、地域面积、气候、地形条件所决定,由于在大范围内气象气候条件的相对稳定性,一般而言,其能值量年变化极小,因此属于相对稳定值。而内部可再生资源产品与消耗能值量则与农林牧渔业的生产力水平及国民饮食、生活消费水平密切相关。

表1中各项能值数据说明,种植业、畜牧业以及渔业的生产和消费构成我国可再生资源利用和消费核心组成要素总能值为9.69×1024sej,能值货币价值为6 480亿$,其中畜禽产品、水产品、种植业(包括林业)产品能值产出和消费比重依次为59%、22%、19%,林产品消费所占比率相对较小,这说明多年来我国以林业建设与保护为核心的生态环保已得到社会共识,对森林资源的开发、利用和依赖性减弱。因此,当前我国农业产业结构已经基本实现了以“畜禽、水产养殖”为主,以粮食生产为核心的种植业居于次要地位,同时城乡居民食品消费中,肉、蛋、奶消费占主要地位,显示人们生活水平有了极大的提高。但畜禽养殖引起的环境污染问题却日益严重,据初步统计,目前我国每年禽畜养殖场排放的粪便及污水总量超过17亿 t,再加上集约化生产的冲洗水,实际排放的污水总量还远远超过这个数字。城郊集约化大型鸡场、猪场畜禽粪尿污染已成为城郊环境质量恶化的重要原因[16]。

2.2.2 内部不可再生资源产品产出与消耗能值分析表

内部不可再生资源产品的产出与消耗能值分析表,建立在以区域内部不可再生自然资源开发利用和经济社会生产投入的基础之上,据此可以分析我国矿产、能源、土地开发利用情况和经济投入-产出水平。

表3数据显示,2005年中国内部不可再生资源能值消耗总量为1.63×1025sej,能值货币价值为10 300亿$,远远超过对内部可再生资源的消耗量。不可再生资源的消费中,化石能源、金属、水泥、土地损失所占比例最大,这是全国范围内高速城市化引起的城镇扩张、交通设施建设的必然结果。而能源消费中,煤炭所占比例为70%,符合我国当前以煤炭为主的能源消费结构。

当年过热的经济形势导致中国目前化石燃料、矿物、金属、水泥等能值消耗量巨大。权威部门的统计数据表明,2006年,按现行汇率初步测算,中国GDP总量占世界的比重约5.5%,但能源、钢材、水泥消耗量却居世界第一位。能源消耗总量折合24.6亿t标准煤,占世界的15%左右;其中煤炭消耗占全世界消耗总量的36.93%,比美国、前苏联、欧盟(25国)三者煤炭消耗的总量还多,钢材消费量为3.88亿t,水泥消耗为12.4亿t,占世界比值依次为30%、54%。资源巨量消耗的结果不仅仅是资源枯竭和生态破坏,环境污染形势也日益严峻。目前中国CO2排放量超过欧盟25国总和,仅次于美国,居世界第二位。

同时,中国还是世界最大的化肥、农药生产、进口和使用国,化肥、农药以及耕地有机质损失在总不可再生资源投入中虽然所占比例不大,但是总量却足以引起我国大面积耕地土地酸化、板结和土壤肥力降低以及土地污染,并导致一系列生态退化问题。中国年化肥使用量达6 294万t(2005年我国化肥工业生产数据与进口数据之和),耕地每公顷化肥施用量高达610 kg/hm2,差不多是发达国家化肥平均使用量225 kg/hm2上限的3倍;每年农药使用量近120万t,但其中绝大部分农药残留在土壤、水体、作物和大气中,农业生产中不合理使用化肥、农药已对农业生态环境造成巨大危害[8,9]。

因此,目前中国经济的高速发展是建立在资源消耗、态破坏和环境污染的基础之上的,改变当前的经济增长方式,改进生产工艺和生产技术,提高资源利用效率、提高劳动者的科学文化素质和技能,已经迫在眉睫。

2.2.3 外部进口资源与产品能值计算分析表

为了说明中国经济社会发展、资源环境演变与世界的关系,利用2006年中国统计年鉴中的2005年海关统计的进出口资源与产品相关数据进行能值计算分析。表4、表5分别为中国进口、出口资源产品能值计算数据。

表4数据显示,中国2005年进口能值资源总量为6.54×1024sej,能值货币价值为4 370亿元。进口资源以能源、农产品和工业产品为主,其中,能源进口所占能值比重接近75%,其中石油能值占绝对核心地位。可见,随着我国国民经济的发展,能源需求和消费量剧增,能源对外依赖性加大,自给能力减弱。在进口农产品中,主要以种植业产品为主,其中油料和粮食能值进口量最大。工业产品中,金属(包括钢材)、化学产品能值进口量较大,而其它产品进口量相对较小。另外,在吸引外资、发展对外旅游业等方面,也取得较好业绩。从总体进口物资类型来看,我国进口主要集中在资源和原材料上,工业成品进口量不大,显示我国工业制造能力、制造水平以及工业化水平显著提高,已经实现了由资源、原材料出口、工业产品进口国向工业制造大国的转变。结合表3数据,可见工业化使中国能源、资源的消耗量十分巨大,在大力开采本国矿产、能源等不可再生资源的同时,还必须大量进口国外资源满足经济社会发展的需要,资源对外依赖程度加大,同时工业“三废”排放引起的环境污染形势必然更加严峻。

2.2.4 出口资源与产品能值分析计算表

表5中出口资源与产品能值分析数据,以《2006年中国统计年鉴》中公布的2005年我国外贸出口物资类型及数量进行,用以分析我国出口贸易情况及其与生态环境的关系。

表5数据显示,2005年中国出口物资能值总量为3.38×1024sej,能值货币价值为213亿$。相当于进口资源产品能值总量的1/2。因此,在资源产品进出口方面,中国目前已是能值资源净进口国,显示经济社会发展对资源的需求量加剧。出口资源产品类型众多,主要以农产品、工业制成品以及能源为主。能源出口中,石油及成品油、煤炭和焦碳出口量大;农产品出口中,棉花、谷物、肉类、水产品、植物油、蔬菜比例较高,另外中国机械工业制品、服饰(包括纺织品、服装、皮革以及皮革制品)等工业成品出口量大,对外投资和对外劳动服务发展形势良好。结合改革开放近30年来我国出口物资发展情况,这些数据充分说明我国出口物资已经实现由资源和原材料出口向工业制成品出口的转变,并在国际经济贸易中实现了由消极被动接受市场变化向积极主动参与全球经济中寻求市场、发展自我的重要变革。

但成品石油、焦碳炼制、皮革制造、机械制造等工业以及畜禽、水产养殖等严重污染大气环境、水环境和土地环境,目前在中国已经造成十分严重而且难以恢复的环境后果。中国在融入世界市场、成为世界“工厂”,为世界大量输出工业产品的同时,把“三废”留在国内,经济发展是以本国自然资源和生态环境为代价的。

2.3 基于能值的中国生态经济系统发展现状总体分析

为了从总体上分析中国生态经济系统发展运营态势,将各项能值项目汇总后再进行总体分析。

改革开放以来,我国每年出口物资与日俱增,很多生态环境学家担心大量物资出口以及工业化进程加快,会导致我国生态环境的退化和环境污染的加剧。表6的数据显示,2005年我国出口能值大大低于进口能值,大约只相当于进口能值的1/2,这说明在当前的国际经济贸易中,中国经济社会发展对外的依存度在加大,本国自然资源和生态环境也不足以满足当前经济社会发展的需要。

内部不可再生资源消耗量总量在总能值消耗中占的比重达47.5%,说明我国当前的经济社会发展模式对不可再生资源如能源、矿藏、土地等消耗量极大,而这些不可再生资源的损耗,将降低我国经济社会自我发展的潜力,从而加大对国际市场的依赖性。总体情况而言,中国在国际市场中是大批工业产品的制造者和输出者,输出工业产品的同时工业三废留在国

内,因此,当前我国经济社会发展是建立在资源低效率利用和生态破坏、环境污染的基础上的,距离可持续经济模式还有相当大的差距。

3 1985-2005年中国生态经济系统能值动态变化分析

为了说明改革开放以来中国生态经济系统运营态势的动态变化情况,我们利用1986年、1996年统计年鉴中1985年、1995年、2005年经济系统的运营数据,整理分析并编制能值分析表,此基础上计算各年各项能值生产消费情况,汇总统计见表7。表7中的年均增长幅度是以1985年和2005年的数据计算的算术平均数计算得出。

3.1 1985-2005年中国生态经济系统各项能值利用动态变化趋势分析

表7显示,在1995年以前(包括1995年),我国经济出口能值量都大于进口能值量,在1985年时出口能值量差不多是进口能值量的2倍,而当时的出口主要以自然资源和原材料为主。大约在1996-1997年进出口能值大体持平。此后进口能值量快速增加,在2005年进口能值已相当于出口能值的2倍,出现了与1985年相反的能值进出口贸易形势。可再生资源的产出也呈现良好增长态势,这和我国农业科学技术进步及农牧业产业结构适时转变密切相关。内部不可再生资源产品的生产和消费变化相对较为缓慢,但年均增长幅度也达到5.45%。总体情况看,长期以来,我国内部不可再生资源的生产和消费量最大,其次是内部可再生资源的消耗,同时都呈现较高幅度的增长态势。图3更加直观显示了同样的信息。

3.2 1985-2005年能值指标体系比较分析

为了深入分析说明改革开放以来中国经济社会发展与环境的关系,我们分别计算了1985年、1995年、2005年能值指标体系见表8。

表8中的能值来源指标各项数据显示,我国经济社会发展对进口能值的需求量在1995年以后迅速增长,说明我国经济社会发展资源压力加大,对外依存度增高。社会经济亚系统能值指标显示我国人均能值消费量也呈增加态势,1995年人均能值消费量差不多是1985年的2倍,这说明我国城乡居民生活水平有了显著提高,对物质财富的消费需求量加大。而国家内部资源的人口承载量的增加,则与科学技术进步使资源利用效率增大相关,但目前我国资源承载人口的能力仅为当前全国人口数量的一半,因此,我国人口依然使资源环境面临严峻压力。货币-能值比率呈下降趋势,显示我国经济发展水平的提高,同时也从侧面反映了1995年以来我国通货膨胀状况。能值交换率数据显示了我国对外经济贸易日益繁荣的发展形势,也说明了我国经济社会发展与全球经济社会发展密切相关。能值投资率是衡量自然生态环境对经济活动的容受力,表中显示变化不大,这与工农业发展和科技进步导致自然环境承载力增强有关,同样的原因也显示我国可再生资源的人口承载力增加。

4 结 语

本文利用能值分析法,在收集整理相关统计数据的基础上,对2005年中国生态经济系统的能值生产和消费情况做了运算和分析,以说明我国自然-经济-社会复合系统的运营机制和生态环境效应现状,并在对比分析1985年、1995年、2005年能值指标体系的前提下,说明我国生态经济系统演变的动态趋势。结果表明:改革开放以来,我国经济社会发展已取得长足发展,对外贸易结构和规模产生了巨大变化,已经由20世纪80年代以资源和原材料输出为主、工业成品输入为主转变为资源输入、工业成品输出为主,在国际贸易中处于相对有利的地位;同时我国居民的人均生活消费水平明显提高,生活消费结构改善,科学技术的进步使工农业生产力水平大大提高,生态环境承载力显著增强。但同时,资源自给能力减弱,对外依赖性加大,人口资源需求量大,目前的经济社会发展模式还是建立在资源低效开发利用的基础上的,环境污染、生态破坏的形势也日益严峻,距离可持续经济社会发展模式还有相当大的差距。

参考文献(References)

[1]蓝盛芳.钦佩等.生态经济系统能值分析[M].北京:化学工业出版社,2002,10~11.[Lan Sheng Fang.Qin Pei etc. Emergy Analysis in Ecological Economic System[M].Beijing: Chemical Industry Press,2002,10~11.]

[2]李双成,傅小锋,郑度.中国经济持续发展水平的能值分析[J].自然资源学报,2001,16(4):297~304.[Li Shuangcheng, Fu XiaoShan. Zheng Du. Emergy Analysis on Sustainable Level of China[J]. Journal of Natural Resources,2001, 16(4): 297~304.]

[3]Ugiati S,Odum H T,Basfianoni S.Emergy Use,Environmental Loading and Sustainability:An Ernergy Analysis of Italy[J].Ecological Modeling, 1994(73):215~268.

[4]Odum H T.Environmental Accounting:Emergy and Environmental Decision Making[J].New York:John wiley& sons,1996,(90):69~ 71.83~ 87.216~ 218.

[5]李寒娥.蓝盛芳等. H.T.奥德姆与中国的能值分析研究[J].生态科学,2005年,24(2):182~187.[Li Hane, Lan Shengfang and etc.H T.Odum and Emergy Research in China. Ecological Science May,2005,24(2): 182~187.]

[6]李秀花.吕光辉等.城市复合系统能值分析及可持续发展评估――以乌鲁木齐市为例[J]. 农业科学研究,2005,26(2):31~34.[Li Xiuhua, Lǔ Guanghuietc. Emergy Analysis and Sustainability Assessment of an Urbansynthetic EcosystemA Case Study of Urumqi[J]. Journal of Agriculture Science,2005, 26(2): 31~34.]

人口统计学变量分析篇9

当今的时代是知识经济的时代,知识决定竞争的实力,人口素质的高低将影响和决定一个国家或地区的综合竞争实力。为此我国一直实行着控制人口数量,提高人口素质的基本国策。随着经济的发展,杭州市在基本国策的指导下人口素质是否得到了相应的提高,人口素质和产业结构变动之间是否存在一定的关系。本文以杭州市人口普查的资料为例,研究杭州市人口素质的发展情况,并进一步研究人口素质与产业结构变动之间的关系。

二、人口素质定义及评价指标描述

中国对人口素质内涵基础理论问题研究较早的是北京大学的张纯元教授,在《人口理论教程》一书中,把人口素质定义为"人本身具有的认识、改造世界的条件和能力"。在不同的社会生产方式下,人口在质的规定性方面的发展水平,总是体现为人口总体认识和改造世界的条件和能力。人口具有多方面的质的规定性,一般认为包括身体素质、科学文化素质和思想素质三方面的内容"。

从人口素质的外延来看,主要是"三要素"和"二要素"之争。本文作者认为,从社会学的角度来看,"三要素"论比较全面, 思想道德素质有很大的作用,不能忽视;但是如果要从统计研究的角度看,人口素质与产业结构变动的关系研究适宜采用"二要素"论的思想对评价人口素质的各个指标变量进行定量的研究,因为思想道德素质的研究缺乏必要的量化指标,给分析研究带来一定的不便。所以, 在以下的研究中将采用"二要素"的思想。通过人口的身体素质和科学文化素质,同时加入劳动技能素质这个指标,来分析人口素质与产业结构发展的关系。

根据人口素质的构成,遵循科学性、实用性、完备性和可比性的原则,建立人口素质评价指标体系。在身体素质方面,选取以下三个指标:(1)人口平均预期命,(2)出生婴儿死亡率,(3)全市卫生技术人员数。在科学文化素质方面,选取三个指标:(1)高校在校生人数,(2)教育经费占GDP的比重,(3)教职员工数量。最后在劳动技能素质方面,选取了三个指标:(1)全市专业技术干部,(2)劳动生产率,(3)第三产业人口比重(第三产业人口在从业总人口中占的比重)。

三、实证检验与分析

(一)综合人口素质评价

本文研究采用因子分析的方法对杭州市人口素质进行评价。首先对评价人口身体素质的人口平均预期寿命、出生婴儿死亡率、全市卫生技术人员数,三个指标进行因子分析。分析结果显示,可以提取一个公因子,累计方差贡献率为97.167%,这表明,用提取的这一个公因子就可以解释原有三个指标的97%以上的信息,即信息的损失量非常低,足以用该指标表示人口的身体素质。

其次对评价人口科学文化素质的高校在校生人数、教育经费占GDP的比重、教职员工数量,三个指标进行因子分析。分析结果显示,可以提取一个公因子,累计方差贡献率为94.03%,这表明,用提取的这一个公因子就可以解释原有三个指标的94%以上的信息,即信息的损失量非常低,足以用该指标表示人口的科学文化素质。

再次对评价人口劳动技能素质的全市专业技术干部、劳动生产率、第三产业人口比重,三个指标进行因子分析。分析结果显示,可以提取一个公因子,累计方差贡献率为93.449%,这表明,用提取的这一个公因子就可以解释原有三个指标的93%以上的信息,即信息的损失量非常低,足以用该指标表示人口的劳动技能素质。

最后将身体素质、科学文化素质、劳动技能素质的三个公因子进行因子分析。分析的结果显示,可以提取一个公因子,其累计方差贡献率为97.949%,这表明因子分析结果能很好的得出综合人口素质的评价。人口素质综合评价结果显示杭州市人口的身体素质、科学文化素质、劳动技能素质都在不断的提高,从而综合素质也才不断的上升。

从数据调查中显示,杭州市的身体素质、科学文化素质、劳动技能素质、综合素质都从1986的负值,一直平稳的上升为正值,达到现在的2左右。其中在1986年到2000年科学文化素质的发展相对来说是最慢的,而劳动技能素质的提高是最明显的,这说明这段时间杭州市在培养劳动力技、职业教育方面做出来比较大的举措,而在2000年到2010年时劳动技能素质的发展比科学文化素质的发展稍弱,这说明我们现在的劳动素质发展有待进一步提高。身体素质在1986年到1999年的时间里是在平稳上升的,但在1999年到2001年身体素质出现了一个较大的波动,在2000年降到了0.19左右,可能的原因是在这段时间里杭州的经济快速发展,人民的压力不断增加,生态环境加剧恶化,医疗卫生条件却没有与经济同步。同时1999年到2000年出现的传染病比率上升,导致出生婴儿的死亡率提高,而全市的医疗卫生条件还停留在前期的状态没有相应的提高,因此身体素质在1999年急剧下降。浙江省新生儿疾病筛选查是从2000年开始启动,医疗卫生条件也在不断的改进,所以在2000年以后身体素质就快速的回升。最终使得综合素质也在这段时间里出现了起伏比较大的状态。

(二)产业结构变动研究

首先本文采用K值来描述产业结构的变化。K值指标是用来动态考察某一时期内一国三产业结构变动速度,其计算公式如下:

K= │qi,t┈qi,0│

其中qi,t表示第i产业在即期的GDP比率或者就业比率。qi,0表示第i产业在期的GDP比率或者就业比率。K值越大表示产业变动幅度越大, 反之则越小。本文收集了1978年-2010年以来各年的三产业的生产总值,采用K值的计算公式得到了产业结构变动的结果如下图:

图1 K值变动图

从图1中显示,杭州市产业结构的变动幅度总体上比较平稳。1979年到1982年间,三产业的结构几乎没有什么变化,从1982年开始产业结构可是不断的变化。其中变化最明显的时间段是1989年到1994年,以后呈缓慢上升状态。对呈现此种趋势状态的解释是中国正处在经济转型期,技术、需求、收入、贸易等因素的影响导致整个中国的产业结构在这段时间内发生了巨大的变动。当走过这种转型期,中国产业结构的变动幅度会逐年下降,最后趋于平稳状态。在20世纪90年代早期东南部沿海经济迅速发展,外界因素对产业结构的冲击较大,产业结构变动的幅度也相应较大,而杭州就在其中,所以杭州的产业结构变动幅度会出现这样的趋势。

(三)人口素质与产业结构发展关系研究

本研究应用相关分析法对1978-2010年杭州市人口身体素质、科技文化素质、劳动技能素质与产业结构变动进行分析。其中人口身体素质、科技文化素质、劳动素质指标值采用因子分析法所获得的因子得分来衡量。相关分析结果见表1,在0.01水平上,身体素质、科学文化素质、劳动技能素质和综合素质四个方面都与产业结构变动达到显著正相关,其Pearson相关系数分别0.967、0.897、0.965,而人口综合素质的相关系数为0.941。这表明,人口综合素质的提高对产业结构变动具有显著的促进作用,特别是身体素质和劳动技能素质的提高,对产业结构变动会产生更加显著的作用。

表1 人口素质与产业结构变动K值之间关系

最后以综合素质为自变量,产业结构变动K值为因变量,对人口素质和产业结构变动之间进行回归分析,以确定人口素质和产业结构变动之间的关系。

经过分析得到的拟合方程为y=0.125x+0.419,判定系数R2=0.885;方差分析F=177.864,Sig=0.000;回归系数检验:常数项t=45.708,Sig=0.000,参数项t=13.337,Sig=0.000。回归方程总体达到显著程度,即回归方程有效。

四、结论与探讨

1.杭州市人口总体素质在不断提升,且人口总体素质与三产业发展都具有显著的线性相关关系,提升人口总体素质,对实现杭州市产业结构升级具有显著的促进作用。

2.虽然杭州市的人口素质总体在不断的提高,但劳动技能的提高比身体素质和科学文化素质要低。可是劳动技能与产业结构之间的相关关系是非常显著的,是产业结构变动与优化的极大推动力,因此杭州人口的劳动技能还没有完全达到产业结构的需求,杭州市必须采取一定的措施进一步提高劳动力的劳动技能。

3.杭州市的产业结构在稳步的变动发展,并在逐渐趋于平稳,产业结构升级也趋于缓慢,杭州的产业结构优化也有可能停滞不前。所以杭州产业结构升级优化还需借助外部因素的推动。

综上所述为了在提高人口素质的前提下推动产业结构的升级优化,杭州可采取以下措施:首先加强高校教育,使高校学生素质与市场需求接轨,为劳动力市场提供高素质人才,推进产业结构向上的不断升级;完善医疗服务体系、改进基础公共服务设施,为整体人口素质的提高奠定坚实的基础,加快城市化进程,以城市化的外力推动产业结构的变动。再次在确立"就业优先"经济增长模式的前提下,应实施劳动力技能教育与培训的系统工程,从系统的角度加强对劳动力的技能教育与培训,让劳动力的知识、技能、观念、区域分布等适应经济结构变化,与市场需求相匹配,提高劳动技能和素质,为产业结构的升级注入新鲜血液。最后加强三产业吸纳劳动力的能力,三大产业对劳动力就业的吸纳能力各不相同,按强弱顺序排列依次为第三、第二、第一产业。第三产业不仅是目前吸纳劳动力就业最重要的部门,而且随着经济的发展,其吸纳劳动力的能力还将提高。因此,杭州市应当加强目前第二产业的发展,大力促进第三产业的发展,特别是金融、房地产等服务业的发展,这是增加劳动力需求,实现产业结构更加合理的十分重要的途径。

参考文献:

[1]杭州统计局.杭州市统计年鉴[M].中国统计出版社,2011

[2]浙江省统计局.浙江统计年鉴[M].中国统计出版社,2001-2010

[3]杭州统计信息网.http:///web/.

[4]屈云龙;徐燕.人口素质评价体系的构建[J].人口与发展,2011(1).

[5]尹希果;李后建.经济区产业结构变动对经济增长影响的差异性研究[J].宁夏大学学报,2010(9).

人口统计学变量分析篇10

一、社会科学中的定性研究

所谓定性就是要对研究对象进行“质”的方面的理论思辨研究,一事物与另一事物之所以有所区别,就在于他们内在的本质不同,“质”所表征的是一种内在的规定性。定性研究方法强调研究者要深入社会现象之中,通过身临其境的亲身体验,建基于对原始研究资料的收集,对研究对象进行“情景化”、“主体间性”的意义解释。社会科学之中的定性研究,主要具有如下几个特色。

(一)自然主义式的探究

从自然主义的研究传统来看,定性研究应当在一种自然情景之下进行,社会科学所面对的,是人类的社会生活世界,在人类的社会生活世界之中的个人及其行动都是包含动机、包含意义的,对社会中的个人及其行为所进行的研究,离不开其所在的社会文化情境。要想对社会科学的研究对象有一个准确的理解,社会科学的研究者就需要与之进行接触、交往,对各种社会事件、社会事实进行观察和描述,与研究对象进行交谈,了解其所处的社会文化、环境、背景,在研究对象所处的“自然背景”之下,对其“本来面目”进行研究,从而才能对社会生活世界中的对象的思想、行为、动机、意义形成准确的理解。“自然探究的传统还要求研究者注重社会现象的整体性和相关性,对所发生的事情进行整体的、关联的考察。在对一个事件进行考察时,不仅要了解该事件本身,而且要了解该事件发生和变化时的社会文化背景以及该事件与其他事件之间的关系。”[1]在定性研究之中,对任何事件的理解都不能脱离开其所处的环境,定性研究之中的理解要涉及构成社会整体之中的各个部分之间的互动关系。

(二)对“意义”的理解

社会整体是由充满个体性、主观意识的个体组成的,所以要想把握社会现实、进行社会科学研究,就必须注重对社会个体的行动及其主观意识、个人经验和意义等进行理解、领会。在韦伯的理解社会学之中,他就十分强调“理解”在社会学的研究之中所占据的重要地位,认为“社会学指的就是一门试图说明性地理解社会行为,并由此而对这一行为的过程和作用做出因果解释的科学。”[2]

在社会科学的研究之中,对那些富于个性色彩的主观意识、个人经验和意义进行研究的时候,社会科学研究工作者会发现,难于找到一个像自然科学研究中的那种普遍适用的统一研究模式对复杂多变,充满个性化、特殊性的社会生活世界进行研究,所以他们会更倾向于采用亲身体验的研究方法进行观察、描述,从而达到对研究对象的准确理解,通过这种理解来准确把握人类社会生活之中的意义。在对研究对象的“意义”进行理解的时候,必须要刨除研究者自身的先见、偏见,以免使理解产生偏差。这种抛弃先见、偏见的主张,在胡塞尔的现象学思想当中也是有所体现的。

胡塞尔的现象学,强调“本质直观”,主张人类要面向事实本身,挖掘现象背后的本质所在,现象学所要研究的现象,已经不再是那种感官知觉意义之上的现象,不是那种实证主义中所指的经验层面之上的现象。“现象学所反对的是‘自然态度(natural attitude)’式的假说,即在习惯上相信实在的本质先于研究之前的假说。基于这种原则,现象学在方法论上提出了一个最基本的要求,即‘中止判断’。其含义是,研究者在研究现象时,不要以任何假设或信仰为前提,而要‘中止’一切有关‘生活世界’的‘自然态度’。”[3]45所有的先见、偏见等都要被刨除出去,再对研究对象进行描述,对其进行准确定性,从而发现人类生活世界之中的本质所在。定性研究方法,强调对质的规定性方面的考察,强调对事物整体性质方面的断定、把握,要想达到对研究对象真实本质含义的领会,单靠个人的感觉经验是不行的。受现象学的理论影响,我们会发现,人类要面向生活世界,对社会生活进行研究,就必须要注重考查现实生活世界中那些意义层面的东西,对这种意义的定性研究,要靠动态的描述和理解,比如想象的方法、移情的方法等。

(三)不断发展演化

社会科学中的定性研究是一个动态的过程,不管是研究对象还是研究者本身,都处在发展、变化、演变之中,“在这个动态的过程之中,研究者和被研究者双方都可能会变,收集和分析资料的方法会变,建构研究结果和理论的方式也会变。”[4]社会科学的研究所面对的是形态各异、且呈现复杂性、突现性特征的社会实体,对这种复杂实体的定性研究,是一个动态的、发展变化的研究过程,“这种观点决定了定性研究不是静态地而是动态地来对待和分析社会实在,把它看作是一个过程,而不是一种僵死的象征。定性研究方法强调社会实在是一个变化过程的本质意义就在于:突出了社会实在的本质而不是现象,注重了社会实在的整体性而不是个体性,表明了社会实在的连续性和层次性而不是间断性和孤立性,从而强化了定性研究方法的理性的约定而不是经验的描述。”[5]

正因为定性研究是一种动态演化的发展变动过程,也赋予了定性研究一定的开放性和灵活性。在定性研究之中,无法逻辑地预设研究步骤,也无法预设研究结果,没有预设的约束和限制,也就使研究者能够在定性研究的过程之中,不受既定研究框架的约束,进行不断地发现和创新。

(四)归纳法的使用

定性研究主要采用的是一种归纳的方法,在定性研究之中,研究者要亲身体验、深入实际,尽可能全面地了解研究对象各方面的情况,理解其所处的社会文化背景和习俗,也就是说站在特定的社会情境之中,通过收集研究资料、分析资料,在对资料的归纳、分析中,提出理论假设,进而还要在实践的过程之中,对理论进行检验。也可以说,在定性研究中,运用归纳法收集资料、提出理论假设、通过实践检验理论这些都是相互交叉,在同一个过程的不同方面得以协调的。

二、社会科学中的定量研究

与定性研究方法不同,定量研究方法则是一种运用数学、统计等量化分析方法、手段对研究对象进行研究的方法,主张使用这种研究方法的学者认为,从社会现象、事件的数量方面入手进行研究,以揭示社会现象背后的那种量化关系,由此得出科学性、客观性的研究结果。

(一)定量研究的实证主义思想来源

定量研究的方法主要来源于自然科学,它具有鲜明的科学性、严密性、概括性等客观性的特点,定量研究方法注重以数据资料、统计分析为基础,主张对社会现象、社会事件进行量化研究,得出具有数量关系特征的研究成果、结论。虽然在定量研究方法的发展、演变历史中,始终伴随着和另一种定性研究分析方法的比较,但至今,在社会科学的研究领域中,这种带有实证主义特点的定量分析研究方法,仍然在被普遍使用着。在遵循实证主义研究传统的定量分析研究方法中,认为唯有进行像自然科学中所普遍使用的那种数量化的分析、统计计算,所得出的社会科学结论才够“硬朗”,才够“科学”,才具有强说服力,而那些非定量化的分析都应当被排斥在外。定量研究分析方法的特点表现在,对数据统计、量化分析的依赖性,研究结果的精确性,研究过程的可重复性等。

定量研究方法的创始时期,应当从17世纪的下半世纪开始,从那时起,便有一些社会科学研究者开始强调在社会科学研究中应当要注意定量分析研究方法的重要性,并指出,对社会科学的研究不能仅仅使用定性研究方法,还应当补充以实证定量研究。

英国学者威廉·配第(Willian Petty,1623—1687年),是政治算术学派的创始人,这一学派是于17世纪在英国开始兴起的。配第在1690年出版了一本叫做《政治算术》的书,光从这本书的名字中,就可以看出很浓重的定量研究色彩,将社会科学学科——“政治”,与“算术”结合在一起,可以看出其对定量研究方法的重视。威廉·配第在书中对社会现象的研究,大量地使用数字、重量和尺度等能够量化的词汇来进行表达并加以比较,运用统计分组、推算、图表法等定量方法和平均数、相对数等统计指标来分析英国的社会经济状况。他在此书的序言中写道,“用数字、重量和尺度来表示的展望和论旨,都是真实的,即使不真实,也不会有明显的错误。”[6]由配第所开创的政治算术学派,其显著特点之一就在于,要对社会经济现象、事件背后的规律以一种数量化的方式来给予显现,为社会政策的制定,提供参考依据。在研究方法上,政治算术学派强调采用数字、重量、尺度等表现与比较的方法,对社会经济现象进行研究、推算,配第本人甚至被称为是将经济学数学化的鼻祖。

在注重定量研究的潮流趋势之下,随着统计学学科本身的快速发展,在社会科学的定量研究之中,便开始大量使用统计学的定量研究方法,这一点尤其体现在社会学的社会调查统计研究之中,“最典型的案例是英国约翰·辛克莱(John Sinclair,1754-1835年)的统计社会调查。1791年至1799年,辛克莱发动宗教界人士为调查人员,对881个教区进行了统计性社会调查,他编制了116个项目的调查表,内容涉及社会生活的各个方面,此期间他编写出版了21卷本的《苏格兰统计报告》(1791-1799年)。辛克莱的统计性社会调查在欧洲许多国家影响很大,尤其对欧洲许多国家的人口普查影响更深。英国自1801年起,便开始经常性的人口普查,并规定每10年进行一次。辛克莱的工作是早期社会现象定量研究的一个范例。”[7]统计学的定量研究方法除了应用在对人口的数量调查研究之中,还被大量应用到其他研究之中。例如使用概率统计的方法,对社会生活之中的各种现象:自杀、犯罪等等进行研究,经过统计学上的测量、分析,在对大量类似的社会现象进行实证量化处理过程之后,得出包含某种规律性的社会科学结论。

实证社会学家迪尔凯姆的《自杀论》,便是社会学研究领域之中运用定量研究方法的重要经典。此书是迪尔凯姆于1897年出版的著作,他以社会生活之中的大量自杀现象为研究对象,对各种自杀现象、事件的数据进行统计、分析,从而为社会学理论研究之中的定量研究方法传统树立了典范。

“在社会科学领域中,定量研究是以特殊的形式化语言为主导方式,以自然科学的推理和证明模式为基础,以实证性求解难题为趋向的研究方法。这意味着定量研究方法为社会科学的研究提供了一种以自然科学的逻辑和程序为范式的认识论标准,并且这一标准对任何具体的研究过程来讲,都被认为是先验地有效的和预设地真的。换句话说,先验的预设条件与经验的数学描述的统一构成了定量研究方法的实质。”[8]社会科学之中的定量研究方法具备一些鲜明的自然科学、实证主义特征,诸如客观性、精确性、数量化等。在以数学、统计学为研究方法基础的定量研究之中,总是首先强调研究者要搜集大量能够被量化的数据资料,要把社会科学研究工作者所研究的社会现象、社会事件全都变成可供量化处理的数据,力图通过对这些数据资料的分析,揭示各种社会现象、事件背后那种靠数量关系维系的特征,经过定量研究之后得出的研究结果、结论通常也都会以一种具有自然科学色彩的计算公式、图表等形式来进行表现。从这一点上来讲,定量研究的量化分析方法,会使社会科学的研究更靠近自然科学,带有实证主义的特点。定量研究的明显优势就在于它可以对社会科学的研究对象做出数量级别上的精确描述,能够采用量化分析模式,以一种自然科学的量化指标,通过直观的数据来显现各种社会现象、社会事件中的特征和差异。以数学语言、逻辑语言或是今天的计算机语言为基础进行的定量研究,会使研究结果更加具备严密性和精确性。在科学技术迅猛发展的时代背景之下,借助于计算机的辅助计算,可以加速研究工作者对资料数据的统计分析,迅速得出精确度较高的计算结果,也大大便利了社会科学中的定量研究程序。

无论人们采用哪种自然科学方法在社会科学之中进行定量研究,从定量研究之中得出的结论都是为了便于人们揭示各种社会现象、社会事件背后的因果关系,找到社会生活世界之中的规律,人们可以利用通过定量研究获得的这些对社会的规律性知识,确定性结论来对人类社会的未来发展进行预测。定量研究方法的精确性、客观性等实证特点,在人类对未来社会发展进行预测之时,就会显现出鲜明的优势。经过量化分析得出的那些数据、信息、资料,也便于人们在短时间之内对事物获得直观简便了解,而不必在各种纷乱复杂的社会现象、社会事件之中浪费时间,直接就可以在经过定量研究得出的数量分析结论之上进行预测。但是,社会科学中所进行的预测并不都是数量方面的定量预测,在社会预测之中也要包含定性研究的内容,而精确的定量分析预测可以为定性研究、定性预测提供更加精准的参考数据、资料,从而使社会科学中的预测更加具备精确性、科学性、客观性,而不是仅凭主观经验、直觉判断对社会的未来发展妄下结论。

(二)定量研究在社会科学研究领域中的运用

1.数学方法在经济学中的运用

毕达哥拉斯学派断言“万物皆数”,伽利略也曾说过“自然之书是用数学语言写成的”,数学研究方法具备一种实证主义的鲜明特征,它具备逻辑上的严密性,经过数学方法推论出来的结论又具备可靠性,能够被广泛使用到其他学科当中,数学中的公式、定理都是经过严格的逻辑论证、证明的,这可能也是数学能够得到比其他学科更多的尊重、重视的原因所在,经典科学理论大厦的建立离不开数学工具的可靠分析、证明,自然科学在历史发展过程中,所树立起来的那种严谨、缜密、精确的形象,都是有赖于数学工具的辅助的。

数学研究方法在自然科学中本身也是一种非常有效的实证研究方法,它能够从量的角度来研究、反映客观世界及其各种研究对象背后的规律,虽然不能武断地说,所有自然科学中的所有研究都能够用数学的方法来进行分析、解决,但是历史事实已经清楚明白地告诉我们,从伽利略时代开始,数学被引入了自然科学的研究之中,确实取得了很显著的研究成效。在自然科学中,科学家们通过对自然事件、自然现象的数学化研究、处理、建模等,对之进行理性的分析、研究、推理,从而获得关于因果性规律的知识,得出具有普遍有效性的确定性结论,甚至能够进行精准的控制和预言。这种数学化的定量研究方法在社会科学学科的研究中也获得了普遍的应用,社会科学也想借助这种定量化的自然科学研究方法,使自身变成像自然科学一样的“硬”科学。于是人们除了使用数学工具来从事对自然的研究和认识工作以外,也将数学方法引用到对社会经济的研究当中。

有人把经济学称作为是社会科学中的“王冠”,原因可能就在于,在经济学中大量应用了可定量化研究的数学模型,以这种定量研究的实证方式来对社会中的经济生活现象、经济行为做出合理性的解释、说明,并从中引发出社会经济运行规律,指导人们的经济行为,这也是自然科学中的定量研究方法在社会科学领域中的成功运用。比如说,在马克思的著作——《资本论》中,他就特别青睐于使用这种具有实证主义特色的数学分析方法,大量地使用数学工具以论证他的经济学原理。在经济学领域当中,如果离开了以数学方法为基础的定量分析研究,那么今日之经济学的现状将是不可想象的。

经济学本身作为社会科学之中的一个分支学科,它离不开数量分析、量化管理,在很多方面都需要大量地引用数学方法来进行计算、评估,有的时候还要使用线性代数、微积分等高等数学的知识。数学与经济学的交融渗透,也会随着社会经济的发展、自然科学、社会科学领域中新的研究课题的涌现,而变得越来越明显。甚至在经济学当中,也涌现出了很多与数学紧密相关的分支学科、边缘学科,例如经济计量学,经济预测技术等,而且数学建模的定量研究方式,在经济学领域当中也在被大量地使用。

2.统计学的方法在人口学中的运用

人口学是一门专门对人口规模、地域分布、人口构成、人口变迁等,以及影响人口变迁的各种要素进行研究的学科。人口学作为一门交叉学科,它的研究领域不仅仅局限在一门社会科学学科之中,而往往是与社会学、经济学、生物学甚至是人类学等研究领域都有着紧密的联系,通过人口学的研究,能够将人类社会生活之中各种与“人口”有关的事件,如出生、死亡、结婚、离婚等,都变成一种在科学研究之中能够被观察和度量的事件。这就使人口学较其他社会科学学科,能够呈现出一种更为“精准”量化研究的学科特征。

在人口学之中有两个重要的分支学科,一是形式人口学,二是人口研究。形式人口学较为关注对人口的生育、死亡、年龄结构、人口空间分布等方面进行研究,而人口研究则更多地会从社会、经济、生物等多学科的角度来对人口构成和人口的变迁进行考察[9]214。可以说,人口学是社会科学领域之中的一门重要实证学科,因为它关注的研究对象是社会之中的人口,通过人口学的研究,能够为社会科学之中某些方面的研究提供必要的基本人口信息事实。此外,在人口学的研究之中,通过利用统计学的定量研究方法,还能够统计出关于人口的生育率、死亡率等数据,从而为社会未来的人口发展规模、社会保障需求等提供一种预测依据。“人口学家所使用的统计方法不仅类型多而且变化快,包括路径分析(pathanalysis)、结构方程、对数线性模型、计量模型以及事件史模型。人口学中的大量研究通常都是有抽样数据(相对于总体数据)的多元框架下的统计分析,有时,一些学者应用统计模型检验来自个体行为模型的假设。”[9]215可以说,统计学在人口学的研究之中,是一种典型而又重要的定量研究分析方法。正是因为借助了统计学的定量研究优势,人口学家才能够利用由统计学提供的各种抽样数据、模型来对社会生活中人口的变化、变迁进行研究,借助于统计学方法在人口学研究之中的运用,也使人口学能够成为一门应用性很强的学科。

现在,我们所生存于其中的世界,正处在一个人口发生巨大变革的发展时期,全球都面临着一个公共问题——人口老龄化,并且这个全球性的人口问题,对于政治、经济等的稳定发展都要产生巨大的影响。通过人口学的研究,我们会发现,在这个人口老龄化问题的背后,主要有两方面的因素在起作用:一是生育率的下降,二是人类平均预期寿命的延长,人口学的研究结果还预测了人类在未来社会发展之中所要遭遇的一个重要转变:全球人口老龄化的问题如果持续恶化,人口年龄结构的类金字塔结构就会发生倒转,原先占据“金字塔”结构底端的是大量的年轻人口,而位于顶端的则是人口数量较少的老年人口,而随着老龄化问题的日益严重发展趋势,老年人口将会越来越多,充斥金字塔结构的底层,而年轻人的人口数量在金字塔中所占据的比重则会越来越少。这种从人口学的研究之中得出的预测,现在已经在全球范围之内,引发了各国政府的重视,使他们在制定国家政策、制度的时候,要对由人口学研究领域所提出的预测给予必要的重视。

三、定性研究与定量研究的融合

社会科学中定量分析的研究方法,并不能用来对任何社会现象、社会事件进行量化分析,也不是社会生活世界中的所有事件、现象背后的本质性规律和关联都能够使用量化分析的数量关系、统计数字、图表表征出来。在社会科学研究中很多微观层面,个体性事件、状态之中,还有很多具备特殊性,独特性的、不能被量化的研究现象、社会事件,不适宜使用这种定量研究方法进行研究,或仅靠定量研究方法难以取得满意、准确而可靠的研究结果。以社会学中的抽样调查研究方法为例,所谓抽样就要选取合适的样本,选取哪些研究对象作为样本,选取多少,为什么选取这些样本,不选取哪些样本进行调查分析,都需要进行均衡的考量。既然是抽样调查就不可能采用完全归纳法对全体研究对象进行逐一取样分析,在不能完全归纳的情况之下,进行的抽样调查定量分析研究结果,最后可能会与研究对象的整体性真实状态之间存在差异,抽样调查的数据结果也只能作为参考,而不能作为决定性依据,要想实现社会科学研究的客观性、确定性,除了定量研究之外,还要对研究对象中的个体性、差异性、特殊性等进行关注。有时候,定量研究也需要定性研究方法的配合辅助,才能够在定量研究分析中,得出准确的结论,对于复杂多样的社会现象、社会事件,仅使用一种定量研究方法,是不够的,“人类的知识活动形态是多种多样的,而自然科学只不过是其中的一种形态。如果无论什么都想以数量解析方法来解决,那可是相当无聊了。”[10]

社会科学研究中的定量研究分析方法虽然有效,但是并不一定能够完全实现研究结果的科学性、客观性,定量研究与定性研究可以结合使用,互为辅助。有人认为,在社会科学中所进行的定量研究,“它的具体研究对象是符合统计规律的数量较大的随机样本;它的资料收集方法是具有统计科学意义的封闭式问卷、统计表、控制性实验和结构式观察方法;它的具体研究程序是符合逻辑的实证科学程序;它的具体研究方法是各种实用的数理科学方法;它的运算结果、推论估计都有相当大的精确度和可信度。无论在描述性研究、解释性研究和预测性研究中,它都有助于保证研究过程和研究结论的科学性。”[11]而社会科学中的研究对象有着不同于自然科学研究对象的独特之处,想要用定量研究的方法把所有社会现象、事件都做量化分析,强求使用唯一的定量分析的方法是不可行的。定量分析的优势在于,借助于数学工具、统计工具等,找出隐藏在社会现象、事件之间的数量关系特征,找寻社会事件之间的那种规律性,但是这种数量分析得出的结论不能替代或等同于对社会现象、事件的内在本质的揭示,社会科学研究中的规律、本质也不尽然都能在数量关系上有所体现。量化分析的手段在社会科学研究的整体性、宏观层面上,在对能够体现较强普遍规律的研究中,确实能够起到很强的说明作用,但是对于社会微观层次面上的研究,对于那些注重个体独特性等的研究可能就不太适用了。可见定量分析的实证研究方法也是存在着局限性的。

如果遵循马克思主义哲学原理中质与量之间的对立统一原理来说,任何一个客观事物,它都是质与量的有机统一整体,对一个事物的研究,既要注重考查量的方面的规定性,又要注重考查它在质的方面的规定性,只有经过定量与定性两方面的研究,才有可能对一个事物进行全面的了解和揭示,所以定量研究与定性研究的结合在哲学原理之上也是有根据可寻的。不管是定性研究,还是定量研究方法,它们的宗旨都是同一的,只不过是从不同的研究侧面切入,最后都要实现对研究对象“质”、“性”方面的揭示。

“从已出版的研究成果来看,定量研究和有些种类的定性研究的互补性已是不可争辩的事实。定性研究可以帮助研究者无偏见地发现问题,包括问题的内容、性质及其发展的形态,而定量研究则能帮助研究者去明了、确认问题的客观性内容以及检验业已出现的理论之信度。如此观之,两种研究的对立就研究实践而言是不存在的。”[3]47在社会科学的研究过程之中,定性研究分析方法与定量研究分析方法,二者孰优孰劣,并不是我们真正的着眼点,只要是能够实现社会科学研究之目的的方法,都可以被拿来使用,在社会科学研究实践之中,不论是定性研究,还是定量研究,他们在研究对象上是统一的,都要以社会实在为研究对象,研究目的都是要从对社会现象、社会事件的分析过程中,找到现象、事件背后起最终决定性作用的因果机制。定量研究方法与定性研究方法的结合是一种系统研究方法的体现,在前文中,已经论述过,社会科学的研究对象——社会,是一个复杂系统、开放系统,那么在对社会系统进行研究的时候,也应当使用一种系统的方法,而不是片面使用一种单一的研究方法。定性与定量的融合统一,能够突破社会科学中的单一研究结构,使各自的方法优势得到充分发挥,使社会科学对社会现象、社会事件的研究呈现出更加真实、更加准确的结论。

在社会科学之中,不管是定性研究方法还是定量研究方法,在这些方法的背后都有一种实证主义的立场,其目的都是为了达到对社会现象、社会事件背后存在的那种本质性的东西的揭示,定性研究与定量研究,都承认这种本质性的东西是客观存在的,但是对于本质的揭示,我们究竟是采用“定量”计算,还是“定性”规定,这只是方法选择上的问题,其目的都是一致的,定性研究与定量研究之间的融合统一,这才是社会科学研究探索之中的“诺亚方舟”。

参考文献:

[1]陈向明.质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:7.

[2][德]马克斯·韦伯.社会学的基本概念[M].胡景北,译.上海:上海人民出版社,2000:1.

[3]沃野.关于社会科学定量、定性研究的三个相关问题[J].学术研究,2005,(4).

[4]陈向明.质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:8.

[5]郭贵春.社会科学探索的“诺亚方舟”——定性和定量研究方法的本质特征[J].晋阳学刊,1990,(1):13.

[6][英]威廉·配第.政治算术(原序)[M].北京:商务印书馆,1978:8-9.

[7]谢俊贵.关于社会现象定量研究的简要评析[J].湖南师范大学社会科学学报,2000,(4):40.

[8]郭贵春.社会科学探索的“诺亚方舟”——定性和定量研究方法的本质特征[J].晋阳学刊,1990,(1):10.

人口统计学变量分析篇11

一、引言

传统的土地利用规划信息系统一般包括规划编制和规划实施管理两个方面,利用信息系统对土地利用规划辅助编制涉及到的应用分析模型是一个十分值得单独研究的系统工程。要研究开发一个土地规划辅助决策信息系统,须分解土地利用规划模型群为切入点形成系统的辅助决策功能。

对土地的利用规划进行辅助决策的模型群集,主要包括土地利用结构分析模型、土地利用动态变化分析模型以及土地需求预测模型。

二、基础数据预测

(一)人口预测。

人口预测有人口自然增长法和劳动平衡法。人口自然增长法是根据基期年的人口数直接推算未来时期人口数。使用这种方法的前提是:规划区域的人口数基本上是按照一定比例增长,并假定该地区人口今后仍然按此平均增长率继续增长下去。而劳动平衡法是以一定比例分配社会劳动力为基础,按基本人口、服务人口、被抚养人口三者之间比例关系预测未来人口(适用于城市和城镇居民点的人口预测)。

(二)城市化水平预测。

1、城市化水平的测度。

城市化的量度一般可采用主要指标法和复合指数法。复合指标法采用反映城市化水平的四个方面指标,即:规划区域的城市人口占其所在区域总人口的比例、人口密度即单位城市土地面积的人口数、城市(建成区)的大小、城市(建成区)之间的平均距离。

2、城市化水平预测模型。

城市化水平的预测方法主要有: 商品粮供应率预测法,理论依据是:变农村人口为城镇人口、农业人口为非农业人口的规模和速度取决于农业生产水平和粮食商品率;国民生产总值预测法;基建投资规模预测法;农村人口转化预测法,根据城市人口的自然增长率、机械迁移人口数、农业人口转化为城镇人口数进行推算;多指标综合预测法,常采用农业生产发展水平预测(商品量增长预测、农业劳动力转移数量预测)、国民收入增长率预测、基建投资数额预测等多指标综合预测法,根据预测结果加以综合得高、中、低三种方案,再结合其它相关因素,最终预测城市化水平。

三、土地利用结构分析

(一)各类用地比例。

面积比是指某一区域内各土地类型的面积占其土地总面积的百分比。即:

Ki=ai/A*100% (3-1)

式中:K,为第i种土地类型的面积比;a,为第i种土地类型的面积;A为区.域土地总面积。其计算结果多用直方图、饼状图表示。

(二)土地数量结构多样化。

根据吉布斯―马丁的多样化指数来度量,其模型为:

(3-2)

式中GM为多样化指数,为第i种土地利用类型的面积。若某一地区只有一种土地类型,则多样化指数为0;若土地均匀地分布在各种类型中,则多样化指数为1。

(三)土地数量结构区位意义。

利用区位指数分析区域土地的意义在于这一指数可反映某一地区各种土地相对于高层次区域空间的相对聚集程度,区位指数是综合性指标,计算公式为:

(3-3)

式中Qi为区位指数,fi为区域内第i种土地的面积,Fi为高层次区域内第i种土地的面积。若Qi大于1,则该种土地具有区位意义,若Qi小于1,则不具有区位意义。

(四)土地利用空间布局。

可运用景观生态学中的多样性指数、优势度指数、均匀度指数和破碎度指数作为土地利用空间格局指数,对规划地区土地利用的空间格局进行定量分析。

土地利用多样性指数(H)反映了土地利用类型的多少和各种类型所占的比例,当土地利用各种类型所占比例差异减小时,多样性上升。土地利用优势度指数(D)用于测度土地利用结构中一种或几种类型支配整个土地利用的程度,与多样性指数成反比。多样性指数和优势度可以用来描述不同土地利用类型的分配方式,反映土地利用是否以某种或某几种方式为主。土地利用均匀度指数(E)是描述土地利用类型的分配均匀程度,可用Romme相对均匀度计算。土地利用破碎度指数(C)用于测度土地被分割的破碎程度。空间格局指数的大小反映了人类活动对土地利用的干扰程度,随干扰强度增加,土地利用的多样性、均匀度、破碎度提高,优势度减少。

四、土地利用动态变化分析

(一)土地利用数量变化。

1、单一土地利用类型动态度(K)表达的是某研究区一定时间范围内某种土地利用类型的数量变化情况。这一指数的意义在于可以直观地反映类型变化的幅度与速度,同时可以比较不同类型间变化的差异,从而探究其变化的驱动力和约束因素。

2、综合土地利用动态度(LC)反映区域内某一研究样区各种土地利用类型动态变化及其转换程度,着重变化的过程而非变化的结果,意义在于反映出区域土地利用变化的剧烈程度。可以应用于局部与全区的对比以及区域之间土地利用变化程度的对比。

(二)土地利用变化区域差异。

我们可以用各区域某种土地利用类型相对变化率及各区域土地利用动态度(单一土地利用动态度,综合土地利用动态度)的不同来反映土地利用变化的区域差异。

(三)土地利用类型空间变化。

土地利用的空间变化,可以用土地资源分布重心变化情况来反映。其方法为:把一个大区域分为若干个小区,在大比例尺地图上根据居民点的分布及地形特点确定每个小区几何中心的地理坐标,然后再乘以该小区该项土地资源的面积,最后把乘积累加后除以全区域该项土地资源总面积。重心坐标可以用地图经纬度表示,也可以用大地直角坐标表示。

五、土地需求量预测模型

(一)土地需求量预测数学模型。

1、年平均变化率法:此法依此式计算土地需求量:an=a0(1r)n,其中,an为预测期末土地的面积; a0为预测期初土地的面积;r为预测期土地面积的年变化率(增加为正,减少为负);n为预测年期。

2、趋势预测法:研究区域的土地面积变化是在时间序列上展开的,随着时间的推移,可以得到一系列依赖于时间的数据Y=f(t),以时间为参数的数列成为时间序列。

3、回归预测法:城市土地的变化与许多因素都有关系,如经济发展速度、人口、城市化率等等。它们之间的关系可以Y=f(x1,x2,…xn)表示。

(二)耕地需求量预测。

l、粮食安全条件下的最小耕地需求量是粮食自给率、食物消费水平、食物综合生产能力等因子的函数。

2、基于耕地社会保障功能的需求量预测耕地,对于城市而言主要表现为耕地是城市农业人口及“两栖人口”的重要生活保障,因此,城市耕地的社会保障功能定位为满足农业人口及“两栖人口”的粮食自给自足,其需求量为达到这一条件的耕地需求量

(三)建设用地需求量预测。

l、城镇、农村居民点用地需求预测。通常采用城市规划中确定城市建设用地的方法:人均建设用地指标法。

2、独立工矿用地需求预测。通过区域经济发展、生产要素享赋、土地集约利用发展趋势的研究,确定单位土地的工业产值,在分析预测经济发展规模的基础上确定产业用地总需求,在总需求的基础上扣除城镇内部合理的产业用地需求,即为独立工矿用地需求。

3、交通用地需求预测。城市交通用地需求中,公路交通的需求是其研究和考虑的重点。公路交通用地取决于其长度和宽度。其长度依据选线方案在图上量取。公路的宽度与其技术等级有关。依据公路技术等级即可确定公路的路面宽度和路基宽度,从而计算得到公路的占地面积。

4、水利设施用地需求预测。水利设施包括水库水面和水工建筑物用地,其中水工建筑物的用地需求根据长度和其断面要素计算;水库水面用地可依据水位――库容关系曲线和水位面积曲线估算。

六、辅助决策功能模块实现

(一)土地利用现状分析。

通过提取土地利用现状图中的各种用地类型的属性信息,将属于同一大地类的用地类型的面积字段值进行加和汇总,并将汇总的结果赋到土地利用现状表的面积字段位置。将各种土地利用的现状地类数据汇总之后,我们就可以计算出各个地类占规划区域土地总面积的比重,从而有效的进行土地利用现状数据的分析比较;同时系统也提供了生成统计图表的功能,来更形象直观的对各类土地利用现状数据进行分析。

(二)土地利用动态变化分析。

主要是根据选定的规划方案,将各种地类的用地情况信息录入系统之后,系统可实现对这些规划用地信息的计算分析功能,自动的计算规划近期、远期与现状地类的面积增减数值;同时也可以采用生成统计图表的方式来对土地利用情况进行分析,以得出土地利用规划方案合理与否,并进行相应地类用地情况的调整。主要包括土地利用数量变化分析、土地利用变化区域差异分析以及土地利用类型空间变化分析。

(三)人口预测。

在人口预测子模块中,可以完成总人口和城镇人口的数量预测,总人口预测中可以用自然平均增长法和回归预测法来完成总人口的数量预测,当选择相应的预测方法之后,系统会显示此方法所对应的预测公式,在文本框中输入公式所对应的各数据项后,点击计算按钮,系统就会自动计算规划目标年的总人口数;城镇人口的计算设计了劳动平衡法和单因素分析法两种预测方法,其计算方法与总人口的计算方法类似。

(四)土地需求量预测。

本模块在人口预测的基础上进行各类用地的需求量预测,然后将各类用地的预测数据信息录入相应的位置,并进行规划近期面积和规划远期面积预测结果与现状数值的分析比较,从而得出预测结果合理与否,以辅助规划预测方案的拟定。

七、结束语

土地利用规划修编需要建立土地利用结构分析、土地利用动态变化分析、土地供需预测、土地利用空间布局以及土地利用分区等模型,这些模型可以用来分析土地的供需关系以及土地的合理布局,是土地利用规划信息系统中辅助决策模块的建立的基础,是编制与实施规划的基础。

(作者:华中农业大学土地管理学院硕士研究生)

参考文献:

[1]国土资源部.县(市)级土地利用数据库标准:试行,2001

[2]国土资源部.县(市)级土地利用数据库建设技术规范:征求意见稿,2002

[3]尹君.多目标县级土地利用总体规划方法论的研究,中国农业大学博士学位论文,1996

人口统计学变量分析篇12

文章编号:1004-373X(2010)05-179-03

Design of Portable Power Quality Analyzer Based on DSP+ARM

LUO Xiaoming,YANG Shuanke,JIN Yinbin

(College of Electrical Engineering,Xi′an Jiaotong University,Xi′an,710049,China)

Abstract:The design of power quality analyzer based on a high performance DSP of ADSP21161 and an ARM chip of S3C2410 are introduced,DSP is used as the core of data acquisition and processing,accompanied with S3C2410 chip as the core of data display and system control,and embedded operation system WinCE is adopted as software of system.The scheme advances the intelligence and reliability of system,reduces the system power consumption and it is good for function expanding.The test results show that the analyzer meet the IEC standards for power quality.

Keywords:power quality;DSP+ARM;winCE;wavelet transformation

0 引 言

随着国家工业规模的扩大和科学技术的发展,电网负荷结构发生了很大的变化,一方面,非线性、冲击性和不平衡负荷的大量增长使得电能质量恶化;另一方面,随着信息技术的发展,越来越多的敏感负载对电能质量的要求也越来越高[1]。这就要求电能质量检测分析设备具有实时检测、快速分析、实时显示的能力。采用高性能数字信号处理器(DSP)和嵌入式计算机系统(ARM)双处理器架构设计电能质量分析仪能满足上述要求。DSP系统实现电压、电流信号的实时采集处理,通过加窗傅里叶变换和小波算法得到电能质量参数;ARM嵌入式平台运行WinCE操作系统完成人机交互、数据存储、实时显示等功能。该系统为仪器的可扩展性和智能化建立了良好的软硬件平台。

1 硬件系统设计

便携电能质量分析仪硬件系统设计应以功能实现和便携式设计为基础,并兼顾系统的可扩展性。

1.1 硬件系统总体设计

该硬件系统包括信号调理、数据采集与处理、ARM嵌入式平台、协控制器和电源系统5个模块,系统框架如图1所示。电网电压电流信号经调理电路预处理;采用高速ADC数字化后由DSP处理器系统实现缓存及快速、准确的分析计算;采集到的波形数据和分析计算结果通过FIFO传递到ARM嵌入式平台;采用LCD实现波形和分析结果显示;采用SD卡或USB存储设备来存储大量的数据以便回放或进一步深入分析;利用键盘或触摸屏实现人机交互功能;设置RS 232、USB和网络接口,便于实现电能质量分析仪的系统化和网络化扩展。

图1 系统的硬件框架

系统中采用CPLD芯片设计了协控制器,它的作用主要是产生A/D转换器所需要的采样时钟、完成采样通道的时序控制、综合FIFO读时钟逻辑、网卡地址控制逻辑和DSP启动模式的设置。系统硬件电路配有多种电源,通过对系统各模块电源进行控制,以及使DSP按测量需求工作在节电模式等措施实现了系统低功耗设计。系统采用电池供电,满足便携式仪器要求。

1.2 数据采集和处理模块

电能质量分析仪需要有较高的测量准确度,并且电网电压电流信号除了50 Hz工频分量以外,还包含电压瞬变、短时电压骤升骤降等因素引起的高频分量;按照一般电网测试要求,需要检测8路信号(4路电压和4路电流);这里需要高速、高分辨率、多通道、低功耗的ADC芯片。TI公司出品的AD7655是一款低成本、4通道、1 MSPS采样率、16位ADC芯片。该芯片典型功耗为120 mW,采样率为10 KSPS时只有2.6 mW,满足系统低功耗要求;芯片内有两个低噪声、宽频带的采样保持器和相应的模拟开关,允许两个通道同时采样。选用两片AD7655可满足系统设计需要。

数字信号处理器选用ADI公司的ADSP-21161N 32位浮点DSP芯片[2]。该芯片采用超级哈佛结构,拥有多条内部总线、高速运算单元、大容量存储器、灵活多样的外部接口。它的内核工作频率可达100 MHz,外部总线工作频率可达50 MHz,运算处理速度可高达600 MIPS,以较低的工作频率实现了较高的处理能力,同时降低了功耗。而ADI公司提供的根据处理器量身制作的IDE环境极大的方便了DSP软件开发,最大程度上发挥了处理器的性能。

两片AD7655与DSP通过“三线”SPI接口连接,DSP对数据进行缓存并进行一系列运算,将计算结果通过LINK PORTS接口发送给FIFO实现数据传输功能。ADC的采样时钟、每个ADC中的通道切换和双ADC调度等控制逻辑由协控制器实现。

1.3 协控制器

协控制器逻辑电路框图如图2所示。图2中,采样时钟发生器为A/D转换器提供采样时钟;ADC通道轮换控制电路协调8个通道的数据转换次序,协助DSP准确地读取各相电压电流信号;DSP启动模式控制电路协助DSP上电初始化程序从FLASH自启动;FIFO读时钟逻辑电路由ARM嵌入式平台控制,产生读时钟,完成DSP与ARM系统的数据传输;网卡地址控制逻辑为CS8900网卡提供读写逻辑。

1.4 ARM嵌入式平台

ARM嵌入式平台硬件配置如图1所示。选用三星公司S3C2410芯片,外扩64 MB SDRAM和64 MB FLASH。该嵌入式平台有众多外设接口:SPI接口用于和DSP命令传输;LCD接口用于TFT液晶屏的驱动;USB接口适用于多种即插即用设备;SD卡接口可插入大容量SD卡用于数据存储;触摸屏接口可实现触摸屏控制。为了实现仪器的网络化,该系统扩展了网卡芯片CS8900A;为了系统调试的安全性,将RS 232接口进行隔离处理。

图2 协控制器逻辑电路框图

ARM与DSP之间通信和数据传输通过SPI接口和FIFO实现。ARM通过SPI接口发送命令,使DSP进行相应的数学运算及传输数据,系统设定ARM为主设备,DSP为从设备。FIFO用于传输DSP的计算结果和波形数据;FIFO芯片采用低功耗异步芯片SN74ALVC7805,数据传输率可达50 MHz,数据存储深度为256 B。

ARM嵌入式平台移植了WinCE操作系统。WinCE操作系统在实时管理、图形界面、开发环境等方面有着特有的优势,这为便携式电能质量分析仪的人机交互和网络化扩展提供了便利。

2 系统软件设计

系统软件设计包括ARM部分WinCE操作系统定制、应用程序设计和DSP部分数据处理程序设计。

2.1 WinCE操作系统定制及应用程序设计

WinCE是模块式、多任务、实时嵌入式操作系统[3],微软公司提供了功能强大的开发工具,WinCE操作系统定制包括操作系统内核定制、各相关驱动程序编写等。其内核的定制使用PB(Platform Builder)软件,相应的驱动程序开发使用EVC(Embedded Visual C++)。

系统应用程序是在WinCE 5.0上由VS 2005(Visual Studio 2005)开发的C#窗体应用程序[4],其主要功能为:实现良好的人机界面、合理的功能设定、数据的接收显示及存储、对DSP和系统电源的控制等。

电能质量分析仪应用程序的界面是根据不同的测量用途来划分的,分为示波器、功率和能量、谐波、向量图、骤升骤降、闪变和瞬态等显示界面,不同的显示界面运行着不同的显示线程,每一个显示线程都有一个对应的数据传输模式。ARM根据这个数据传输模式来给DSP处理器发送命令,进行相应计算和传输相应的数据。

2.2 数据处理程序设计

数据处理程序流程图如图3所示,程序启动后,DSP通过Serials中断读取ADC采样数据,同时接收SPI中断,根据ARM系统的命令进行相应的电能质量指标计算,将计算数据通过Link Port传送给FIFO供ARM系统读取;IRQ0中断用于控制数据传送的节奏和数据同步。

图3 数据处理程序流程

2.3 数据处理算法介绍

电能质量分析仪需要对电力信号进行稳态分析和暂态分析[5]。稳态分析包括检测三相电压、电流的有效值,电网频率,电压、电流的各次谐波及谐波总畸变率,电压、电流中的正序和负序分量;三相不平衡等的计算。暂态信号分析包含电压瞬变、短时电压骤升、骤降、电压闪变、短时严重波形畸变等检测内容[6]。相对于稳态分析,暂态电能质量分析需要对信号进行快速、实时、准确的测量与分析。

FFT变换是电能质量分析的重要工具,为提高采用FFT变换的计算精度,需要通过硬件或软件方法实现整周期采样。整周期采样就是要求采样的数据刚好是信号的整个周期或是倍数,也就是假如信号周期为T,就是要保证:

N/fS=L×T

其中,L为整数;fS为采样频率;N为采样点数。

在实际采样中,通常做不到整周期采样,即使知道信号的周期,采取同步采样,也只能使信号中的某些频率(工频及其倍频)接近整周期采样,而不能使信号中所有的频率成分(如噪声等)都是整周期采样。非整周期采样的直接的后果就是频谱泄露,使获得的频率成分不准;第二个后果就是对于频率相隔较近的多频率成分信号来说,会出现干涉现象。

为简化硬件设计本文采用非整周期采样[7],通过加窗傅里叶变换来减小频谱泄露和干涉。通过加窗傅里叶变换法[8]可以精确计算出50次以下谐波的幅值和相位。从谐波分析结果进一步计算可以得到三相系统各相的有效值、频率、功率、相位差、失真度和不平衡度等基本电参数。

微分算子可以检测瞬变,而小波滤波器的N阶消失矩和N次卷积微分算子具有等价关系。在此原理基础上设计了基于小波变换的电压瞬变检测算法[9]。在短时电压骤升骤降和浪涌电流检测中,使用了实时真有效值计算方法,通过有效值与阈值的比较来判断有无事件发生。电压闪变的评估使用了IEC推荐的同步检波法[10],通过IEC测试数据对闪变测量值进行校准。在此硬件平台所设计的暂态电能质量分析软件可实现对电压瞬变、短时电压骤升骤降、浪涌电流、谐波、三相不平衡度、电压闪变等项目的测量。

3 系统测试结果

搭建了以Chroma 61702功率信号源及三相交流电机组成的Y型接法测试系统,对本检测系统的稳态分析功能和暂态分析功能进行检测。实测表明该系统具有较高的测量精度,能够精确测量电压电流有效值、功率能量值、最高50次谐波分量、三相不平衡度、短时闪变值和长时间闪变值,各项测试指标满足设计要求。该仪器可以捕捉电网实时真有效值并显示结果,方便观测者检测电网电压事件,同时本仪器可以实时捕捉电压电流波动与闪变、电压跌落等事件,并将事件存储于SD卡中以便用户随时读取。

4 结 语

本文从便携式仪器设计的角度出发,设计了一种电能质量分析仪。该仪器用DSP实现数据采集与处理,快速准确的计算出各项电能质量指标,能够进行稳态分析和暂态分析;用ARM嵌入式平台实现数据管理、人机界面及系统控制,结合WinCE操作系统,提高了系统的可靠性,为实现电能质量分析仪智能化及网络化提供了良好的平台。通过实际测试,表明该仪器各项指标均满足IEC电能质量测量标准。通过选用低功耗器件,以及采用电源控制,实现了系统的低功耗;系统硬件设计简洁,集成度比较高,实现了系统的便携式设计。

参考文献

[1]肖湘宁,韩民晓,徐永海.电能质量分析与控制[M].北京:中国电力出版社,2004.

[2]Analog Devices,Inc.ADSP-21161N Data Sheet[EB/OL]..

[3]周毓林,宁杨,付林林.Windows 内核定制及应用开发[M].北京:电子工业出版社,2005.

[4]章立民研究室.Visual C# 2005程序开发与界面设计秘诀[M].北京:机械工业出版社,2006.

[5]汪秀丽.浅论电能质量[J].水利电力科技,2006,32(2):17-22.

[6]IEEE.IEEE Recommeded Practices for Monitoring Electric Power Quality(IEEE std 1159-1995).IEEE,1995.

[7]杨川,徐云.一种解决谐波分析非整周期采样问题的新方法[J].仪器仪表学报,2003,24(3):291-293.

人口统计学变量分析篇13

在构架指标体系以前,课题组参考了大量近年来有关人口与经济方面的论文,并做了统计分析,从中选取了近几年研究者使用频度较高的指标,同时结合河北省的具体情况和指标的获取难易及可靠性对人口结构和经济发展的指标进行了分析,并最终确定了所要选取的指标,指标体系最终确定如表1和表2,原始数据表略。

二、分析步骤

(一)主成分分析

对前述反映河北省人口结构及区域经济发展特征的两个指标体系进行主成分分析。为剔除量纲影响,运用上述两个指标体系已经进行了极值标准化处理后的数据。对标准化数据进行因子分析适用性检验,结果显示:两组样本KMO值分别为0.58和0.61,均大于0.5,即样本数据适于进行因子分析,可以保证在最大限度保留原样本信息的情况下,对变量进行降维处理。

首先对人口结构指标体系进行主成分分析。在SPSS软件中,进行因子分析的结果表明,前3个公因子的累积方差贡献率达到了96%,说明以3个综合变量代表原13个变量的有效性达到了96%。由旋转后的因子载荷矩阵,可得三个公因子F1、F2、F3的表达式为:

F1=0.931X1+0.977X2+0.927X3+0.040X4-0.419X5+

0.961X6+0.839X7+0.618X8-0.946X9+0.976X10+

0.967X11+0.954X12+0.875X13

F2=0.182X1+0.008X2+0.293X3-0.663X4+0.875X5+

0.240X6-0.449X7-0.709X8-0.299X9+0.193X10+

0.238X11-0.023X12+0.213X13

F3=0.159X1-0.055X2-0.012X3+0.742X4+0.134X5-

0.048X6-0.175X7-0.204X8-0.074X9+0.083X10+

0.081X11-0.003X12+0.380X13

将各指标的标准化数值带入上述三式,即可得到3个公因子的因子得分,将因子得分按各因子方差贡献率作归一化处理后,赋权加总,则可得到人口结构指标体系的综合得分,即:F =0.7415F1+0.1856F2+ 0.0669F3。式中,F为人口结构综合得分。据此计算得到的3个公因子得分、人口结构综合得分表。

同理,对河北区域经济发展指标体系进行主成分分析,得到:前2个公因子的累积方差贡献率达到了99.8%,说明以2个综合变量代表了原11个变量的原始信息的99.8%。由旋转后的因子载荷矩阵,可得两个公因子Z1、Z2的表达式为:

Z1=-0.204Y1-2.776Y2+0.153Y3+0.023Y4-0.317Y5+

1.789Y6+0.289Y7+1.155Y8-0.117Y9-0.175Y10+

0.656Y11

Z2=0.273Y1+3.175Y2-0.114Y3-0.011Y4+0.373Y5-

1.763Y6-0.302Y7-0.973Y8-0.051Y9+

0.557Y10-0.456Y11

将因子得分按各因子方差贡献率归一化处理后,赋权加总,则可得到区域经济发展指标体系的综合得分,即Z=0.9967Z1+0.0033Z2。式中,Z为经济发展指标综合得分。据此计算得到的2个公因子得分、人口结构综合得分表。

(二)VAR模型建立

为深入揭示河北省人口结构和区域经济发展的长期动态关系,建立两变量VAR模型。计算得到的不同滞后阶数的AIC及SC统计量的值见表3。

显然,由计算结果,选择建立滞后2阶的VAR(2)模型是合适的。据此,建立的VAR(2)模型见表4。

对得到的上述VAR(2)模型进行稳定性检验,计算得到的模型特征方程的根中,4个根的模分别为0.97,0.83,0.94,0.66,都小于1,即模型满足VAR模型的稳定性条件。且X和Y两变量VAR(2)系统的两个方程的拟合优度比较理想,方程整体显著性即F统计量也可以接受。系统的AIC统计量及SC统计量的值分别为-21.8529,-18.6942,表明模型整体的解释能力较好。

(三)方差分解

为完整揭示人口结构和经济发展两变量VAR模型所表达的变量间的动态关系及其经济含义,对模型进行方差分解。模型两变量方差分解的结果见表5。

三、结果分析

通过对2000-2009年河北省人口结构以及经济发展两个系统的数据,利用VAR模型通过方差分解对人口结构与经济发展之间的关系进行了实证分析,由方差分解的结果可以得出如下结论:

1.从X方差分解可以看出,经济发展Y第1期的影响为0,这说明经济发展对人口结构的影响是滞后的,也就是说二者不是在同一时间段互相作用的。假设外部环境一定的情况下,人口结构的变化是在经济发展发生变化以后的一段时间后才开始的。

2.从X方差分解可以看出,第4期经济发展的影响达到了最大值3.46%,之后既有下降,也有上升,直到第10期都是在一个相对稳定的水平上波动,且没有衰减趋势。这一方面说明经济发展对于人口结构的影响既是短期的、正向的,也是长期的、持续有效的;但另一方面也说明经济发展对人口结构的整体影响程度相对较低。

3.从Y方差分解的结果来看,人口结构对经济发展的影响除第1期偏低以外,从第2期一直到第10期持续稳定在17%左右,说明人口结构对经济发展的影响是持续而强烈的,人口结构的变化是影响经济发展速度的主要因素之一。

参考文献:

[1]张继红.关于我国的人口结构对社会经济发展的影响分析[J].甘肃科技,2006(1).

在线咨询