教育测评概念实用13篇

教育测评概念
教育测评概念篇1

一、背景与意义

1.国内外现状之一

奥苏贝尔(David P. Ausubel)在其《教育心理学》扉页上这样写道,“假如要我把所有的教育心理学原理浓缩为一句话,那我会说:影响学习的最重要的、唯一的因素就是学生已经认识了什么,弄清楚它,然后进行教学”。在教学过程中,教师只有重视并有效捕捉了学生的前概念,才有可能帮助学生真正掌握知识。显然,捕捉学生的前概念,是实现有效教学的关键性环节。

前概念(Preconception)是存在于人们头脑中相对于新知识的已有认知。它可能是正确的,也可能是模糊或错误的。人们在学习任何概念性知识之前,都已经有了前概念。无论是哪一个年龄段,也无论是对哪一门学科知识的学习,都是这样。

国外对前概念的研究可追溯到20世纪初。1929年,皮亚杰(Jean Piaget)出版了《儿童关于世界的概念》,涉及前概念的早期研究。20世纪50~60年代,西方一些国家的学者采用调查问卷、访谈、作业分析等方法,捕捉学生已有的前概念。到20世纪80年代,对前概念的研究转向讨论学生形成前概念的成因。

国内对前概念的研究相对较晚且研究不多,主要集中在物理、化学等教学领域。国内学者一般都认同前概念是教学有效性的主要障碍,但在如何有效捕捉前概念的策略研究上几乎为空白。

综合国内外对前概念的研究,不难发现存在这样一些情况:从“前概念”研究涉及的范围看,国外较多涉及心理学、哲学、医学等领域,而国内则聚焦在物理、化学教学上,很少有人在其他学科进行探索。从“前概念”产生途径的研究看,比较有代表性的观点是将形成前概念的心理途径归结为:先入为主的日常生活经验,知识的负迁移,旧有概念的局限,由语词带来的曲解,进行不当的类比等。从“前概念”捕捉策略的研究看,国内只有本项目组的成员从2005年开始至今有过研究和实践,其结论是“用好互联网教育数据服务平台是一条可行之路”。

2.国内外现状之二

教育质量监测与评估,是监控有效教学的主要手段。它至少涉及这样几项基本要素:测评目的、测评样本、抽样过程、数据采集、数据分析。

我国20世纪90年代中期就已经开展义务教育质量监测,但这项研究存在一些问题:主要服务于上级决策,对一线教师提高教学质量的帮助明显不足;监测样本的数量偏少,形成的评估意见缺乏针对性;抽样过程不一定客观;数据采集较困难,无法常态化;相关因素纷繁复杂,仅靠人工手段无法进行较为深入系统的运算、分析和预警。

在国外,尤其西方国家,教育质量测评工作的主体通常不是教育行政部门自己,而是第三方水平测评机构。其主要特点有:为一线教学质量服务;也采取小样本,也很难形成有针对性的指导意见;抽样过程不可控;数据采集也无法常态化;人工手段无法进行深入分析。

综合上述国内外现状,可明显看出:常规情况下由于存在几乎无法克服的困难,人们在做教学质量测评时,无可奈何地采取了小样本;无可奈何地偶尔使用一下测评这一教学质量监控的主要手段;无可奈何地在采集到的海量数据面前望洋兴叹,白白浪费了99%的有用信息;无可奈何地形成自知针对性不强的教学评估指导意见。

3.发展趋势

在学科教学领域,课堂教学的有效性取决于教师备课的针对性,而备课的针对性又取决于教师真正了解学生的程度。因此,能否在重视并有效捕捉每一个学生的前概念、形成有价值的分析等关键环节上有所突破,将是未来各学科教学质量能否实现飞跃的关键所在。

在教育评价领域,近年来,无论是国内还是国外,都相当重视测评,但问题是怎样规避抽样中的人为因素?评估报告给谁看?期望报告阅读者看出什么来?因此,建立一个科学、公平、客观、有效的质量监控体系,将是未来教育评价工作的一项重要使命。

在教育技术领域,近年来,国内教育技术学和教育信息化工作似乎遭遇了瓶颈,鲜有突破。因此,能否突破当前教育信息化发展应用瓶颈,利用信息技术解放教育生产力,将是对教育技术学和教育信息化价值测评技术的重大考验。

在互联网应用领域,我国自1995年第一个网站诞生以来,从只是浏览网页,到今天实现网络汇款,从只有几十个用户,到今天拥有4.5亿网民,互联网发展迅猛。然而互联网对教育的应用价值还远远没有被发掘出来。因此,让强大的互联网为教学过程、教学评价、教学研究提供强有力的支撑,将是未来互联网发展的一个重要方向。

4.研究意义

“利用现代测评技术捕捉前概念和过程性数据促进有效教学”的研究意义,可以用下面这幅图来简要表示。

二、实践与方法

2008年浙江省教育厅教研室与浙江大学现代教育质量监测与服务研究所共同成立了“利用互联网技术实施教育质量监测”课题组。在前7年研究的基础上,课题组用了3年时间对浙江省11个地区272所小学、初中的20万学生和相关的教师、家长、教育行政领导使用网络平台,监测教育质量,提高有效教学的情况进行了实验。

1.教育质量监测从专业化走向普适化

利用互联网技术实施的教育质量监测可以对学生学业进行常态化、全方位检测,及时查找、反馈,从根本上解决学生怎样学习的问题。利用互联网技术实施的教育质量监测不仅可以进行专业化的施测,也可以帮助学校、教师随时进行自我检测,包括对学生的平时作业、综合素质、学习兴趣与动机、师生关系以及影响学生学业质量的学校、家庭、社会等相关因素的测评。它在技术上实现零门槛,实施教育健康体检,任何测评项目间的数据可以任意组合分析,实现教育质量监测科学化、平民化、普适化,成为一种辅助教育教学及学校管理的日常工具。

2.捕捉学生前概念,实现以学定教的重大突破

前概念指学习者在接受正式的教育之前,在现实生活中通过长期的经验积累与辨别式学习而获得的一些感性印象、一些缺乏概括性和科学性的经验,以及一些与科学知识相悖或不尽一致的观念和规则。传统的教学过程中,教师了解学生前概念的渠道有限、覆盖面窄。教师课堂提问环节由于时间限制往往只能顾及少数学生,学生反馈的信息可能因受到干扰而不真实。互联网技术为突破传统教学瓶颈带来了重大突破。

(1)了解学生的前概念。教师可以课前在互联网平台专有的“讨论”模块中第二天需要学习的讨论题目或前置性作业,每个学生都在没有受到任何干扰的情况下将潜藏在头脑中的“前概念”表达出来。如此一来,教师上课不再仅凭简单的主观猜测来断定学生的已有认识。学生的前概念是丰富多彩的,不同的学生有不同的前概念,教师只有充分了解学生头脑中真实的前概念,才能有针对性地设计教学活动,才能更好地为学生的学习提供指导和帮助。

(2)有针对性地设计不同的学习活动。教师将“讨论”模块中所有学生对某一问题的各种认识归类,理出几种认识模式,有针对性地设计不同的学习活动,最终实现个性化教学、分层教学。

(3)关注可测性或量化。利用网络平台,课前捕捉学生的前概念,就使教师的教学目标非常明确、具体,学生的学习结果实现自动分析,教师的教学效果和工作效益易于检验。在过程与结果中定量与定性的检测,更全面、客观、科学地显现出学生的学业成就与教师的工作表现。

(4)让教师具备一种反思的意识。利用网络平台,课前捕捉学生的前概念,就使得教师可以根据学生的回答,反思以往的教学是否恰当:是否给学生造成了错误、片面的前概念;是否有效地纠正了学生错误的前概念;自己以学生的前概念为教学起点,为实现教学目标或教学意图而采用的一系列具体的问题解决行为方式是否有效。

3.以学生为中心,关注学生全面发展

在新课程的背景下,将过程性评价纳入学生学业评价体系的观点得到了广泛的认同和重视,它有利于改变终结性评价占比过重,一考定终身的现状。过程性评价认为,凡是学习过程中产生的信息都应当得到评价,而不管这些信息是否在预定的目标范围或预期结果内。常规手段下,教师一般都是依据自己的经验对学生进行观察、记录,或者调动学生进行自评、他评和互评,但是由于教师的工作压力和工作负荷、学生作为评价者的专业能力不足和对评价的片面认识,传统的过程性评价在实际操作中比较混乱,收效并不理想。网络平台可以将过程性评价定位到每一个学生,并对每个学生每一天的学习、情感、态度进行跟踪记录,统计分析记录数据,并自动将分析结果推送给教师。教师能够准确及时地掌握每一个学生每一天的学习发展、心理成长等问题,从批改作业等大量简单的劳动中解放出来。教师根据分析结果,重点进行有针对性的差异化教学设计,提高了劳动价值。

网络平台可以实现把每个评价对象的过去与现在进行比较,或者把个体的有关侧面进行比较,实现个体内差异评价。基于互联网的过程性评价是一个过程,通过评价过程得到的不是一个等级或评语,而是大量经过价值判断,反映被评价对象工作或学习质量和水平的、定量和定性的数据和资料。评价的反馈和导向作用,使学生获得最大收益。

基于网络平台的过程性评价是一个综合性评价体系,它不仅有延续性的一面,也有阶段性的一面。从延续性的一面看,评价关注的是在发展过程中的情感态度和行为表现;从阶段性的一面来看,评价关注的是每一阶段的学习效果,包括智能的与情态的效果。

三、成果与创新

1.在学科教学方面

项目组基于多年设计经验,设计研制了有效捕捉每一个学生前概念的平台模块,教师可以打开平台直入个人首页。如,点击讨论模块布置讨论题。学生利用学校的网络教室和信息技术课程活动时间,互不干扰、完整地表达自己的前概念。

在两组对比性公开课上,对照组没有参与过本项目实践,实验组授课教师均来自项目学校。两堂课的结果可谓大相径庭:实验组教师由于在课前捕捉了每一个学生的前概念,知道了多少学生会,多少学生不会,会的程度如何,不会的有几种类型等,使课堂教学效果大大提高;而对照组教师在课堂的前20分钟几乎是浪费时间。这一现场对比令与会代表惊讶不已。

2.在教育评价方面

项目组基于多年的研究实践,大胆提出了“基于互联网的现代测评理念及其技术支撑体系”――基础教育质量监测与评估现代公共服务体系,设计并研制了承载着现代测评理念、方法、技术的基于互联网的教育数据服务平台。

(1)目标定位:服务并促进一线教学质量的提高,兼顾为宏观决策提供数据支持。

(2)样本来源:项目覆盖到的所有学校及其所属全体实名制的教师、学生、家长。

(3)数据采集。基础类信息:姓名、性别、出生年月、民族、籍贯等。过程类数据:前概念表达,平时作业,自助式体检(知识点检测、单元检测),在线考试,综合实践活动记录,学习兴趣与动机、心情变化等。分析类数据:按出错频率分类的错题本、按教学内容分类的错题本、按地域分类的错题本、任意时间段的作业分析报告、学习跟踪曲线、电子成长记录等。

(4)分析内容:集中趋势、远离中心程度、分布形态等,难度、区分度、积差相关、效度、信度等,最高分、最低分、难度值、能力值、离均值等,方差分析、回归分析、主成分分析、因子分析等。

(5)监测预警。所有与用户强相关的信息或预警信息,会以设定的方式被数据库抓取并自动推送到相应用户的个人首页。

项目组在近3年的时间里为实验学校展开了以前概念、平时作业、心情、学习兴趣与动机、师生关系等为主要指标的过程性数据的跟踪,提供了学习质量分析报告、错题本、相关知识点错题补练、自助式学习“体检”等服务,基本形成了一个能适应区域、学校、教师、学生、家长的基于现代技术的基础教育质量监测与评估体系,实现了全样本跟踪、差异化教学、促进教学质量提高等现代测评的基本要求。

3.在学校发展方面

对教师来说,利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究,实现了课前了解所有学生在不受任何干扰及影响情况下头脑中真实的“前概念”,教师据此进行针对性、差异化教学,从而大大提高了课堂教学效果,提高了教学质量;实现了可根据教师自定义的跟踪提醒规则实行自动跟踪提醒服务;实现了随时关注班里每一个学生的学习动态及走势,分析相关性;实现了可关注到平时最容易疏忽的中间群体和临界群体,确保整体提高;实现了可利用该数据跟踪系统为教科研提供发展性数据,使教科研上一个新台阶;实现了用带有自动批改、补练功能的网上作业系统进行自动采集数据,减少了工作量。

对学生来说,利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究,实现了对每个学生个体的关注;实现了将错题归入错题本并可标注经验教训,使学生复习上一个新台阶;实现了在时间控制下做作业,提高了做作业的效率,使作业习惯上一个新台阶;实现了在当天就发现漏洞并在当天补上漏洞,使学习的有效性上一个新台阶。

教育测评概念篇2

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

教育测评概念篇3

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于馐缎翁冻耄杉逃缆奂沂粲谘芯恳馐缎翁徒沂窘逃缆刍疃谋局使媛桑⑼暾慕逃缆垩аЭ铺逑怠K裕逃缆垩б彩粲诨±砺垩Э啤T俅危逃缆垩У难芯慷韵缶龆私逃缆垩婕罢鼋逃煊颍诤址岣弧R部纱硬煌咏牵攵圆煌冻虢⒍嗖棵拧⒍嗖愦蔚姆种аЭ疲ㄈ纾航逃砺燮缆垩А⒔逃菲缆垩А⒔逃姓缆垩А⒔逃移缆垩У龋越逃缆垩в质且幻抛酆闲缘难Э芠6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

教育测评概念篇4

一、评价指标体系设计依据

目前,对于评价指标体系设计的依据主要有两个方面,一种是从概念分析出发,通过演绎的方式对被评客体属性有关内涵进行分解进而生成具有相互关联的各项指标,另外一种是根据评价目的来确定评价指标体系。评价目的是指进行评价活动所要达到的目标和要求,对评价指标的设计具有导向作用。不同的评价目的会导致评价指标体系的差异。根据评价目的来确定指标体系的具体步骤为:先从评价目的结构分析入手,认真分析评价目的所包含的各种因素,并将其全部罗列出来,再经过反复的分析、筛选,最终提炼出最能反映目标体系的指标,从而形成指标体系。当然,两种方法并不互相对立,在恰当的情境中两者可以很好地结合。对于高等教育质量与水平评价指标体系构建来讲,其最终目的是建设高等教育强国,所以,评价指标体系的设计既涉及对高等教育质量与水平的概念演绎,也要将其与建设高等教育强国的目的结合起来。

(一)高等教育质量与水平的概念演绎

当将“质量”与“水平”两个概念连接在一起的时候,在不同的场合或语境所表达的意思侧重点不一样,在过程评价中,“质量与水平”的重心放在“质量”上,在结果评价中,重心则放在“水平”。因此,在作为过程的指标体系的构建中,概念的演绎应该将重心放在“高等教育质量”这一概念上。

高等教育质量是个见仁见智的概念,其中尤以联合国教科文组织在考察世界各国高等教育情况基础上所提出的高等教育质量概念最具有代表性和全面性。“高等教育的质量是一个多层面的概念,应该包括高等教育的所有功能与活动:各种教学和学术计划、研究和学术、教学人员、学生、楼房、设施、设备、社区服务以及学术环境等等”,“还应包括国际交往方面的工作:知识的交换、相互联网、教师和学生的流动以及国际研究项目等”。因此,可以根据对高等教育质量概念的演绎,选择有代表性和可行性的指标,共同构成一个完整的指标体系,全面反映高等教育质量的各个方面。

(二)高等教育强国的内涵、特征

高等教育强国的内涵和特征是什么?指标设计如何体现这些内涵和特征?现有文献分析表明,虽然不同的学者对于高等教育强国这样一个复杂概念有不同的分析和解读视角,但是数量、要素、结构、功能、环境、输人、输出却是绕不开的理解维度。具体而言,一个国家之所以可以称得上高等教育强国,关键在于“它拥有较大的高等教育规模和较高的高等教育普及率”(数量、输入);在于“它培养出一大批具有国际影响的高水平的人才”(输出);在于“它建有若干所世界一流的大学或一批世界一流的学科”(要素、输出);在于“它已经形成多样化、多层次、多类型、布局结构合理、开放的高等教育体系”(结构);在于“它的高等教育系统已与本国的社会各子系统已形成功能耦合关系,能够全面适应经济社会发展的需要”(功能);在于“它是世界知识创新、科技创新和高等教育创新的‘集散地”’(输出)。因而,在设计指标体系时必须以上述高等教育强国的特征为依据,进行逐层分解并体现在具体的指标上。

二、评价指标体系构建

(一)指标体系分析框架

在逐层分解出评价指标之后,一定要有贯穿其中的理论分析框架将所有指标组织起来,才能发挥指标体系所具有的功能,使深入分析成为可能,否则,分解出来的指标只是一种教育统计数据的堆积。建设高等教育强国的评价目的一方面使评价指标体系不得不放在国家层面来考虑,另一方面也蕴含着对于高等教育质量与水平的评价不是为了证明,而是为了改进。对于前者,长期致力于教育指标研究的专家约翰斯通(Johnstone,James.N.)认为,在建构国家层面的教育指标体系过程中,教育输入、过程与输出这个框架仍是最常用的分析架构;l6对于后者,则与斯塔弗尔比姆(Stuflebeam,L.D.)所提出的教育评价的CIPP模式具有恰切性。CIPP即为背景(Context)-投入(Input)一过程(Process)一结果(Product)的评价模式。_7因而,结合高等教育质量概念演绎和评价目的,可将评价指标体系纳人背景一投入一过程一结果的分析框架,并将其列为评价指标体系的一级指标。在一级指标下,确定生源与规模、学术基础设施、教育投入、科研投入、学生类型、教师资源、学生投入、教育资源转化、人才培养结果、学术和科研产出、社会服务、国际影响力等12个二级指标,二级指标之下又设立32个观测点,构成高等教育质量与水平评价指标框架(见表1)。

(二)观测点内涵与重要性说明

1.与高等教育背景(资源基础)相关的观测点

人是教育的出发点和归宿点,在评价一个国家的教育水平时,人口统计上的特征是一个重要要素,对于高等教育来讲也不例外。人均受教育年限反映的是某一国家人口接受教育的总体水平,受教育年限越长则人口中接受教育的水平越高。完成高中教育是青年人进入高等院校学习的基础,因此高中教育的毛入学率直接影响高等教育的毛入学率及其规模。高等教育毛入学率反映的是国家提供高等教育机会的整体水平,实质上是高等教育培养人才能力的一个标志。学生均拥有图书量和在校生计算机普及率是评价国家或地区学术基础设施能力的指标。从高等教育的逻辑起点高深学问来看,对高深学问的保存、共享的方式和手段则对高等教育和研究有着重要的作用。信息社会,互联网时代,个人计算机不仅为身处高等教育领域的人们打开了交流高深学问的新通道,而且也为高等教育找到高校与社会资源相互合作的途径和方式。当然,传统以图书来保存、共享知识的方式也不能丢弃。

2.高等教育投入观测点

合理的教育财政投入比例是教育发展的重要保障。在反映高等教育投入的各个指标中,政府对高等教育的财政支持力度和投向直接影响到高等教育质量的高低。公共教育经费占GDP的比例反映了一个国家对教育投入的总量,也是衡量一国政府对教育努力程度的主要指标;高等教育经费占总教育经费的比例反映一国政府在总体财政资源中如何对各级教育进行分配;高校生均经费指数含义是一个国家用一个GDP支撑了几个学生完成其一年的学习,也可以说相对于一定的经济发展水平,一个国家拿出多少财力支持相关教育的发展。从经费来源结构上看,高等教育的社会效益为政府对高等教育投入并发挥主导作用提供了充分合理性,但是,由于政府对高等教育投入的增长无法满足人们对高等教育日益增长的需求,非公共资金带着满足利益相关者的兴趣、需要的使命介入高等教育的现象开始在全球出现。因此,观测点“公共高等教育经费占GDP比例”与“非政府高等教育经费占GDP比例”在结构上的伙伴关系也会影响一个国家高等教育系统的使命和质量。与扩大高等教育入学机会一样,促进高等教育公平也是提高高等教育质量的一种方式和衡量手段。“学生资助经费(奖学金、贷款等)占高等教育经费的比例”反映了一国政府对弱势学生群体入学机会的关注和资助力度。

通过研究促进知识的发展是高等教育系统的重要职责,研发经费是保证高校实现这一职责的重要保障。“高校研发经费占GDP的比例”反映了一国企业、政府、高等教育部门、私人非营利部门对研发的投入力度;“高校科研经费占总科研经费的比例”反映了研发经费在上述各部门的分配。

3.体现高等教育过程的观测点

对过程的监测也是保证质量的重要手段。与高等教育过程相关的主体主要有学生和教师及两者的比例。观测点“5A类学生比例”、“5B类学生比例” 和“博士生比例”反映了高等教育结构的多样化程度及比例与社会需求的协调性。学生是学习的主体,学习效果既取决于学校的教学安排,也取决于学生课后的自主学习。与其他观测点相关的统计数字不同的是,观测点“学生课后自我学习时间”需要通过抽样调查来获得相关的数据。拥有博士学位是大多数国家高校教师的入场券,因而,拥有博士学位教师比例反映了一个国家高校教师所具有的基础学术训练水平,也体现了师资的质量与水平。教师年薪占人均GDP比例是反映高校教师职业获得经济收入在社会各职业中所占的位置,是教师职业是否具有吸引力的标志。生师比是影响教育质量的重要指标。生师比越低,师生之间互动的机会可能越多,学生得到教师的指导就越多。反之,亦然。

4.高等教育结果观测点

结果是直接体现质量的直接观测点。在高等教育的人才培养结果中,观测点“25—64岁人口接受高等教育的比例”反映以往高等教育培养人才的存量。高等教育所培养的人才必须能够参与经济活动才能体现出其质量和价值,观测点“经济活动人口教育程度构成”中高等教育的比例说明了这一点。

科研产出的具体观测点包括“师均日论文数”、“师均SCI论文数”、“师均专利授权数”、“高被引论文数”。虽然科技论文EI、SCI收录和被引是一个在国际学术界广为争议的话题,但是在没有更有效的衡量方法出现之前,其对科研质量的度量仍然是主要的方法。由于高深学问只有同行才能理解,高被引论文则通过同行评价体现了科技论文的质量。专利本身的特点之一就是要有新颖性,反映了技术发明创造活动的水平。

根据高等学校的社会服务职能的含义是“以直接满足社会的现实需要的为目的、以教学和研究职能为依托,有目的有计划地向社会提供的具有学术性的服务”,指标体系将“高校年均非学历教育人次”和“师均技术和专利转让收入”作为评价高等学校社会服务的观测点。

正如克拉克·克尔所言,“大学按它对普遍知识的承诺的性质而论,本质上是国际机构”,因而,吸引着来自许多国家的学生与教师。观测点“留学生占全球国际生比例”、“外籍教师占本国教师比例”体现了一国高等教育系统从其他系统获得资源的吸引强度。这种资源在反映本国高等教育质量与水平的同时,也通过交流、理解促进该国高等教育质量与水平的提升。世界一流大学是一国高等教育系统的标杆或高地,在各种不同世界大学排行中,一国的高等教育机构居于何种位置、数量的多少体现了该国高等教育标杆或高地高度。观测点“上海交通大学世界大学学术排行前500的高等教育机构数”和“泰晤士高等教育增刊世界大学排行前20的高等教育机构数”分别从学术排行和声誉排行两方面分别反映一个国家高等教育机构的国际学术地位和社会声誉。

三、指标体系构成特点

高等教育质量与水平评价指标体系构成特点可以参照图1来理解。

(一)反映高等教育质量的本质特征

指标体系从高等教育质量概念的内涵演绎出发,使具体的观测点并不是一种主观判断,而是有着比较充分的依据,反映高等教育质量的本质特征。

(二)以诊断和导向为功能

评价指标体系的构建以建设高等教育强国为目的,因而,具有诊断和导向的功能。通过观测指标观照高等教育,诊断发展过程中所存在的质量问题,找出解决问题的对策,进而发挥其导向作用,指导高等教育各个方面向前发展,最终达到高等教育强国的目的。

(三)反馈性与可塑性的统一

一方面,指标体系的构建不仅遵循着输入——过程——结果的分析框架,而且在体系内存在着反馈回路,体现为结果评价不仅可以夯实高等教育的基础,而且可以刺激高等教育投入。另一方面由于高等教育职能的多样化,指标体系可以根据研究的需要变换组合,具有可塑性。

(四)过程考察与结果考察的统一

针对以往评价指标体系注重结果评价的弊端,该评价指标体系在重视结果评价的同时增加了反映教育过程的指标。

教育测评概念篇5

一、评价指标体系设计依据

目前,对于评价指标体系设计的依据主要有两个方面,一种是从概念分析出发,通过演绎的方式对被评客体属性有关内涵进行分解进而生成具有相互关联的各项指标,另外一种是根据评价目的来确定评价指标体系。评价目的是指进行评价活动所要达到的目标和要求,对评价指标的设计具有导向作用。不同的评价目的会导致评价指标体系的差异。根据评价目的来确定指标体系的具体步骤为:先从评价目的结构分析入手,认真分析评价目的所包含的各种因素,并将其全部罗列出来,再经过反复的分析、筛选,最终提炼出最能反映目标体系的指标,从而形成指标体系。当然,两种方法并不互相对立,在恰当的情境中两者可以很好地结合。对于高等教育质量与水平评价指标体系构建来讲,其最终目的是建设高等教育强国,所以,评价指标体系的设计既涉及对高等教育质量与水平的概念演绎,也要将其与建设高等教育强国的目的结合起来。

(一)高等教育质量与水平的概念演绎

当将“质量”与“水平”两个概念连接在一起的时候,在不同的场合或语境所表达的意思侧重点不一样,在过程评价中,“质量与水平”的重心放在“质量”上,在结果评价中,重心则放在“水平”。因此,在作为过程的指标体系的构建中,概念的演绎应该将重心放在“高等教育质量”这一概念上。

高等教育质量是个见仁见智的概念,其中尤以联合国教科文组织在考察世界各国高等教育情况基础上所提出的高等教育质量概念最具有代表性和全面性。“高等教育的质量是一个多层面的概念,应该包括高等教育的所有功能与活动:各种教学和学术计划、研究和学术、教学人员、学生、楼房、设施、设备、社区服务以及学术环境等等”,“还应包括国际交往方面的工作:知识的交换、相互联网、教师和学生的流动以及国际研究项目等”。因此,可以根据对高等教育质量概念的演绎,选择有代表性和可行性的指标,共同构成一个完整的指标体系,全面反映高等教育质量的各个方面。

(二)高等教育强国的内涵、特征

高等教育强国的内涵和特征是什么?指标设计如何体现这些内涵和特征?现有文献分析表明,虽然不同的学者对于高等教育强国这样一个复杂概念有不同的分析和解读视角,但是数量、要素、结构、功能、环境、输人、输出却是绕不开的理解维度。具体而言,一个国家之所以可以称得上高等教育强国,关键在于“它拥有较大的高等教育规模和较高的高等教育普及率”(数量、输入);在于“它培养出一大批具有国际影响的高水平的人才”(输出);在于“它建有若干所世界一流的大学或一批世界一流的学科”(要素、输出);在于“它已经形成多样化、多层次、多类型、布局结构合理、开放的高等教育体系”(结构);在于“它的高等教育系统已与本国的社会各子系统已形成功能耦合关系,能够全面适应经济社会发展的需要”(功能);在于“它是世界知识创新、科技创新和高等教育创新的‘集散地”’(输出)。因而,在设计指标体系时必须以上述高等教育强国的特征为依据,进行逐层分解并体现在具体的指标上。

二、评价指标体系构建

(一)指标体系分析框架

在逐层分解出评价指标之后,一定要有贯穿其中的理论分析框架将所有指标组织起来,才能发挥指标体系所具有的功能,使深入分析成为可能,否则,分解出来的指标只是一种教育统计数据的堆积。建设高等教育强国的评价目的一方面使评价指标体系不得不放在国家层面来考虑,另一方面也蕴含着对于高等教育质量与水平的评价不是为了证明,而是为了改进。对于前者,长期致力于教育指标研究的专家约翰斯通(Johnstone,James.N.)认为,在建构国家层面的教育指标体系过程中,教育输入、过程与输出这个框架仍是最常用的分析架构;l6对于后者,则与斯塔弗尔比姆(Stuflebeam,L.D.)所提出的教育评价的CIPP模式具有恰切性。CIPP即为背景(Context)-投入(Input)一过程(Process)一结果(Product)的评价模式。_7因而,结合高等教育质量概念演绎和评价目的,可将评价指标体系纳人背景一投入一过程一结果的分析框架,并将其列为评价指标体系的一级指标。在一级指标下,确定生源与规模、学术基础设施、教育投入、科研投入、学生类型、教师资源、学生投入、教育资源转化、人才培养结果、学术和科研产出、社会服务、国际影响力等12个二级指标,二级指标之下又设立32个观测点,构成高等教育质量与水平评价指标框架(见表1)。

(二)观测点内涵与重要性说明

1.与高等教育背景(资源基础)相关的观测点

人是教育的出发点和归宿点,在评价一个国家的教育水平时,人口统计上的特征是一个重要要素,对于高等教育来讲也不例外。人均受教育年限反映的是某一国家人口接受教育的总体水平,受教育年限越长则人口中接受教育的水平越高。完成高中教育是青年人进入高等院校学习的基础,因此高中教育的毛入学率直接影响高等教育的毛入学率及其规模。高等教育毛入学率反映的是国家提供高等教育机会的整体水平,实质上是高等教育培养人才能力的一个标志。学生均拥有图书量和在校生计算机普及率是评价国家或地区学术基础设施能力的指标。从高等教育的逻辑起点高深学问来看,对高深学问的保存、共享的方式和手段则对高等教育和研究有着重要的作用。信息社会,互联网时代,个人计算机不仅为身处高等教育领域的人们打开了交流高深学问的新通道,而且也为高等教育找到高校与社会资源相互合作的途径和方式。当然,传统以图书来保存、共享知识的方式也不能丢弃。

2.高等教育投入观测点

合理的教育财政投入比例是教育发展的重要保障。在反映高等教育投入的各个指标中,政府对高等教育的财政支持力度和投向直接影响到高等教育质量的高低。公共教育经费占GDP的比例反映了一个国家对教育投入的总量,也是衡量一国政府对教育努力程度的主要指标;高等教育经费占总教育经费的比例反映一国政府在总体财政资源中如何对各级教育进行分配;高校生均经费指数含义是一个国家用一个GDP支撑了几个学生完成其一年的学习,也可以说相对于一定的经济发展水平,一个国家拿出多少财力支持相关教育的发展。从经费来源结构上看,高等教育的社会效益为政府对高等教育投入并发挥主导作用提供了充分合理性,但是,由于政府对高等教育投入的增长无法满足人们对高等教育日益增长的需求,非公共资金带着满足利益相关者的兴趣、需要的使命介入高等教育的现象开始在全球出现。因此,观测点“公共高等教育经费占GDP比例”与“非政府高等教育经费占GDP比例”在结构上的伙伴关系也会影响一个国家高等教育系统的使命和质量。与扩大高等教育入学机会一样,促进高等教育公平也是提高高等教育质量的一种方式和衡量手段。“学生资助经费(奖学金、贷款等)占高等教育经费的比例”反映了一国政府对弱势学生群体入学机会的关注和资助力度。

通过研究促进知识的发展是高等教育系统的重要职责,研发经费是保证高校实现这一职责的重要保障。“高校研发经费占GDP的比例”反映了一国企业、政府、高等教育部门、私人非营利部门对研发的投入力度;“高校科研经费占总科研经费的比例”反映了研发经费在上述各部门的分配。

3.体现高等教育过程的观测点

对过程的监测也是保证质量的重要手段。与高等教育过程相关的主体主要有学生和教师及两者的比例。观测点“5A类学生比例”、“5B类学生比例”和“博士生比例”反映了高等教育结构的多样化程度及比例与社会需求的协调性。学生是学习的主体,学习效果既取决于学校的教学安排,也取决于学生课后的自主学习。与其他观测点相关的统计数字不同的是,观测点“学生课后自我学习时间”需要通过抽样调查来获得相关的数据。拥有博士学位是大多数国家高校教师的入场券,因而,拥有博士学位教师比例反映了一个国家高校教师所具有的基础学术训练水平,也体现了师资的质量与水平。教师年薪占人均GDP比例是反映高校教师职业获得经济收入在社会各职业中所占的位置,是教师职业是否具有吸引力的标志。生师比是影响教育质量的重要指标。生师比越低,师生之间互动的机会可能越多,学生得到教师的指导就越多。反之,亦然。

4.高等教育结果观测点

结果是直接体现质量的直接观测点。在高等教育的人才培养结果中,观测点“25—64岁人口接受高等教育的比例”反映以往高等教育培养人才的存量。高等教育所培养的人才必须能够参与经济活动才能体现出其质量和价值,观测点“经济活动人口教育程度构成”中高等教育的比例说明了这一点。

科研产出的具体观测点包括“师均日论文数”、“师均SCI论文数”、“师均专利授权数”、“高被引论文数”。虽然科技论文Ei、SCI收录和被引是一个在国际学术界广为争议的话题,但是在没有更有效的衡量方法出现之前,其对科研质量的度量仍然是主要的方法。由于高深学问只有同行才能理解,高被引论文则通过同行评价体现了科技论文的质量。专利本身的特点之一就是要有新颖性,反映了技术发明创造活动的水平。

根据高等学校的社会服务职能的含义是“以直接满足社会的现实需要的为目的、以教学和研究职能为依托,有目的有计划地向社会提供的具有学术性的服务”,指标体系将“高校年均非学历教育人次”和“师均技术和专利转让收入”作为评价高等学校社会服务的观测点。

正如克拉克?克尔所言,“大学按它对普遍知识的承诺的性质而论,本质上是国际机构”,因而,吸引着来自许多国家的学生与教师。观测点“留学生占全球国际生比例”、“外籍教师占本国教师比例”体现了一国高等教育系统从其他系统获得资源的吸引强度。这种资源在反映本国高等教育质量与水平的同时,也通过交流、理解促进该国高等教育质量与水平的提升。世界一流大学是一国高等教育系统的标杆或高地,在各种不同世界大学排行中,一国的高等教育机构居于何种位置、数量的多少体现了该国高等教育标杆或高地高度。观测点“上海交通大学世界大学学术排行前500的高等教育机构数”和“泰晤士高等教育增刊世界大学排行前20的高等教育机构数”分别从学术排行和声誉排行两方面分别反映一个国家高等教育机构的国际学术地位和社会声誉。

三、指标体系构成特点

高等教育质量与水平评价指标体系构成特点可以参照图1来理解。

(一)反映高等教育质量的本质特征

指标体系从高等教育质量概念的内涵演绎出发,使具体的观测点并不是一种主观判断,而是有着比较充分的依据,反映高等教育质量的本质特征。

(二)以诊断和导向为功能

评价指标体系的构建以建设高等教育强国为目的,因而,具有诊断和导向的功能。通过观测指标观照高等教育,诊断发展过程中所存在的质量问题,找出解决问题的对策,进而发挥其导向作用,指导高等教育各个方面向前发展,最终达到高等教育强国的目的。

(三)反馈性与可塑性的统一

一方面,指标体系的构建不仅遵循着输入——过程——结果的分析框架,而且在体系内存在着反馈回路,体现为结果评价不仅可以夯实高等教育的基础,而且可以刺激高等教育投入。另一方面由于高等教育职能的多样化,指标体系可以根据研究的需要变换组合,具有可塑性。

(四)过程考察与结果考察的统一

针对以往评价指标体系注重结果评价的弊端,该评价指标体系在重视结果评价的同时增加了反映教育过程的指标。

教育测评概念篇6

然后尽可能用可以观察和测量的行为动词术语清晰地陈述目标。这对其教学行为的科学性具有决定性的意义。然而,在实际的教学中,很多教师的教学研究常侧重教学方法,对教学目标的关注不够。在教学设计中虽有明确写明教学目标,但却是模糊的、缺乏可操作性的。这使得教师的教学方法、教学过程、教学评价的设计与所确定的教学目标脱节。更有甚者,有些教学目标的设置和陈述出现了非常严重的逻辑错误。这些教学目标对于教学而言没能发挥其应有的作用,难以有效地具体指导教学实践。下面笔者结合自身的教学实践就思想品德课教学目标的正确设置和陈述及其作用进行论述。

一、教学目标的设置和陈述

(一)指导教学目标设置的理论――布卢姆教育目标分类学

为了解决目标模糊的问题,教师需要使目标更加准确,需要一个有组织的框架来提高准确性,更重要的是促进理解。在《学习、教学和评估的分类学――布卢姆教育目标分类学修订版》一书中,根据布卢姆教育目标分类学,并吸收40多年来认知心理学的研究成果,将认知领域的学习归结为四类知识的学习:事实性知识、概念性知识、程序性知识,反省认知知识,又将对知识的认知过程划分为记忆、理解、运用、分析、评价、创造六个等级水平。在实施教学之前,这四类知识是外在于学习者的,学生个体获得外在知识的过程要经历由低级至高级的六级水平的认知过程。由此构成了两个维度的目标分类表:

这就是说,教师在教学前,应对所教内容按知识类型和认知过程两个维度设置教学目标,用以指导学习、教学和评价。例如:九年级《计划生育的基本国策》,在《广州市义务教育阶段学科学业质量评价标准思想品德》中“知识:2.2.4我国的人口国情”“能力:描述我国的人口国情和特点”。据此,我们设置教学目标1:“学生能分析图表等数据,描述我国人口国情和特点。”行为动词有“分析”和“描述”,意味着“解释”即属于“理解”的认知维度;名词“人口国情和特点”属于“概念性知识”。所以,这个教学目标放在维度分类表就是:

通过分类表,可以看出目标1是涉及理解概念性知识。一旦我们理解了“概念性知识”和“理解”的含义,就能更清楚地了解这些目标。所以,将教学目标的设置置于分类表的框架中就能增强我们对教学目标的理解。

(二)教学目标陈述的格式和注意事项

1.教学目标陈述常用的格式

(1)行为动词+限制词+核心名词(概念)

(2)行为条件+行为动词+限制词+核心名词(概念)

(3)行为程度+行为动词+限制词+核心名词(概念)

无论采用哪种格式,教学目标的陈述最基本要包括动词+名

词。动词一般描述预期的认知过程,它是置于认知过程维度的六个类目即记忆、理解、运用、分析、评价、创造的背景中考查的。名词一般描述期望学生掌握或构建的知识,它是置于知识维度的四个类别即事实性知识、概念性知识、程序性知识、反省认知知识的背景中考查的。

2.教学目标陈述的注意事项

(1)要注意使用正确的动词术语陈述目标

在教学目标陈述的格式中,通过不同动词术语的使用,关注认知的过程和方法,界定对学科知识怎样运用和应用学科知识做到什么样的认知水平。我们要避免使用不可捉摸的动词,而要力求使用明确、具体、可以观察和测量的动词。修订的布卢姆目标分类对记忆、理解、运用、分析、评价和创造及其更加细致的次分类别的各类动词作了准确的界定,而且这些动词是经过心理学严格界定的。如下表:

而未经过教学心理学严格界定的动词,只能传达常识性意

义,难以起到三个导向作用,如:“培养学生革命的大无畏精神”或“提高学生的创新能力。”“培养、提高”含糊其辞,难以评价。

(2)目标陈述的行为主体是学生,而不是教师

在很多时候主语“学生”和“能”这些词语是可以省略掉的。但如果像“使学生树立……观点”“通过……使……”“培养……能力”等的陈述句,主语就成了教师而不是学生,这是违背逻辑的。因为“目标要描述通过教学后学生在知识、技能、学习方法和情感态度方面的变化。”所以,教学目标不应该描述成教师做什么,而应该描述成学生“应该知道什么”“能够做什么”。

(3)不要以“目的”代替“目标”

一些教师将两者混为一谈,如:“使学生成为德智体全面发展的人。”这样的陈述不表示学生学习的结果,也不符合目标陈述的要求,不能称作目标。

二、教学目标的导教、导学和导测评作用

教学目标以学生学习结果为导向、以可测量为原则、以提高质量为宗旨,力争发挥导教、导学和导测评作用,促进学、教、评三位一体。

(一)导学――指导学生主动、自觉、高效学习,有效自评

所谓“导学”就是目标能够明确告诉学生,通过学习他们能够学会什么。学生的学习一般是目标指导的学习。教学目标给学生提供他们如何学习的重要信息,帮助学生了解教学内容和要求。

对于中学生,教师可以直接向他们宣布教学目标,明确地告诉他们,当学完某个课题或者某个教学单元后,他们应该掌握哪些技能,会做哪些事,或会分析、说明什么问题等。清晰的目标可以向学生确切地传递教师的教学意图,具有交流的功能。学生看到教学目标后,就知道自己要学习的内容,以及学习之后可以根据教学目标来评价自己是否达到教学目标所提到的要求。所以,学生使用教学目标,可以提高学习的自觉性和主动性。

(二)导教――指导教学方法和过程,引导教师规范教学行为,把握教学的容量和难度

所谓“导教”就是目标中暗含要教会学生的知识、技能、认知策略是什么。一旦教学目标确立以后,教师就可以选用适当的教学过程和方法,如:讲授法、发现法、小组讨论法等。这就解决了“教师怎样教给学生?”的问题。在教学目标中采用动词+名词的结构方式,名词指出了知识,解决了“我要教给学生什么?”的问题,动词指出认知过程,解决了“教到何种程度才可以?”的问题。科学地设计和实施教学目标让教师控制了教学的容量和难度,在一定程度上可以避免教学的随意性,有利于规范教学行为,解决教师教学中常常存在的“难度无数、拓展无度”问题,具有很好的导教作用,即目标决定教学。

(三)导测评――指导教学结果的测量和评价,引导教师实施有效的学业评价

所谓“导测评”就是目标应暗含观察学生学习结果选用的条件。新的教学论主张对照教学目标测量和评价教学效果。在前面我们提到教学目标就是预期的学生学习结果。而学生学习的结果是内在的能力和倾向的变化。原本这种变化是不可观察的,也不可能直接测量的,但在陈述教学目标的时候,我们用了外在的可观察和可测评行为动词术语(即布卢姆区分认知领域的六级目标)来陈述学生内在的心理变化,那么教学结果的测验题就已蕴含在教学目标之中了。所以,有了可以操作的水平不同的具体目标,测量和评价就有了可靠的标准,起到导测评作用,即目标决定教学结果的测量和评价。

下面,我们通过一个例子来说明一下。例如:七年级下册《走进法律》,在《广州市义务教育阶段学科学业质量评价标准思想品德》中“知识:3.2.4犯罪”“能力:结合典型案例能区分一般违法行为与犯罪行为”。据此,我们设置教学目标“学生能结合典型案例,通过对比分析说明,能区分一般违法与犯罪的相同点和不同点。”行为动词有“对比”和“区分”,“对比”意味着“比较”即属于“理解”的认知维度;“区分”意味着“分析”的认知维度。

从导学来看,学生看到目标,就知道他们通过学习,最低限度要知道什么是一般违法和犯罪,两者的不同点、相同点是什么和有什么联系,在实际的例子中能区分开。这是“理解”和“分析”水平的要求。

从导教来看,老师看到目标就知道目标中暗含的是“概念教学”。教师可以侧重教概念的“关键特征”,使用典型的正例和反例,设置情景探究,将这些概念嵌入一个较大的概念框架之中,让学生进行分析并讨论这个框架中的相似点和不同点,从而提升学生分析和理解的能力。(具体例子如下:)

展示材料:

材料一:著名音乐人高晓松,在北京醉酒驾车导致4车连环相撞,4人受伤,最后被拘役6个月,处罚金。

材料二:某交警大队查获一名男子酒后驾车,该男子被扣6

个月机动车驾驶证,并处1000元以上2000元以下罚款。

问题探究:

完成下列表格并回答:为什么同样是违法,处罚却不一样?两者有什么区别?

采取这种发现式教学方法,学生在讨论探究的过程中分析、

理解、解构问题,在对比中找出概念之间的差异,区分一般违法和犯罪,进而更加明白“犯罪的本质特征”,达到对“概念性知识”的“理解”,从而突破了目标。

从导测评来看,这个目标涉及“概念性知识”,其测验题原本是较难以编写的,但目标具体化后,就变得容易了。目标陈述本身暗含了测量方法,方法就是让学生辨别和选择,而且评估的任务不是与教科书上的或教师上课使用的完全相同。那老师就可以给予若干“一般违法”和“犯罪”概念的正反例,让学生进行识别。例如:

李某是某中学的三好学生,因沉迷网络游戏经常进入网吧,

结识一帮社会不良青年,开始逃课。为了解决上网的花销,开始在社会上偷窃财物,受到公安机关的拘留;但仍不思悔改,多次进行拦路抢劫,最终因抢劫罪被法院判刑。

根据材料回答:李某的行为哪些是一般违法行为?哪些是犯罪行为?

通过这样的反馈来进一步验证教师的这种教学方式是否真的使学生达到了“理解”和“分析”的能力要求。

所以,只有目标的陈述具有导教、导学和导测评作用,才能

实现“学有目标”――有效地促进学生日常的学科学习,“教有依

据”――有效地规范和引导教师的教学,“评有标准”――有效地引导教师对学生学习结果的评价,学、教、评三位一体。

参考文献:

[1]L.W.安德森.学习、教学和评估的分类学[M].皮连生,译.上海:华东师范大学出版社,2008-01.

教育测评概念篇7

课程标准颁布以来,各种新理念纷至沓来。就数学学科来说,就有一开始的“十大核心概念”,到现在的 “核心素养”,以及近来山东省教育厅的课题中提到的“学科德育”。看到这些,很多教师迷茫了,几乎找不到方向。也难怪,教师的教学理念毕竟有限,这么多新鲜名词纷纷压过来,确实有些招架不住了。

为此,有必要进行思路的梳理与概念的辨析,正本清源,使我们在今后的教学之路上有一个更清醒的认识。

一、梳理概念

课程标准明确指出,数学“十大核心概念”包括数感、符号意识、空间观念、几何直观、 数据分析观念、运算能力、推理能力、模型思想、应用意识、创新意识。这“十大核心概念”在数学教材中大都是独立存在的。

数学核心素养包括数学抽象、逻辑推理、数学建模、数学运算、直观想象、数据分析六个部分。

从“核心概念”与“核心素养”界定的范围来看,二者之间有很多重叠之处(如图)。

“学科德育”是山东省教育科学研究院提出的“十三五”规划重点课题,它针对每一学科都制定了不同的德育目标。就数学学科来说,实施德育主要通过习题演算、讨论交流、合作探究、社会实践等活动,侧重于逻辑推理、实践反思、数学审美与道德品质的统一,主要包括“思维严谨”“理性精神”“数学审美”“爱国主义”。

小学数学核心概念、核心素养、学科德育对照表

二、辨析概念

不难看出,这些新概念之间是有交集的。为了更好地区分这些概念的内涵与外延,现将其与教学目标联系起来。

1.“教学目标”与“核心概念”

每一节课都离不开“教学目标”的支撑,没有“教学目标”的课堂教学,就相当于两个计划去旅游的人,一直在商议是开汽方便还是乘火车方便,而不商议到哪里去旅游。“教W目标”与“核心概念”是密不可分的,可以这样说,每节课的“教学目标”就是一个个“核心概念”的最具体的体现,它们的区别在于,“教学目标”针对的是一个“点”,而“核心概念”针对的是一个“面”。

2.“教学目标”与“核心素养”

2001年启动的课程改革的一个基本标志就是从“双基”走向“三维目标”,这其中既有量变也有质变,量变就是从“一维(双基)”到“三维”,质变就是强调学生的发展是三维整合的结果,从教学的角度讲,所谓的“三维目标”,应该是一个目标的三个方面,而不是三个互相孤立的目标。

核心素养之于三维目标同样也是既有传承的一面,更有超越的一面。作为核心素养主要构成的关键能力和必备品格,实际上是三维目标的提炼和整合,把知识与技能、过程与方法提炼为能力;把情感态度价值观提炼为品格。能力和品格的形成即是三维目标的有机统一。

举一个不太恰当的例子:我们课堂上完成的是一个点的教学目标,这无数个点就会组成一条有方向的线,这条线就是某一方面的核心素养,若干条线累加就构成一个面,进而成为一个立体,这就构成一个完美的人,达到核心素养的终极目标。也就是说,如果“核心概念”针对的是一个“面”的话,那么“核心素养”针对的就是一个“体”,这个“体”就塑造了一个完美的人,一个具有真、善、美的人。

如下图:

3.“教学目标”与“学科德育”

相对于“核心素养”的渗透,“学科德育”的渗透在一定程度上更容易让教师理解与接受。因为教学目标的“知识与技能”“过程与方法”正好与“思维严谨”“理性精神”相吻合,“情感态度价值观”正好与“数学审美”“爱国主义”相吻合。

三、量性评价

评价工具应该是每一种规则制定的量化测评手段,只有相应的评价工具才能使某种规则的实施有所考量,并通过相关数据进行有效分析。

教育测评概念篇8

(一)高等教育学生满意概念界定及影响因素研究

学生满意的概念产生于20世纪60年代,关于这一概念的界定,学者们基本是上根据顾客满意定义从不同角度提出的。下表列示了不同时期学者们对学生满意概念定义的代表性看法。

在影响因素研究方面,代表性的研究成果如:Aitken(1982)研究发现学生的成绩、对课程、教学和专业的满意度及孤立感都与学生满意度水平显著相关。Griffith(1999)研究发现学校氛围和学生满意度在不同层次间存在显著相关,认为影响学生满意度的因素可分类为学生学习经历和社会经历两方面。

(二)高等教育大学生满意度测评模型及其实践

在大学生满意度度量方面,美英等发达国家已经形成了较为成熟的理论、体系和方法,其中美国是最早进行大学生满意度实践研究的国家,因而最具代表性。美国的学生满意度测评理论是在市场经济的消费者理论的基础上建构起来的。Dwayne D.Gremler和Mchael A.McCollough(2002)提出了基于提高学生对教师教学成果的满意情况设计了学生满意度测评模型。Mavondo、Felix T.等人(2004)基于提高学生在教学、学习、科技、图书馆、学生服务和学生倾向这些方面的满意,设计了满意度概念评价模型。

二、国内学生满意度测评实践

我国对大学生满意度测评研究始于20世纪末,研究成果集中于实证研究。具有代表性的,如:张艺、鲍威(2005)采用统计描述和回归分析的手法,验证了大学生对民办高等院校教育的认可与诸多因素有关。杨清明(2003)采取问卷调查法对重庆高校的学生满意度进行了调研,结果发现:女生的满意度普遍要高于男生。尤海燕,俞丽敏(2005)根据随机整群抽样的原则,在宁波市不同批次的大学中分别抽取80名学生进行了问卷式调查,结果显示影响学生满意度的因素具有很高的一致性。王平与钱贵江(2004)、孙宝芝(2003)、李珂(2007)、李文超与李靖(2002)、傅真放(2004)等人也做了相关的研究。

随着结构方程模型的逐渐成熟,采用结构方程模型来测评学生满意度的实证研究也就应运而生。如:杨雪和刘武(2006)依据我国高等学校的具体情况提出了一个CHE-CSL模型,并对沈阳市6所高校进行了实证研究。刘慧(2011)在顾客满意理论的基础上分析了高等教育服务质量的内涵与评价方法,采用基于PLS技术的结构方程模型对学生满意度概念模型进行估计和检验。

三、结论与展望

综上所述,对高等教育学生满意度测评研究已较深入,但查阅诸多文献后仍可以发现一些缺陷:

第一,高等教育学生满意度影响因素的量化标准不一,满意作为人的一种情感反应,属于心理变量,对其量化只能通过间接测量,势必会造成误差。

第二,几乎所有的高等教育学生满意度测评数据都来源于对学生进行的问卷调查,由于受到种种不可避免的限制,如问卷的设计技术、被调查者答题时情绪等,也是影响学生满意度测评结果的一个因素;

第三,目前对高等教育学生满意度测评的研究存在着理论研究与结果运用相脱节的现象,理论研究结果在实际中没有很好地被运用。

参考文献:

[1]Delucchi,Michael.Student Satisfaction with Higher Education during 1970’s-A Decade of Social Change[M].The Edwin Mellen Press,United Kingdom,2003.

[2]Oliver,R.L.&Desabo.W.S.Processing of the satisfaction response in consumption:a suggested framework and research proposition,Journal of Consumer Satisfaction,Dissatisfaetion and Complaining,Behavior 1989(2).

[3]Bean,J.P&Metzner,B.S..A conceptual model pf nontrational undergraduate student attrition.Review of Education Research,1985(55).

[4]张艺,鲍威.民办高等院校教育满意度的实证分析[J].中国高教研究,2005(3).

[5]杨清明,税国洪,李志.重庆高校学生“满意度”的调查[J].探索,2003(1).

[6]尤海燕,余丽敏.不同批次大学生满意度调查分析[J].宁波工程学院学报,2005(4).

教育测评概念篇9

Analysis and Design of School Education and Teaching Evaluation System Database

PAN Guo-rong

(Changzhou Liu Guo-jun Higher Vocational and Technical School, Changzhou 213004, China)

Abstract: An evaluation database was designed based on the requriment analysis of the schooleducation and teaching evaluation system. It can realize themaintenance of the essential information, and the query and statistics of evaluation data. The needs analysis,conceptual design ,logical design etc. was disscussed in the entire design.

Key words: evaluation system; needs analysis; logical design; E-R diagram; relational model

学校教育教学情况测评是指学生对班主任教育情况及任课教师教学情况的评价,我校一直以来都非常重视学生对教师的评价。从1998学年开始,学校教务处会在每一学期的期中考试前或考试后,统一组织学生进行测评。最早采用的测评方式就是给每个学生发一张评价表格,测完后以班级为单位装订成册,供领导和教师查询,这种方式的主要缺点是查询不方便且无法统计分析;从2005学年开始,改为学生按评分规则填涂卡,教务处用读卡机读卡并统计,最后将所有测评情况汇总成册,供主要领导查阅,采用这种方式虽然能作一些统计,但统计方式单一、查询不方便,也耗费资源,班主任和众多任课教师很难及时、方便看到测评结果,尤其是学生对学校的意见、建议及评价信息。在学校加强信息化管理的大趋势下,学校于2008年初提出要开发一个基于计算机网络平台的学校教育教学情况测评系统(简称测评系统),以提高测评工作的效率,提升教学管理水平。

1 需求分析

需求分析是整个系统设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规范化和分析,这是最费时、最复杂的一步,但也是最重要的一步,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。

测评工作在我校已开展多年,本人对测评过程也比较了解,该项工作的主要负责部门是教务处。教务室工作人员提供了原先使用的测评评价表(见图1)及测评情况汇总表,明确提出了对测评系统的要求,通过分析,主要有以下几方面的要求:

1)学生能在校园网上登录系统,并且每个学生登录的用户名及密码是不同的;

2)学生测评时是不记名的,并且只能对本班班主任及任课教师进行测评;

3)测评的项目见图1测评评价表所示,这些项目和分值是相对固定的,即项目数不变,项目内容和分值在不同的测评中会有所调整;

4)学校领导及教师能在校园网上登录系统并查询测评数据;

5)测评数据可以用多种不同的方式汇总并查询。

2 业务流程分析

根据对测评的需求进行分析,可以得出测评系统主要的业务流程如图1所示。

由以上业务流程,可以清晰地划分出三大处理部分,首先,教务部门人员在测评前要对本次测评所需的基本数据进行准备,即要维护好参与测评的班级、班级的班主任、班级的科目及任课教师等相关信息;其次,组织学生对班主任及任课教师进行测评;最后,领导和教师对测评情况进行查询。

3 数据库的分析与设计

3.1 概念结构分析与设计

概念结构设计是整个数据库设计的关键,通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型。测评系统数据库概念设计的表达工具采用E-R模型,基本过程如下:

1) 按照业务流程分析中划分出的三大处理部分,可以确定主要模块。

教师情况数据维护:对教师(包括班主任及任课教师)的基本信息进行维护;

课程情况数据维护:对课程的基本信息进行维护;

班级情况数据维护:对参与测评班级的基本信息进行维护;

班级科目数据维护:对参与测评班级的所授科目情况进行维护;

系统用户维护:对系统用户的基本信息进行维护;

学生对班主任的测评:学生对本班班主任的教育情况进行测评;

学生对任课教师的测评:学生对本班任课教师的教学情况进行测评。

2) 确定实体集。

在教师情况数据维护中实体集合有:教师;

在课程情况数据维护中实体集合有:课程;

在班级情况数据维护中实体集合有:班级,教师信息;

在班级科目数据维护中实体集合有:班级信息,课程信息,教师信息;

在用户情况数据维护中实体集合有:用户;

在学生对班主任的测评中实体集合有:学生信息,班级信息,教师信息,班主任测评信息;

在学生对任课教师的测评中实体集合有:学生信息,班级信息,课程信息,教师信息,任课教师测评信息。

3) 确定实体集之间的联系。

学生是属于班级的,教师与班级之间可能有两种不同的联系,一是教师担任班级的班主任,二是担任任课教师,一个班级开设有多门课程,每门课程可以有1位或几位任课教师,通过分析不同实体之间的联系,便于设计数据库完整性约束。

4) 确定实体和联系的属性。

按前面分析及系统要实现的功能,可以设计出各个实体及联系的属性。学生是一个比较特殊的实体,从理论分析看,学生是参与测评的主体,系统中应该有这个实体,而从测评系统具体实际出发,测评时只需记录一个学号,不需要学生姓名等其他信息,因此,系统中不设计这个实体。

5) 画出局部E-R图。

分别画出班级选择科目及测评的E-R图,如图2、图3所示。

6) 集成局部E-R模型。

形成全局E-R模型,如图4所示,其中系统用户实体未画出。

3.2 逻辑结构设计

逻辑结构设计的任务就是把概念结构设计阶段设计好的基本E-R图转换为与选用的具体机器上的DBMS产品所支持的数据模型相符合的逻辑结构,并对其进行优化。

1) 将实体与联系转化为表。

在概念结构设计阶段已画出全局E-R模型,现在只要利用范式理论,将实体和联系转化为关系型数据库管理系统中的表,将实体中的属性转化为表中的属性。测评系统所选用的DBMS为Microsoft SQL Server2000,一般可以利用SQL语言来实现数据库、表、属性等的创建,并完成所有表及表之间的实体完整性、参照完整性约束和用户自定义完整性约束。

2) 数据模型的调整与完善。

数据库逻辑设计的结果不是唯一的,可以根据应用需要对设计结构进行适当的修改和调整,以期进一步完善设计,提高应用系统的性能。本测评系统中,学生测评完毕后,领导和教师要频繁统计查询测评结果,因此在表中增加适当的冗余是必要的。

4 结束语

数据库设计是管理信息系统开发过程中非常重要的一个环节,在进行数据库设计时,应该准确了解用户需求,以便设计出符合实际需要的数据库。本人开发的基于Struts框架结构的测评系统已经在学校成功进行了4次测评,在最近的一次测评中,有90个班级近4300名学生参与了测评,同时在线参测学生达400人,查询统计非常及时方便,大大提高了教学管理的效率和水平。系统的实际运行证明,测评系统中数据库的设计是规范的,运行是稳定的、可靠的,完全满足系统的要求。

教育测评概念篇10

目前用于人才测评的主要方法有:胜任力模型、素质能力模型、模糊综合评判、神经网络法等,但这些方法都存在一定的弊端和局限性。而云模型能够较好的实现指标定性知识到定量值的转化,可以同时兼顾模糊性和随机性,层次分析法具有一种系统思想,每一层的权重设置最后都会直接或间接影响到结果。因此笔者提出一种基于AHP和云模型的创意人才测评方法。

一、综合测评模型体系的建立

创意产业人才测评指标的设计要考虑创意人才最基本的能力,引领前言的能力以及完成工作任务的潜质。笔者采用DELP和AHP建立一套适用于创意产业人才测评的递阶层次结构模型,如图1所示,B级准则层包括知识、能力、意识和绩效四个指标,C级方案层具体测评指标,包括基础文化知识、职业知识、行业知识等19个指标。

二、创意产业人才测评指标权重的确定

层次分析法(AHP)作为一种综合测评中常用的确定指标权重的方法,由美国运筹学家托马斯・塞蒂(T.L.Saaty)于上世纪70年代初首先提出,是系统的决策思维方式。其步骤为:1.按照图1的层次分析结构模型,将同一层次的因素进行两两比较,构造判断矩阵;2.计算出判断矩阵最大特征值对应的特征向量,经归一化处理,即为各测评因素的权重分配。

另外,对于模型中B级指标权重的计算需要构建如下所示B1,B2,B3,B4的的判断矩阵,将矩阵经过标准化处理后得到向量WB=(b1,b2,b3,b4),即得到B1,B2,B3,B4相应权重分别为b1,b2,b3,b4。

三、定性与定量不确定性转换模型

1.云模型

云模型的概念是由我国学者李德毅院士提出,是建立在模糊集和概率统计基础之上,从海量的数据中找出知识的规律性和统计特征,实现定性与定量的相互转化,较好的刻画自然科学与社会科学中模糊与不确定的现象。

设U是一个具有n维空间的定量论域,C是U上的定性概念,若定量数值xU,且x是定性概念C上的一次随机实现,x对C的确定度μ(x)∈[0,1]是有稳定倾向的随机数:μ:U[0,1],x∈U xμ(x),则x在U论域上的分布称为云(Cloud),每一个称x为一个云滴。

期望(Expected value)、熵(Entropy)和超熵(Hyper Entropy)是云模型的三个数字特征,是对自然语言的整体性刻画,表现了定型概念的综合概率统计属性。期望Ex来源于概率论,通常指随机抽样过程中对变量取值的预期,是x在U上分布的期望,定性概念最典型的样本;熵En是表示定型概念转化为定量值的可能性的程度,取决于概念的随机性和模糊性;He是熵的熵,取决于熵的随机性和模糊性。

2.云发生器原理

正态云发生器是用计算机实现的一种特定算法,云模型通过正向云发生器和逆向云发生器实现定性与定量间的转换,其原理如图2所示:

3.云模型的评语集

本文将评语分为五个等级,Wi=(w1,w2,w3,w4,w5)(极差,较差,一般,较好,极好),为便于下文统计将其相应的赋值为(B,B+,A,A+,A++),其相对应的期望是Ei(1,2,...5)=0,0.25,0.5,0.75,1.00,取En=0.045 He=0.005,得到创意人才评语集如图3所示。通过创意人才评语集,即可将教育专家的语言值进行量化,而且每一个云图,都遵循3En原则,即最终测评分在3En范围之间,都属于该等级。

四、创意产业人才综合测评模型

通过专家打分获得样本点的xi,按照创意人才评语集由正向云发生器将人类基础语言转化为量化值。再利用逆向云发生器,依据公式(1)中样本均值、一阶样本绝对中心距和样本方差,求得指标的云数字特征。

五、案例分析

黑龙江动漫产业基地于2006年建立发展,对动漫人才的需求不断剧增,但这并不能成为人才质量下降的缘由,依旧需要招聘人员对创意人才的综合能力进行把关,这样才能创造优秀的动漫作品,满足人们多样化的需求,为动漫企业创造更多价值。

根据以上的理论,针对黑龙江省平房动漫产业基地动漫人才进行实例分析。首先,由10位教育专家以及动漫企业高层管理人员对动漫人才根据指标逐项给出意见,如表1所示:

由教育专家对二级指标评分,建判断矩阵,并通过方根法来求得权值如表2所示:

将云数字特征及表2中的指标权重代入式(2),得到综合的云数字特征,为Ex=0.7076,En=0.0605,He=0.0165,再调整熵及超熵值,得到创意人才测评云(如图4所示),从云图可知,云滴集中分布在0.6-0.8之间,且密集分布在0.72的周围,根据评语集,判断黑龙江动漫人才的总体质量“较好”,符合企业的要求,但仍存在问题,需要企业和教育部门共同探索培养出更能满足动漫产业发展需要的人才。

六、结束语

本文构建了以AHP和云理论为基础,知识、能力、意识和业绩为二级测评指标,以基础文化知识等19个指标为三级指标的创意产业人才测评指标测评体系。与传统的测评方法相比,云模型可以实现人类基础语言到定量的转换,从而解决测评过程中的偶然性和非明晰性;通过AHP确定权重指标,不会忽视每个指标对最终结果直接或间接的影响。因此,该方法不但实现了多角度对创意产业人才的测评,对创意产业人才的培养具有指导意义,而且测评模型更具有科学性和合理性。

参考文献:

[1]廖颖川,吕庆华.基于能力素质模型的企业创意人才开发[J].科技管理研究,2013(12):139-144.

[2]陈要立.基于胜任力模型的文化创意产业人才培养模式研究[J].经济问题探索,2011(8):129-133.

[3]王文通.基于AHP-BP综合评价模型的人才测评研究[J].统计与决策,2010(7):76-77.

[4]周钢.基于AHP模糊综合评价法的素质测评模型研究[J].中国高等教育评估,2012(3):31-35.

教育测评概念篇11

一、高校辅导员胜任特征的概念

1973年,美国的麦克里兰教授在教育管理研究领域首次提出了胜任特征的概念,并且把胜任特征的概念定义为,个人胜任的特点,可以从规定的工作岗位和组织环境中,对工作绩效的测评加以区别。迄今为止,国内外的研究学者对各种领域中的工作岗位进行研究,关于胜任特征的概念已有了很大的改观。

近些年,我国的研究学者也对胜任特征进行了研究,对于辅导员胜任特征的概念研究体现在教育水平、专业类别、工作时间、薪金福利、性别和工作性质等方面,能够促进辅导员对教育工作做出巨大贡献。

目前,综合国内对辅导员胜任特征研究的结论,总结有以下特点:第一,对辅导员的胜任特点大多数的学者只进行了理论上的研究,都是客观的看法,并未对实际的数量进行统计和调查;第二,大多数的研究学者都非常注重学生对辅导员的评价,反而忽视了辅导员对自身的评价和对岗位的了解。

二、高校辅导员胜任特征在教育管理中的应用

1.岗位特点分析

强调高校辅导员的主要特点,把重点放在如何完成任务上,不仅仅看完成的结果。以培养和教育学生为目标,强调高校辅导员与教师队伍的长期匹配,不是短期的就业选配。与此同时,对于高校辅导员胜任特征,其工作的分析是从工作要求和行为要求中体现的。

2.人才评价

按照传统的社会观念,在人才的评价中更注重的是对知识和技能的评估。高校在选择辅导员时,应选择德才兼备的高水平人才担任辅导员。此外,要按照辅导员的胜任特征,对目前在岗的辅导员进行评价和考核,只有这样学校才能取得更大的投资回报。

2.参与教育培训

组织高校辅导员进行统一的教育和培训。缩小辅导员之间的水平差距,有针对性地进行培训,做好教育培训所需要的必要工作,提高辅导员水平是教育培训的主要目的。想要达到教育培训的目的,首先要转变传统的教育培训方法,注重胜任特征等因素;其次,要寻求新的培训方式,打破传统的教育培训方式;最后,通过调查问卷、面对面谈话和深度测评等方式对接受培训者进行测评,采用这些方法达到教育培训的目的。

3.教育管理成果

高校辅导员的胜任特征研究成果为高校辅导员的管理工作提供了新的方式和新的技术。首先,根据高校辅导员的胜任特征制订明确的工作目标,要在当前自身的工作条件和未来长远工作发展二者之间进行适当平衡。其次,将高校辅导员胜任特征研究广泛应用于工作测评当中,可以更有效地指导工作考评。最后,善于总结和沟通是工作测评的一个关键的环节。根据高校辅导员胜任特征的工作测评,完善工作测评的内容,使辅导员认清当前的工作状况和长远的工作目标。

4.制订有效的职业生涯规划

制订有效的职业生涯规划,可以更加充分地满足个人的发展需要,为今后的职业发展奠定良好的基础,大大提高工作的积极性。通过对高校辅导员胜任特征的调查与研究,客观地对辅导员的胜任特征进行评价,使辅导员深刻了解自身潜在的能力,帮助其根据自身的情况制订更有效、更符合自身条件的职业生涯规划。最后,通过提高个人的工作能力实现自身发展的需求,完善自身与学校的协调发展。

综上所述,在高校应用辅导员胜任特征理论不但可以加强高校辅导员队伍的建设,提高辅导员的综合能力,还对高校教育工作的发展具有重要的意义,符合我国教育体制改革发展的要求。

参考文献:

教育测评概念篇12
教育测评概念篇13

一、 问题与反思——大学生心理健康状况评价中存在的问题

导致大学生心理健康状况评价混乱的原因,大致可以归结为两个大的方面:一是理论研究层面的问题;二是实践操作层面的问题。

1.理论研究层面的问题

(1)学科建设滞后,理论基础薄弱,基本概念曲解混乱

目前,大学生心理健康评价中存在的问题,很大程度上可以归因于理论研究的不成熟。从目前心理学的发展看,心理学本身许多基本问题并没有得到完善解决,而在此基础上发展起来的心理健康教育学则存在更多问题。由于学科建设滞后,理论水平偏低 ,导致心理健康研究中一些基本范畴,如心理健康、心理异常、心理障碍、心理疾病等界定模糊,至今没有得到科学的诠释和规范使用。究竟心理健康(问题)的本质是什么,研究者的理解是不同的。即研究者不是在同一语境下理解心理健康 (问题)的,他们属于不同的话语群体。这是导致大学生心理健康评价混乱的根本原因。

“作为学术研究,概念的界定、辨析是最基本的工作。因为,概念不仅是思维的工具——有了概念才能作出判断、形成命题、进行论证 ,也是学术探索的成果——在对概念作出的界定和使用中包含着论者的学术主张,概念的演变往往标志着学术思想的演变。一切研究成果不但在概念中积累,而且理论也借概念和范畴而发展” 。可以说,基本概念的日臻完善准确,标志着相应学科的日益成熟;而概念界定模糊混乱甚至曲解,必将导致对事物本质认识的随意性,最终妨碍它的科学发展。因此,进行心理健康研究,首先必须科学界定心理健康等基本范畴,只有这样,研究者才能有共同的语境和论域,才能有效地开展对话和交流,才能避免一些争执和误解。

(2)缺乏科学有效的大学生心理健康评价标准体系

要评定大学生的心理健康状况,首先必须要有区别与鉴定心理健康(或异常)的标准。然而,由于种种原因,心理健康标准一直是国内学术界争论的焦点。目前,我国学者判断心理健康的标准至少有六种:统计学标准、社会学标准、主观经验标准、生活适应标准、医学标准和心理学标准。由于研究者在研究中所采用的评价标准不同,研究结果出现相互矛盾、甚至相互冲突的现象也就成为必然。受多样化评价标准体系的影响,大学生的心理健康标准也是纷繁多样,远未达成共识。究竟学生出现什么样的心理或行为可以界定为心理健康(或异常),研究者的认识是不同的。这是导致大学生心理健康评价混乱的又一重要原因。

2.实践操作层面的问题

(1)心理健康评价工具存在的问题

第一,心理测评工具的选择随意性强,差异大。目前评价大学生心理健康状况常用的测验工具主要是心理健康评定量表和与心理健康有关的人格量表。前者如症状自评量表 scL 0、抑郁自评量表 SDS、焦虑 自评量表 SAS等;后者如明尼苏达多项人格量表 MMPI、艾森克个性问卷 EPQ、卡特尔 l6项人格 因素评定量表 16PF、大学生人格健康调查表UPI、心理健康测查表 PHI等。其中使用最多的是 sCL90.其次是 MMPI、EPQ、UPI等。

采用不同的测量工具,必然得到不同的测量结果。相关研究显示:以 UPI和 SCL 9O对同一群体大学生进行测量结果发现 UPI的阳性检出率远远高于 SCL904 J。另一研究采用 SDS和 CES—D对同一组大学生进行测量,结果发现SDS的抑郁症状检出率为 17.38%,远远低于 CES—D的检出率43.93% 。由于心理测评工具使用混乱,导致心理测评的结果相互矛盾。表面上看,这些研究似乎针对的是同一个问题,而实际上它们来源于不同的测评工具,其结果是不具备可比性的。只有采用标准化的测验工具,进行标准化的测量及评价 ,其研究成果才能与他人及文献进行比较 。

事实上,每一种心理测验工具都有自己特定的理论基础和适用范围。如果缺乏对其理论基础、测验内容及用途等的正确理解,必然会导致测验工具的滥用。以 scI9O为例自 1986年建立 中国常模后,sCL90得 到了广泛 的应用在所有关于大学生心理健康的实证研究中,运用 SCL90研究的文献占到70% ~80%。但由于缺乏对其理论、用途和内容的正确理解,近年来在该工具的使用过程中,逐渐暴露出一些问题。scL90是否适用于判断、比较大学生等正常人群的心理健康水平已受到质疑。研究者指出:scL90作为准则参照测验,其设计的初衷主要是用于衡量门诊及部分住院病人的 自觉症状和严重程度。它能较好地反映病人病情的严重程度及变化,但并不适于判断比较普通人的心理健康水平。研究显示:scLJ90用于正常人群心理健康测量时,其信 度高,但实证 效度差。相关研究 显示:以scL90用于大学生心理健康评价,几乎所有的指标均高于常模。因此,以 scL90作为大学生心理健康的评估工具是值得商榷的。

第二,测验工具本身不完善。心理测验工具是人们构建的结果,测量对象与工具之间并不具有同一性。理想的测验当然是包含所有能反映测量特质的行为,但事实上即使是再好的测验,也只能反映测评对象的部分属性,而且描述的只是现状,并不能揭示现象背后质的原因。因此 ,心理测验本身具有不完全、不稳定 、不精确的特点。

而在我国,心理测验存在更大问题。由于起步较晚,目前我国常用的测量工具多是从西方引进的。西方的量表产生于西方的文化土壤,其本身并不成熟,即使在解释其 自身的心理、行为上还存在许多问题 ,而在其他国家 ,则存在更大的局限性。相关研究显示:以 MMPI和 EPQ用于中国人样本 ,结果发现中国人测谎一项得分特别高。这一结果并不表明中国人更会 自我掩饰,研究发现 MMPI和 EPQ的测谎题对西方人可以起到测谎的作用,而对中国被试则是无效的,它只是另一项人格或临床的指标。在自我概念的跨文化研究中也发现了同样的问题。Bond发现,中国人 自我概念的得分总是低于西方人0 ;White&Chan也发现,即使在 中国文化价值中较重视的一些因素,中国人自我概念得分仍低于西方人” 。研究者指出,这一结果并不意味着中国人自我概念差 ,它反映的只是一种文化的差异而已。

中西方文化有很大不同,许多西方量表并不适合中国人 ,对量表仅做一些语言上的修订便应用到临床和实践中是不科学的。“去文化”的研究范式必然导致不科学的研究结果。

(2)心理测验的操作过程不规范,缺乏标准化目前,评定大学生心理健康状况的基本方法有心理测验法、观察法、会谈法、产品分析法等,其中使用最广泛的是心理测验法。而心理测验实质上是对行为样组的客观和标准化的测量。标准化是指测验的一致性,即测验的编制、实施记分及分数解释的程序的一致性,其目的是为了保证所有被试的测量条件相同,所获得的测评结果具有可比性。从当前大学生心理健康测评的实践情况看,心理测验的实施极其混乱,无论是测试环境、测试手段、操作技术、指导语还是研究取样等都缺乏标准化。

(3)心理测评结果的处理和解释存在问题

第一,心理测验的评价指标不统一。标准化测验的一个重要内容是计分、评分的标准化。客观统一的评价标准,才能保证所有被试的测评结果具有可比性。而当前,在心理健康测评中,心理测验的评价标准极其混乱。以 scL-_90为例,该工具的阳性筛查标准就有多种:①因子分标准:有的以至少一项因子分兰1为标准,有的则以至少一项因子分 ≥2或 至3为标准;② 以总分或总均分(GSI)为标准:有 GSI至1.28(GSI室 X±1.96)或 GSI至 1.09(GSI至 X±1.50)几种 ;③复合标准:以总分或总均分和至少一项因子分超标为标准 :如 GSI 1.22或至少一项因子分 2。不同的评价标准必然会得出不同的测评结果。相关研究显示:以 SCL一90对大学生测量 ,如果以至少一项因子分至 1为筛查标准,则阳性检出率为 29.2%;以 GSI 1.09为标准,则阳性检出率为 16.6%;以 GSI至 1.22或至少一项因子分耋2为标准,则阳性检出率为 4.4%_I 。

第二,常模老化。常模是测验分数相互比较的标准,是解释测验结果的参照指标。常模过时、样组分布偏态、样组规模过小等都会影响测验结果的解释。当前,大学生心理健康评定中使用的测验工具大多存在常模老化的问题。如scL—90、EPQ的常模修订于 1986年;MMPI、16PF的常模修订于 1988年。根据心理测验的理论要求,常模应在样本组和时间上有代表性,一般应每五年进行更新,及时修订常模对科学解释测验结果有重要意义。

二、应对与变革——提高大学生心理健康评定科学性的现实途径

1.夯实研究基础——加强理论研究,进一步促进心理健康教育学的学科发展

我国的心理健康教育自2O世纪 8O年代建立以来,获得了快速的发展,但总体上看 ,无论是理论研究还是实践探索,都仍处在一个较低的水平。尤其是,我们至今仍未形成适合本土的、独立的心理健康教育学学科体系,这已成为制约心理健康研究及实践最为重要的因素,所以,构建科学完善的心理健康教育学学科体系,建立必要的学术规范已势在必行。

所谓的学科体系,是指“学科研究对象的结构模式和反映研究对象各组成部分客观逻辑关系及其运动、变化、发展的系统理论” 。学科体系的形成不仅是学科独立的标志,而且也是学科领域 内相关研究科学化、专业化的必要保证。根据一些学者的研究,当前心理健康教育学的学科建设所涉及的基本问题主要表现在三个方面:一是研究对象的确立;二是研究方法的确立;三是理论体系的构建。

未来心理健康教育学的学科发展应注意遵循以下两条基本原则:“一是要有比较完善、严密的概念、术语和范畴体系。二是各概念系统、基本命题和框架结构之问必须按一定的逻辑构成有机整体,而不是机械堆积或拼凑而成。”我们认为,目前最为紧迫的任务是,必须对一些基础性、关键性的问题展开全面探讨,如基本的范畴、术语,学科对象、学科性质、学科边界等,各学科积极参与,众多学者的积极讨论、交流,必将促进心理健康教育学的科学发展。

2.优化研究队伍——提高研究人员的专业化、科学化水平

心理测评是一项专业性极强的工作,只有那些接受过专业训练且具备一定心理测量经验的人员,才能保证测评工作的科学性及测评结果的应用价值。由于我国的心理健康教育起步较晚,当前,高校从事心理咨询、心理健康教育的专业人员极其短缺且良莠不齐。有些人员的专业能力差,职业道德和知识产权的意识非常薄弱。所以,加大培训力度,不断提高从业人员的专业水平,建立相应的行业准入制度已势在必行。

3.提升研究水平——加强大学生心理健康评定工具的本土化建设

引进国外成熟的心理测量技术无疑具有重要意义,但一味地盲目照搬,缺乏批判力的移植复制,只能使我们离科学越来越远。正是出于对当前心理测评领域“过度西化”、严重忽视文化差异的“文化迟钝”、“文化色盲”现象的不满,学者们发出了心理测量本土化的呼声。

西方的心理测验,体现西方的世界观、价值观,当它用于本土社会时,它是有效的,而当它用于其他文化语境时,则不可避免地会产生认识上的曲解和误读。要解决这一问题,不外乎两条途径:一是}肖除文化差异 ;二是编制中国 自己的心理测验,其实质就是本土化问题 。本土化不是另起 “炉灶”,另建一套体系,也不是搞狭隘的民族主义,拒绝与世界学术对话,其最终的目标是以本土文化为依托,积极吸取和改造西方心理科学的合理成分并不断创新,在遵守基本学术规范的前提下,构建中国特色心理测验工具,并最终为世界心理学的发展作出自己的贡献。当前 ,在这方面我们已陆续开展了一些研究,如针对一些高校滥用心理测验工具的现象,教育部组织专家编制了“中国大学生心理健康相关评价量表”,目前在积极推广中。

4.实施科学管理——推进心理测评的规范化、法制化建设

在发达国家,心理测量等行业管理已纳入法制化轨道,有严格的心理学准入制度,对心理测评人员的资格认定,测验的编制使用,从业人员的职业道德等都有严格规范。比如,美国心理学会(APA)与教育测量理事会(AERA)等共同制定了《教育与心理测验标准》,使美国的心理测评从混乱走向有序。我国目前尚缺乏这样一个标准。尽管中国心理学会早在 1992年就出台了《心理测验管理条例》和《心理测验者的道德准则试行条例》,对心理测验的控制和使用、从业人员的资格认定 、职业道德等做了规定,但实际上形同虚设 ,现阶段,我国的心理测验的使用还处在一个十分混乱的状态。可以说心理测评行业管理的瘫痪状态,法制化建设的滞后,是导致目前大学生心理健康评价混乱的根源。所以,当前应尽快将心理测验纳入法制化轨道,并尽早出台行业标准。只有这样,我国的心理测评才能从混乱走向科学化、规范化,我国的心理健康教育才能获得健康 、持续的发展。

参考文献

[1]申继亮,彭华茂."-3前学校心理健康教育的困境与出路[J].北京师范大学学报 :人文社科版,2002,(1):14~20.

[2]张志勇.情感教育论[M].北京:北京师范大学出版社 .1993:413~424.

[3]师晓宁,刘晓红,徐燕,等.心理测验在我国大学生心理健康评价中的应用现状及存在问题[J].中国健康心理学杂志,2003,(4):281~283.

[4]王建中.UPI与 SCL一90对 同一群体的比较研究[J].中国心理卫生杂志,1995,(3):1l7.

[5]刘贤辰,唐茂芹,陈琨 ,等.SDS和 cEs—D对大学生抑郁症状评价结果的比较[J].中国心理卫生杂志,1995,(1):19.

[6]解学慧.心理测量本身及其在应用中的问题 [J].心理科学,2007,(2):422~424.

[7]单茂洪.正确使用SCL一90、16PF量表测查心理健康水平[J].中国心理卫生杂志,1998,(2):81—82.

[8]王金道.SCL一90量表使用的现状及检测心理健康的异议[J].中国心理卫生杂志,2004,(1):51~52.

[9]张志勇,罗珊红.大学生 SCL一90测查结果的比较分析[J].中国心理卫生杂志,1998,(2):77~78.

[10]Eysenek SBG,Chan J.A comparative study of personality in adults and children:Hong Kong VS England[J].Personality and Inpidual Differences,1982,(3):153~160.

[11]Bond MH.How language variation affects inter~cu1.tural differentiation of values by Hong Kong bilinguals[J].Journal of Language and Social Psychology,1983,(2):57~66.

[12]White,Chen J.A comparison of self—concept scoresof Chinese and White graduate students and professionals[J]. Journal of N on—White Concerns in Personnel and Guidance,1983,(4):138~141.ter,2000,(3):l~l1.

在线咨询