教育测量评价论文实用13篇

教育测量评价论文
教育测量评价论文篇1

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

教育测量评价论文篇2

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于馐缎翁冻耄杉逃缆奂沂粲谘芯恳馐缎翁徒沂窘逃缆刍疃谋局使媛桑⑼暾慕逃缆垩аЭ铺逑怠K裕逃缆垩б彩粲诨±砺垩Э啤T俅危逃缆垩У难芯慷韵缶龆私逃缆垩婕罢鼋逃煊颍诤址岣弧R部纱硬煌咏牵攵圆煌冻虢⒍嗖棵拧⒍嗖愦蔚姆种аЭ疲ㄈ纾航逃砺燮缆垩А⒔逃菲缆垩А⒔逃姓缆垩А⒔逃移缆垩У龋越逃缆垩в质且幻抛酆闲缘难Э芠6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

教育测量评价论文篇3

文献标识码:A

一、加深对思想政治理论课教学质量测评的认识

《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称“《纲要》”)中提出,近十年中我国教育工作有两大任务,分别是“促进公平”与“提高质量”,且认为改革教育质量评价制度与改革人才评价制度,是当前深化改革的重要举措[1]。在贯彻《纲要》时,加强高校思想政治理论课的教学质量测评体系建设具有重要的意义。

笔者认为,加深对高校思想政治理课教学质量测评认识是改革传统教学质量测评体系、增强思想政治教育实效性的重要基础。我们认为高校思想政治理论课教学质量测评是从思想政治教育的使命出发,运用各项教学质量测评指标对理论课的教学活动结果与产生的影响进行评估,将教学成果与绩效划分等级,针对绩效等级提出改进计划,并结合教学效果改进教学活动。如何得到好的理论课教育过程中的投入、产出与成果影响所反映的绩效测评结果,才是思想政治理论课教学质量测评的核心问题所在。

二、思想政治课教学质量测评体系存在的局限性

现阶段,我国教育部提出把思想政治理论课的建设当做考核高校办学质量与教育水平的重要指标,且已将其纳入高等教育的教学评估体系当中。不少学者对测评体系的研究工作已取得一些阶段性的成果,促使其逐渐趋于完善和独立,这使得思想政治理论课教学方面的测评体系逐渐受到各高校的重视。然而,不同地区、不同高校之间缺乏统一的测评目标、原则、方法等指导,局限性突出,整体效果不理想。现从三个方面对其局限性进行分析。

1.测评体系的核心定位不明确

目前,思想政治理论课测评方面存在一个特别突出的问题,即没有将学生学习效果问题置于评价体系的核心,取而代之的是将“所有要素的简单累积”或者“无核心”的评价理念作为其体系,导致无法达到评价的预期效果。现实生活中,学生是整个测评体系的核心利益相关者,他们参与了思想政治教育服务的整个过程和所有环节,通过评价教学效果与教学质量,综合判定教学效率,实现对教育教学课程的有效评估。英国学者麦尔肯・弗雷泽(Malcolm Fraze)认为:“高等教育的质量首先是指学生的学习质量,即学生在整个学习过程中所学的东西,包括所知、所能做的及其态度。”[2]因此, 质量测评体系应当明确或转移测评重点,以学生的学习效果为测评核心,改善现阶段重视政府、社会、学校提供的教学资源、条件、师资的弊端,实现测评重点从硬件建设向软件建设的转化。

2.测评体系的涵盖范围不全面

相对而言,思想政治理论的教学质量测评主要对学生知识掌握情况、技能掌握情况、情感与态度情况、价值观情况等进行准确评价,需要综合考量,给出整体评价结果,测评学生在社会生活和实践中运用马克思主义理论解决实际问题的能力。而我国现阶段的思想政治课教学质量测评仍然把重心放在课堂而非课外,放在期末而非平时,很少从学生的社会实践中的表现去考量理论课的教学效果和质量。

3.测评体系的方式简单划一

我们最常见的测评方式主要根据建立的思想政治理论课教学评估体系的制度与效果测评系统,通过测评因素的详细取证,鉴定教学质量与学生的学习情况,综合评价教师的教学态度与行为,并将测评结果纳入教师的年度考核当中,测评结果与教师考核、奖金级别、职称评定等方面相关,激发教师的动力。

(1)学生评教:是指学校组织学生对教师的教学行为及其态度、水平和方法等方面进行评价的活动。目前,学生评教最常见的方法是由学校管理部门(如教务处)提供统一的测评量表,在学期结束时由学生书面或在网上填写测评量表。

(2)期末考核:思想政治理论课最常见的期末考核方式有两种,一种是通过试卷考试完成答辩,教师按比例给出卷面成绩和课堂表现成绩,取综合分作为对学生理论课学习成果的核定。

三、有效构建思想政治课教学质量测评体系的几点思考

1.转变观念:生本教育理念的形成

教育工作正在从“师本教育”转变为“生本教育”,也就是从以教师为本转向以学生为本,通过激发学生自主学习的兴趣,提高教学效果。从重视学生的学习成果开始,逐渐转变教学思想,加强以学生为本体的思想政治教学,激发学生学习主动性的同时,也从改善教学条件、加强师资队伍建设等方面提升教学效果。

2.对象外延:开放式测评模式的应用

对思想政治理论教学质量的影响因素有很多,如教学条件、教学目标、教学任务、师资团队、学生态度等,这些因素都会影响学生的学习效果。教学不能只局限于课堂,而是要将理论内容同时纳入到课堂教学和课外辅导之中。课外辅导是指思想政治课教师在课外对学生进行个别或集体辅导,有个别辅导和集体辅导两种形式,其内容包括补课、指导作业、答疑等。课外辅导可以弥补课堂集体教学的不足,缩小学生成绩差异。因此,理论课教学质量的测评对象应外延到课外。另外,还应重点加强大学生与其家长对思想政治理论课教育的认知和理解,从而科学地进行满意度评价、学生素质测评及用人单位的综合评价等,共同测评整体教学质量。

3.实现途径:科学化

(1)促进思想政治理论课教学测评理论研究科学化。只有正确把握我国思想政治教育目标所处的发展阶段和基本国情,才能科学制定符合实际的测评制度,才能避免生搬硬套和表象化的测评研究;要明确思想政治教育测评是以思想政治教育的工作规范、行为标准为尺度,而不是以个体利益的实现程度为尺度;要明确测评的本质是针对思想政治理论教育所面临的问题采取解决措施,应始终围绕它的历史使命不断探索其具体功能及实现途径。

(2)促进思想政治理论课教学测评实践科学化。思想政治教育测评实践的科学化,需要尊重思想政治教育的发展客观规律,并重视绩效测评中的现实条件、测评方法及测评过程。

要通过流程的再造来对各个部门的职能重新进行界定,并确保部门间无职能重复、交叉情况出现,这样才能明确每一个部门和岗位的工作内容和范围,才能明确绩效标准;思想政治理论课教学测评指标体系建设,不仅要考虑到思想政治教育的社会与经济效益,同时也要对长短期效应、间接或直接效应进行考量,要对绩效测评体系的指标和测评基础资料数据库不断地加以完善和更新。

综上所述,高校思想政治理论课教学质量测评体系在不断发展与完善,我们必须根据国家经济的发展现状和社会需要,贯彻《全面提高高等教育质量的若干意见》精神,落实教学改革措施,提升教学质量,促进高等教育质量的持续可协调发展。

教育测量评价论文篇4

所谓教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。它主要包括对学生内在精神属性的测量,如测量学生的学习成绩、智力水平、品德状况、人格特征等方面,教育测量监测跟踪着学生的全面发展。教育评价则是根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。

当代我国的教师必须具备教育测量与评价能力主要基于如下几个原因:

一、素养中对教师所要求的“两学一法”事实上是教育测量与评价的载体

在教书育人的过程中,教师需要掌握“两学一法”(教育学、心理学与教材教法)以提高自己的教育教学水平。在当今社会庞大的教育科学体系中,有许多已经形成研究对象明确、研究内容相对独立、研究成果相对完整的学科分支,这些学科分支主要包括教育学、教学论、课程论、教育心理学、教育统计学、教育测量学、教育评价学、教育管理学、教育社会学、教育经济学、教育科学研究方法、教育技术学、教育评估与督导、教育生态学,等等。在课程设置与学科建设中,教育测量与评价既可看成是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,又可看成是一个兼容了教育统计、教育测量、心理测量、教育评价、教育评估、教育督导甚至教育科学方法等在内的学科群。由此我们可以说,教师需要掌握的“两学一法”是教育测量与评价学的载体。我们之所以要重视教育与评价,因为它在教育科学体系中具有十分重要的地位,它是教育科学体系中带有综合性、技术性、实践性、应用性等特征的实用性学科,是人们依据教育基础理论和教育规律来指导教育实践所依赖的技艺与方法。

二、当今世界对教育测量与评价高度重视及其蓬勃的发展

早在20世纪初,美国心理学家桑代克、教育测量学家柯尔就先后提出“凡存在的东西都有数量”、“凡有数量的东西都可测量”,这两句话成了教育测量学赖以存在并逐步发展的基础,正是在这种思想的指导下,桑代克领导其学生开始编制标准测验及从事教育测量工作。此后不到二十年的时间里,美国相继发表了三千多种心理测验和标准学力测验,由此在美国形成了一个教育测量运动的高潮。几乎与之同时,英国著名的11岁儿童考试制度,推动了该国教育测量理论研究与实践活动的开展。此外,法国的比纳等人在1905年创编并发表了世界上第一个标准化智力测验,这在当时不仅为儿童智力的早期诊断,特别是为筛选弱智儿童提供了一个客观的诊断工具,它对20世纪初教育测验和考试标准化也有直接的推动作用。20世纪30年代前后,美国的教育测验事业发展很快,测验的应用也十分广泛。当今,教育测量在西方很多国家非常流行并且应用范围十分广泛。

让我们回过头来看看教育评价,其历史更源远流长。国内外皆公认中国古代的考试是教育评价的萌芽。1933―1940年期间,美国教育协会所进行的教育史上著名的“八年研究”课程改革活动是教育评价的催生剂。从1933―1942年,以泰勒为首的美国进步主义教育家们受命进行一次课程与评价研究,他们以全面发展人的才能为目标,设计了一套新课程并对参加实验的学生跟踪考察,然后提出了以教育目标为核心、为依据的测验编制原则。1956年,美国心理学家布鲁姆就发表并详细论述了教学中的认知目标,他把认知目标按照由简单到复杂的顺序分为知识、理解、应用、分析、综合、评价六类。这种目标分类为教育评价提供科学依据。此后,教育评价运动在世界上许多发达国家蓬勃开展。

三、我国教育测量与评价研究的进展及其与发达国家的差距

了解了教育测量与评价的历史和发展,我们会深刻感受到,随着现代科学技术的发展,对于培养人才有了更新的要求,因此教育测量与评价显得越来越重要。现在我国正在倡导推行素质教育,要想真正贯彻与推行,必须建立教育运行机制,用教育评价理论来评价学校、教师和学生。改革开放以来,我国的教育测量与评价理论研究和实践也取得一定的进展。教育统计、教育测量、心理测量、教育评价等课程得到恢复和一定的重视。然而,从我国教育科学学科专业建设、学位点建设的实际情况来看,应该说教育测量与评价的理论研究还不能适应我国教育实践的需要,许多人对教育测量与评价学科重要性的认识还不到位,这与国外的情况大相径庭,值得我们深思,这亦赋予我们当代广大教育工作者一个神圣而又艰巨的任务:宣传和发展教育测量与评价学科,让它在我国这片教育领土上茁壮成长,力争在一二十年的时间里在此领域赶上甚至超过西方发达国家的水平。

四、教育测量与评价应当成为教师必不可少的专业素养与能力

在教育教学过程中,教师除了具备学科知识、教学能力等方面的素养与能力之外,更应该懂得科学运用教育测量与评价的与有关技术方法,才能取得教育教学的成功,才能成为一个名师。美国当代著名教育家格朗兰德说过:“评价是所有成功教学的基础。”在教书育人的过程中,教育测量与评价贯穿在整个教育活动中,教师对学生的评价无时不有,无处不在,需要及时作出一系列决策和判断,需要对学生的性向、能力、成就、态度、兴趣、潜能及发展等进行全面的了解,这都需要采用教育测量与评价多种方法,以弥补教师观察的不足。教师的对象是学生,而学生是生动活泼、多样性的,这样,测量与评价的方法及其结论也应当是丰富多彩、多样化的、个别化的;考试是一种教育测量评价,学期评语、作业评语、个别谈话、家访等也是一种评价,甚至一句话、一个动作、一个微笑、一个点头都是一种特殊的评价。评价在一个学生学会学习、学会做人、学会生活的发展过程中起着至关重要的作用。测量与评价的目的,不再局限于给学生分等级排名次,而是对学生的发展和潜能进行系统的调查,发现学生的优点与长处,指出学生的缺点与不足,更重要的是要促进学生树立信心,认识自己的相对优势与弱势,明确自己的努力方向。了解测量与评价的指导思想是为了创造适合学生发展的教育环境,而不仅仅是为了选拔适合精英教育的学生。一个教师必须具备良好的教育测量与评价能力和教学能力,这就好比一个医生必须具备诊断能力与开好处方的能力一样。这是教师职业不同于其他职业的典型能力与素养之一。

五、教师具备教育测量与评价能力可以改进与提高教学功能

教师的对象是学生,学生是活生生的个体,每个个体存在着或多或少的差异,教师倘若具备教育测量与评价的能力,在教育教学之前对学生进行测量,就可以摸清每个个体的学习和发展状况,并且针对不同类型的学生的学习行为特性,以及不同认知结构缺陷的所在,因材施教,进而取得教育教学的成功;教育教学过程中,教师亦可以不时进行测量并根据测量结果,了解自己在教学上的缺失,判断教材的可用性和教学方法的有效性,从而根据需要调整或改变教学策略;教育教学的最终目的在于确保和检验教学目标是否达到,教师根据测量与评价结果(比如单元、期中、期末之后),能够知道目前的教学情况离目标有多远,及时总结并为下一步教育教学制定计划。因此,现代教育测量与评价的思想方法对于教师创造性地教学、因材施教、提高教育教学质量等许多方面皆具有重要的作用。

参考文献:

[1]黄光扬.教育测量与评价.上海:华东师范大学出版社,2005.

[2]申继亮.新世纪教师角色重塑――教师发展之本.北京:北京师范大学出版社,2006.

[3]胡中锋.教育测量与评价.广东:广东高等教育出版社,2006.

教育测量评价论文篇5

[文献标识码]A

[文章编号]1002―5006(2011)04―0082―08

1 引言

随着旅游产业的发展,世界范围内的接待、旅游、休闲课程(即HTLPs:hospitality,tourism,leisureprograms)也迅速发展起来。中国的旅游教育始于20世纪70年代末80年代初,与中国的旅游业同时起步。蓬勃发展的旅游产业和国家政策吸引大量院校开始兴办旅游专业。中国旅游教育逐渐形成从上至下的包括博士、硕士、本科、高职和中职教育的金字塔体系。2009年,开设旅游课程的院校高达1733所,其中852所提供旅游高等教育课程,881所是中等旅游职业学校,旅游专业在校生达到952400人。然而,旅游院校和旅游专业学生数量上的增长却带来了教育质量控制方面的问题。要保证旅游教育质量的提高和旅游专业学生的竞争力,把教育评价或认证引入旅游专业培养方案的评价,具有十分重要的意义。

高等教育的复杂性及其多维本质使得教育质量的评价十分困难和复杂,因此学界对教育质量的实证性调查研究成果很少。国外的研究主要是把全面质量管理(TQM)理论(如美国波多里奇国家质量奖,即MBNQA:the Malcom Baldridge NationalQuality Award)引入高等教育领域。米兹卡茨(Mizikaci)认为,只有修正全面质量管理的维度才能满足教育课程管理的需要。此外,传统的教育评价模型,如背景、输入、过程、成果(CIPP:context,input,process,product)评价、目标游离评价和应答评价需要进一步的提炼,方能适应高等教育课程质量评价的需要。高等教育质量评价模型的开发需要运用全新的视野,结合质量管理理论和相关教育理论,来适应现代语境下高等教育的发展。因此,无论是外部评价还是内部评价,有效的理论和实证工具就显得十分重要。

自我评价是高等教育质量保障体系的重要方面。作为旅游培养方案的内部利益相关者,旅游专业教师应该能够评价他们自己的培养方案,也可以充当同行评价者的角色,在既定的标准上评价其他院校的旅游专业培养方案。从测评角度看,专业教师熟悉相关课程,能够评价课程的质量,并能验证测量工具的有效性。以往的研究大量调查了旅游专业学生、行政管理人员等旅游教育利益相关者的观点,但是作为利益相关者的旅游专业教师却被大大忽视了。因此,调查旅游专业教师对给定的旅游专业培养方案的认知及其质量评估所持的基本观点,对测量、监控、确认和提高旅游高等院校的教学水平和学术水平具有重要意义。

本项研究的目的是要开发和验证旅游本科培养方案质量测评工具,并审视旅游本科院校旅游专业教师所评价的旅游本科培养方案质量各个维度的相对重要性。通过整合TQM理论和CIPP理论,确定旅游专业培养方案质量评价的维度;通过界定和验证旅游教育的多维本质,为审视每一个质量标准的相对重要性提供学术的注解和视角;同时也可以为旅游本科院校以及外部的质量保证机构提供一个有效的旅游本科培养方案质量评估工具。

2 旅游本科培养方案质量评估理论模型

2.1 相关概念界定

质量。质量是“反映实体(产品过程或活动等)满足明确和隐含的需要的能力的特性总和(IS08402:1994)”,质量是“一组固有特性满足要求的程度(IS09000:2000)”,这是国际标准化组织(ISO)众多质量概念中最为流行的定义。本文以IS09000质量定义为基础来构建旅游本科培养方案质量的维度,即认同旅游教育质量的多维特征。

教育质量标准。本文采用霍顿(Houghton)的定义:教育质量标准是培养单位或培养方案对教育哲学(理念)、行政管理体系、师资队伍、学生全体、教学资源和专业特性等方面的基本陈述(essential statements)。这一定义是国际教育界比较认同的教育质量标准的可操作性概念。

教育质量维度。在国际上,旅游教育质量研究通常使用dimension一词,即本文中的维度。维度是一个判断、说明、评价和确定一事物的多方位、多角度和多层次的条件和概念。旅游教育质量维度是评价主体评价旅游教育质量的空间范围和视角方位。

教育质量指标。西方学界主要通过界定、确认和验证教育质量指标来反映教育质量维度,并就“教育质量指标是描述教育运行预期结果和教育系统具体特征的具体陈述(concrete statements)”这一界定基本达成共识。

2.2 文献综述

文献梳理表明,国外主要是通过构建开发程序(construct development procedures),以构建三级维度(一级维度,即标准;二级维度,即用来反映和观测教育质量标准的维度;三级维度是教育质量指标,即具体的测试语句)的研究路径来开发培养方案质量评估模型。教育质量的多维特征表明,教育质量的评价需要进行两级构建。关(Kwan)和瓦尔克(Walker)的研究证实,通过两级构建(包括the higher-order construct和the second-order construct),可以确认教育质量每一维度的相对重要性。阿尔图尔基(Al-Turki)和杜发(Duffaa)运用CIPP模型对典型学术部门绩效测量(performance measures)进行两级构建,开发出了学术部门绩效测量模型。

林永柏总结国内外教育质量概念的流变、发展和演变过程,并对各个教育质量概念的描述维度做出了准确归纳。林的研究认为,无论怎样认识教育质量,都需要清晰界定教育质量的标准和诸多维度以及每一维度所对应的指标。诸如评价和认证类的质量测评应该根据有效的、相关的、可测量的和可操作的标准和指标来实施。

从质量评价发展演变角度看,CIPP模型对教育质量评价产生重要影响,被广泛应用于课程质量评价。CIPP模型运用系统研究方法,实施背景、输入、过程、成果4大要素评价以及反馈评价,让政策制定者理解教育现象中的过程与结果。在商业领域,MBNQA模型被广泛认为是一个有效的商业质量管理模型。2004年,基于MBNQA基础的教育标准建立,包括7大维度:领导;战略管理;学生、利益相关

第二步:工具构建。研究小组运用先导测试(pilot test)和专家验证来进一步修正和确认工具中的测试语句,以便进一步评估和纯化量表。结合旅游本科培养方案质量指标所生成的80个项目,通过先导测试再次纯化量表。量表项目(即测试语句)采用李克特5级量表,计分方式以“很不同意”、“不同意”、“一般”、“比较同意”、“很同意”分别赋值1、2、3、4、5分。2009年10月,65名本科院校旅游专业教师为量表的80个项目打分。在这一阶段,要完成两个任务:根据回收问卷的回答情况,把没有回答或感觉难以回答的问题项目加以删除;对保留的项目进行项目总体(itemIto-total)相关分析(相关系数值大于0.3)和内部一致性分析(Cronbach’sα值大于0.7)。通过先导测试,筛选了量表中的项目,把80个项目缩减为68个,形成旅游本科培养方案质量初级评价工具。

第三步:计量属性评价。把收集的样本进行两次EFA(探索性因素)分析。运用EFA分析检验量表的信度和效度,对旅游本科专业培养方案质量评估模型进行初步验证。

4 实证研究

4.1 问卷调查与样本收集

样本数据来源于35所旅游本科院校的旅游管理专业教师。通过搜索中国高等学校网,研究小组根据中国旅游年鉴统计开设了旅游专业本科院校的情况,随机抽取了成立旅游管理院系的35所本科院校名单。通过相关校(院)系网站,获得了部分教师的个人邮箱。2009年10~11月,研究小组通过电子邮件(E-mail)形式把问卷发给这35所高等院校的479名旅游专业教师,共回收有效问卷263份,有效问卷回收率为54.9%。其中,男179名,女84名;本科138人、硕士83人和博士42人;工作1~3年的教师98人,4~6年的74人,7~9年的55人,10年以上的36人。

4.2 探索性因子分析

探索性因子分析将获得每个测量题项与因子之间(指标与要素之间)的因子载荷量(FactorLoading)。因子载荷量越高,表明测量题项与因子之间的关联性越强。对样本的探索性因子分析分两步进行。

第一步,运用主轴法,采取斜交旋转,来萃取因子,最后保留因子荷载量最大而且在0.5以上的55个变量。利用相关系数矩阵,在55个变量构面找出特征根值大于1的共同因子个数(因为篇幅所限,相关系数矩阵省略)。探索性因子分析结果表明,13个测量题项中因子荷载小于0.5的应予以删除,标准2(教学与学习)和标准3(课程)应合并成为一个标准,萃取出的公共因子有12个,而不是初级模型中的18个。

第二步,运用相同的方法对55项观测变量进行第二次探索性因素分析。结果显示,55项观测变量经萃取形成6大公共因子,形成修正后的旅游本科专业培养方案模型。所有观测维度变量的平均值大于3,说明旅游专业教师对旅游本科培养方案的观测维度都持积极评价;6大公共因子为旅游本科培养方案质量的有效预测因子,解释变异量在51.85%至66.86%之间。量表的内部一致性系数在0.78至0.95之间,表明量表的内部一致性良好。研究结果表明,样本结构的有效性强,每个指标在相应因子上的载荷量均大于0.5的临界值(表3和表4)。

5 结论与讨论

5.1 结论

本研究表明,在严格的建构开发程序基础上,可以把CIPP模型和MBNQA模型很好地结合起来,开发出旅游本科培养方案质量评价模型。旅游本科培养方案质量包括6大标准(战略管理、课程与指导、资源、师资、学生业绩、行政管理),在这些标准之下形成12个观测维度(远景、使命、目的和目标;自我提高;课程;教学与学习;资源与管理;教学空间;教师质量;教师业绩;学生和毕业生业绩;校友反馈;行政管理能力;学生管理)(表4),并在相应的维度下生成55个测量指标(表3)。作为一种测评工具,旅游本科培养方案质量评估修正模型得到初步验证,为旅游本科培养方案的评判提供了初步的概念性和指导性意见。

在考虑了CIPP要素的基础上,旅游本科培养方案评估工具(修正模型)重新界定了旅游课程质量的诸多维度,并把这些维度转化为有形的、可用来描述和测评这一教育体系期望结果的观测项目。此外,旅游本科培养方案评估工具(修正模型)还引入了MBNQA模型中的维度,这与目前教育质量评价和认证过程中运用的全面质量管理方法也是一致的。

对课程和教与学标准的进一步强调是与课程和指导原则相一致的。课程、教学与学习三者相互补充和促进,这些关键性因素在很大程度上影响教学的效果和学生的成绩,也相应地影响教育机构的质量业绩。课程与指导是Tedqual和ACPHA两大评价模型中强调的一大标准,包括课程内容与设计,也包括教学、学习和评价3方面。

具体来说,本研究考察了旅游专业教师对旅游培养方案质量不同维度的重要性的认识。研究结果表明,培养方案质量标准都有很高的因子荷载(表3)。被调查者认为,这6大质量标准对培养方案的质量具有显著意义。被调查者相信,CIPP模型中的输入(如课程与师资)和过程(如指导),在决定培养方案质量上是重要的影响因子。研究结果支持“课程质量、有效的教学和学生学习结果的提高是教育质量管理的基本方面”这一观点。旅游培养方案质量评估模型确认,培养方案应该优先考虑课程、教学与学习和师资的质量管理,来满足学生的需要。因此,需要我们高度关注“什么是一个好的旅游教师,什么是一个好的学习体验,什么是一个全面的学习体验”。研究结果还表明,一个成功的旅游本科培养方案,关键在于作为旅游专业教师和研究者的学术队伍的质量。“教师的资历、研究活动和产业经验反映在所教的课程中,就更加重要。”

研究结果还表明,战略规划和行政管理对质量有重要影响。传统的评价理论不太强调战略管理和领导能力对质量的影响,但旅游本科培养方案质量评估模型把这些要素作为测评的变量。这验证了基于TMQ(全面质量管理)教育质量模型中的核心要素(如领导者忠诚、战略管理、工作管理和自我完善机制)在旅游本科培养方案质量中的积极作用。学生、毕业生和校友的业绩反映了教育的结果。这个产出因素在旅游本科培养方案质量模型中被认为是学生业绩,要评价学生产出的情况,学生业绩应属于培养方案质量评价和认知工具中的一个范畴。

教育测量评价论文篇6

基础教育的质量、质量标准、质量评价、质量检测或监控等,是与会者共同关注的基本问题。大家从多种视角看待上述问题。特邀报告多为宏观视角。专题研讨会论文的视角可分为理论的、区域的和学校的三个层面。

基础教育质量包含的内容过多。办学质量、师资质量、课程质量、教学质量、人的全面发展质量等,都是基础教育质量必须包含的内容。观察基础教育质量的立场和角度也太多。宏观、中观、微观,理论、实践,历史、现实、未来,政府、社会、学校、家长,不同视角的观察,获得的结果和结论有所不同。特别是对于基础教育质量、质量标准的看法存在很多差异。

特别需要澄清的是,监控意义上的基础教育质量,指的是教育的质,而不是教育的量。质的意义上的教育质量,对应着以课程标准为核心的明确的标准(课标),与课程标准相对应的评价(监测或监控)只能用达标与否来表示。也就是说,质的意义上的教育质量,只有一个质的标准,判断的方法,就是看其是否完成了这个任务、达到了这个标准。《教育规划纲要》提出的建立国家基础教育质量标准,就是质的标准;建立基础教育质量监测或监控机制,就是通过恰当的、适用的评价形式,保障全国基础教育都能够完成教育任务、达到教育标准。

量的意义上的教育质量对应的是教育结果(有时还延伸到教育过程)的优劣程度。通过恰当的、适用的评价方法,对教育优劣程度作出判断,将不同地区、学校及教师的教育教学质量水平区分出来,能够给学校或教师的工作质量的高低或优劣进行排名。所谓“不断提高教育质量”,指的就是这种量的意义上的教育质量。

将质和量加以区分,有助于梳理对质量监控的认识,也便于质量监控工作的操作,在某种意义上还有助于对社会和大众的宣传。质,是达到目标,并且是百分之百达到。量,是“更高”、“更好”、“更多”、“卓越”、“优质”。政府、学校和教师的法定任务是完成质的目标,学校和教师在完成质的目标的基础上,可以努力达到更高的质量,但那不是当前质量监控的重点。质量监控,首先是质的评价和保障,其次才是量的追求。

基于不同的目的,质量监控应采用不同的评价形式;使用评价方法不同,获得的评价结果就不一样。测查教育质量的高低、好坏、优劣程度,适用于相对评价方法。相对评价方法的基础是群体均数、常模之类的客观标准。监测或监控基础教育质量是否达标,适用于绝对评价方法。绝对评价的基础是制订基础教育质量标准,比之“常模”,这种标准带有较强的主观性。基础教育质量标准是以课程目标为核心而确立的学校、教师和学生必须达到的教育和学习目标。通过绝对评价,可以准确而高效地监测或监控质量目标的完成情况。至于在实现标准之后,如何追求更高的、卓越的、优质的教育质量,就不是教育质量标准所关注的问题,因此也就不是教育质量监测或监控所应考虑的问题了。倘若在讨论制订基础教育质量标准问题时,不能在理论上和思维方式上剔除“更高”、“卓越”、“优质”这些旨在反映目标标准之上的量的提升情况的修饰词,就容易在质和量的问题上出现摇摆,就容易说不清基础教育质量监测的任务究竟是为了改进工作,还是为了给地区和学校乃至教师和学生进行排名。

研讨和论文中还涉及两个基础性概念,一个是监测,一个是监控。厘清这两个概念也有助于推进对基础教育质量问题的研究和实践。这两个概念涉及测、监、控三个字,分别具有不同的含义。测,是方法和技术,是手段,表现为测量工具的开发和应用;监,是实时掌握和了解质量状态,是对质量的充分把握、切实把握,表现为一种常态化的运作机制建设;控,是控制教育质量和保障教育质量,表现为一种使基础教育尽快达到国家标准的保障制度建设。基础教育质量监测是以质量标准为基点,测查教师的教学和学生的学习是否达到了目标。当然为了保证教师的教学和学生的学习,需要监测的还有学校的管理及其他教育质量的主要影响因素。建立一种质量控制的机制,以保证基础教育能够完成教育标准。在当前我国的教育体制中,督导或督学制度是实现监控的主要途径之一。测在前,控在后,测是技术的表达,控是制度的表达。监控比之监测,多出来的正是对质量保障制度的诉求。

二、从量的评价转向质的评价,从相对评价转向绝对评价

制订基础教育质量标准,是开展基础教育质量检测或监控的逻辑前提。依据质量标准而实施的评价属于绝对评价。我们要开展质量监控,首先需要实现评价观的转变。近年来,社会普遍信服客观标准,相对评价属于比较偏重于客观标准的评价(常模),绝对评价则偏于主观,但是质量监控需要的恰恰是要制订一个适合当前工作状态的主观标准(人为制订)。

从宏观角度看,在国家和一个相对大的区域层面,需要有意识地排除通过评价给地区和学校排序、评比的做法。宏观层面所谓转变评价观念,就是要强调基础教育质量监控的是质而不是量,是教育目标的完成情况以小学语文课程为例,课程标准对识字数量是从学生认识的字数和会写的字数两方面来要求的,学生认识的字数在第一学段增幅为1600字~1800字,会写的字数在第一学段为800字~1000字。这两个数字构成了教育质量的监控标准。但是有些地区和学校,把标准中的“一会”提高为“两会”(不仅会认,还要会写1600字~1800字,超标一倍),“两会”再提高为“四会”(会认、会写、会读、会用),对于这些做法,我们应该给予什么样的评价呢?给予“达标”,似乎不足以说明其质量的“高超”程度,给予“良好”和“优秀”,则又非质量监控的本意,也不是课程标准的本意,甚至还可以说是对课程标准的某种僭越和批判——要求二年级的教师和学生完成四年级的任务——课业负担就是这么被加重的!

对于学生及其家长而言,认字越多越好,这是量的评价,是相对评价的任务;对于学校、教师及政府而言,完成课程标准就好,这是质的评价,是绝对评价的任务。识字教学这个例子说明,可以“不断提高”的,只有量,没有质。

当然,一般来说,宏观和微观视角中的教育质量监控的实际含义多少有所不同。

宏观、中观的视角,重在监控底线,须用绝对评价方法。微观的视角中,重在考查程度,既可用绝对评价方法,也可用相对评价方法。假如以15秒为学生百米跑的速度标准,代表体育教学目标,那么我们可用绝对评价方法予以监控。凡15秒以上者为达到目标、完成任务、质量合格。但对于14秒、13秒、12秒、11秒的学生是否就意味着质量很高?要不要更高?在宏观和中观视角中即绝对评价中,后面的问题都不成立!只有在微观视角中,才可以说,跑11秒和15秒之间意味着什么差异。美术、音乐等艺术和技能性课程都如此,知识性课程、道德性课程同样如此。比如:学生做志愿服务或社会实践的时间,20课时为达标、合格。可以倡导或鼓励个别学生争取30、40个课时,并予以表扬,但不能作为质量标准。换言之,质的评价,是针对15秒、20课时的达标性评价。它不太关注14秒、13秒,30课时、40课时的问题,相反,它非常关注16秒和19课时所反映出的教育教学工作问题。

及存在的问题。基础教育质量监控的“达标”性质和“保障”目的,决定了绝对评价是比相对评价更加适宜的评价方法。

从微观角度看,由于绝对评价依据的是教学目标,是一种质的评价,因此它有助于我们发现教学中的问题,其结果对于改进工作具有重要价值。而相对评价依据的是群体均数,是一种量的评价,它有助于发现个人差异,其结果具有很客观的评比、排名作用。所谓转变评价观念,就是依据提升教育质量的目的,微观层面的学校和教师,都应该将适应于“完成既定教学任务,发现教学中存在的问题以便及时改进”的评价方法作为主要方法,而压缩和减少使用相对评价方法。

无论宏观角度的监控还是微观角度的监控,都应遵循把握教育质量的“质”这个逻辑原则。《教育规划纲要》中提出的制订基础教育质量标准所预示的对应的评价性质是质的评价,对应的评价技术是绝对评价。如果说我们曾经在新课程改革过程中一度比较重视应用相对评价的技术和方法,如比较重视课程及教学目标的生成性,重视研制各种常模,以便于评价每个孩子(与群体均数相比)的发展情况,那么,国家层面所要监控的必定是教育教学目标的达成程度。相对评价一般使用等级分数,自然能够评出名次;绝对评价一般使用达标线,只能分出是否达标,而不能细分名次。

当前,基础教育质量评价面临的问题是多方面的。

重量轻质,并把量当成质,是当前的一个主要问题。当我们把一个本来有目标、有标准的事物由于美好的愿望而有意抹杀其质的标准,使之变为一个具有无限弹性的事物时,“不断提高”这四个字,就从愿望性的口号变成了现实政策。在“不断提高教育质量”的观念下,是无法确立和制订质量标准的。没有标准,便无法确定恰当的、适用的评价方法;没有明确的评价方法,便没有切实的监控。“不断提高”只是此类愿望性口号的代表,实践中还可以看到花样翻新、五光十色、丰富多彩的不断创新的概念说法(优质的、卓越的、高标准的、可持续发展的学生等)。这些说法的目的并不在保障教育质量方面,而仅在于如何“不断”提升名次,以达到“出人头地”的目的。在几篇介绍香港基础教育质量监控的文章中,我们也可以清晰地看到这样一个转向的趋势:基础教育质量监控的评价从重视输入、过程,向重视结果方面转化,从重视量向重视质方面转化,从重视“虚”向重视“实”方面转化,从权力控制向评价监控方面转化。

有论文鉴于目前流行的评价方法对教育质量的结果评价只有好坏、优劣、高低这样的表达方式,而提出用模糊综合评价模型来处理这个问题。这在实践中也是一种被大家普遍接受的方式。但是,在好坏、优劣、高低之前,还存在一个“是否”、“有无”的问题,而“是否”和“有无”所针对的,恰恰是基础教育质量的标准所在,是质量的“质”所在。

时龙理事长在讲到质量标准框架时,提到了一系列相关工作,概括地说,主要包括:一制订标准,二研制相应的技术、方法和工具,三建立监测机制,四建立控制、保障机制。这四个要素构成了基础教育质量监控的完整架构。

香港教育质量检测和保障的基本机制包含三个圆圈,小圈指学校层面对于质量的监控,中圈指区域层面对于质量的监控,大圈指国际层面对于质量的监控。它给我们的启示在于,这三个圈完全符合质量保障和质量管理的一般思维和实践逻辑,管理学上称之为PDCA质量圈(计划、实施、评价、改善)。香港的质量监控机制对我们研究、设计、实验基础教育质量监控的方案和计划,具有重要的参考意义。

基础教育质量监控应该是一个逻辑严密的系统。这个系统所包括的四个基本环节(质量标准——评价技术——检测方案——保障制度)的相互关系应该是:质量标准是基础,是当前的工作重点,是评价或监测的指标构成。监测(评价)方法和工具是与质量标准相配套的技术手段,是教育评价研究者最为关注的重点。监测方案是以与质量标准相关联的评价技术为核心而建立起来的一整套教育质量监测机制,这套机制也可视为基础教

三、构建教育质量监控体系的四个基本要素及其相互关系

育质量监测的解决方案,目前国家和各省市正处于尝试研制和试点建立阶段。第四是依据这套监测机制或监测方案而构建的质量控制和保障制度,这是通过对现有教育管理制度进行以保证质量为目标的整合而形成的新的基础教育管理体系。具备了质量控制和保障机制之后,质量标准才能真正得到全面落实。

目前来看,要建立基础教育质量监控体系,我们还有许多问题需要澄清,有观念方面的、习惯方面的、认识和理解方面的,体制、机制和制度方面的,也有技术和操作方面的。

我们首先要解决的问题是制订基础教育质量标准。

这项工作的艰巨性主要表现在三个层面:思想理论层面、政策制度层面和方法技术层面。

在思想理论层面,“优质”、“均衡”、“人民满意”等观念混淆在一起,不利于在“什么是”基础教育质量标准问题上取得价值共识。许多地区在为义务教育均衡发展制订阶段目标时,都把“优质均衡”或“高质量、高水平均衡”作为一个阶段目标的标志,说明在义务教育均衡发展问题上普遍存在认识上的混乱。优质与均衡分别体现着不同的价值取向。价值的多义性,导致基础教育政策的多标准性;政策的不稳定性,导致教育评价及质量监控工作的盲目性和模糊性。

在政策制度层面,监控体制的建设涉及教育行政部门、教育督导部门、教育研究部门以及其他相关部门的职责和权利的整合与合作。近年来,各地教育行政部门在做各种机制调整的尝试,各级督导部门也在积极开展质量监控的理论和实践探索。这个层面的问题是当前推进基础教育质量监控工作的关键。其深层,关乎思想理论的进一步澄清;其表层,影响着评价技术操作方面的研究和推进。

在方法技术层面,制订基础教育质量标准,所面临的首先是质量标准的研制问题,而不仅是测评工具、分析手段等问题。教育质量监控是以课程标准为基础的,即虽然课程标准是主观制订的,但我们必须假定它是合理、合法的(虽然有与会者提出课改后新课程标准存在种种问题)。课程标准可分为三个维度的内容,一是知识、技能维度,二是思维、表现维度,三是态度、情感维度。知识、技能部分对应的标准是理解和掌握;思维、表现部分对应的标准是判断和表达,态度、情感部分最为复杂,课标对此的表述是态度、情感、价值观,在实际操作中,如北京的综合素质评价,还包括学习兴趣、自信心、意志力、积极性等。态度、情感、价值观的可测标准怎样确定?这是多年来一直困扰大家的难点问题,但并非不能解决。当我们首先确定质量标准是“准则参照”而不是“常模参照”,对应的方法是绝对评价而不是相对评价时,这个问题就会在相当程度上变得比较清晰也比较容易操作。

质量监控,核心是保障教育活动完成既定目标。香港在质量标准的基本分类中,同样包含“学生表现”和“校风及学生支援”的范畴。该范畴的“范围”表述(学生支援、学校伙伴,态度和行为、参与和成就)和“指标”表述(学生成长支援、学校气氛,家校合作、对外联系;情意发展和态度、群性发展,学业表现、学业以外表现),这两个层次的表述方式,形成了一种“准则参照”体系,并在相当程度上具备了“是否”、“有无”的基本特征。由此可见,即使是对于态度、情感、价值观这方面的教育目标,只要排除了量的无限要求,其质的部分,还是可以通过我们的细致工作,加工成为可测的指标体系的。上海教科院基教所陆关于上海地区参加2009年PISA测试情况的报告,也向我们展示了PISA怎样成功地测查了态度、情感和价值观方面的内容。

四、基础教育质量监控理论与实践今后可能的发展方向

作为基础教育质量监控的核心问题的评价体系及其方法,可能需要我们向着逻辑化、技术化和艺术化方向进一步深化研究。评价体系及其方法的逻辑化,指的是强化质量监控体系的科学化程度;技术化,指的是强化质量监控体系的实用化和便利化程度(如指数化、色标化、概念化等);艺术化,指的是强化质量监控体系的平等、尊重、友好、善意、和蔼、亲切等美感友善的程度。艺术化主要在微观层面的应用中需要特别加以注意,以便于学校和教师愿意自觉地、愉快地应用。

评价方法和技术没有好坏之分,只有恰当与否。根据不同的评价目的,选取恰当的、适用的评价方法,是正确的做法。如相对评价对于发现学校或学生的发展问题而言,是好的评价方法。绝对评价对于监控既定教育质量目标的完成及工作改进情况而言,是好的评价方法。

我们始终面临着一个十分纠结的问题:如果说质量标准的制订从理论上讲指的是“最低标准”的话,那么,我们多年来习以为常的一些概念,诸如优质、卓越、高水平、拔尖创新、学生的可持续发展等等,又怎么理解、怎么对待、怎么处理?换言之,怎么不断鼓励学校办出特色,不断鼓励教师提升教学水平,不断鼓励学生提高学习成绩?这个纠结,根本原因在于,监控者(政府)确定的质量标准不是质的标准,而是量的标准;使用的评价方法,不是旨在达标、在发现问题以改进工作的绝对评价,而是旨在区分发展差异、旨在评比排名的相对评价。

其原因还在于,应该属于学校校长甚至教师的某些权力,在一定程度上还被掌控在政府教育管理部门,质量监控与业绩考评与评比竞赛等混杂在一起。这些,都有待于教育体制、制度和机制的进一步改革。教育质量监控工作一方面是一项有助于促进教育改革的工作,一方面它又需要通过教育改革的深化才能逐渐完善起来。

教育测量评价论文篇7

教育评价中的技术主义倾向及其超越谢燕

我国农村地区中小学教师的工作满意度及其与组织承诺的关系教育测量与评价(理论版) 柴江,赵志纯

走出教师评价的两难困境徐文祥

文化协商反思视域中的信息技术课程评价标准的构建钱旭升

换位教学应"渡"中有"度"刘海娟

我们该追求怎样的语文课堂解自忠

中学生心理健康家长评价量表的编制刘视湘,郑日昌,高翔

国有民办中学初一新生心理健康状况调查蒋湘祁,肖艳平

我国高考改革应走出一元价值取向刘五驹

中国高考需松绑——慎言高考造成学生课业负担过重王瑞珍,黄光扬

高考作文命题三十年之审思李新

中国与新加坡大学入学考试制度之比较李木洲

美国数学评估"测验项目和测验设计"中存在的问题及思考邢丽丽

全国教育与心理统计测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会综述王彩霞

作文教学应树立三个观念——由一则作文评改案例引发的思考成军

教学管理评价的伦理学视角尹月

考试改革是实施素质教育的突破口侯晓玲,齐美利

中小学校长道德素养的测评维度宋燕

项目反应理论(IRT)在小学数学成就测验中的应用李映红,张绍军

师德评价结构系统的元研究林宇

绍兴市学生成长档案袋评价实施情况的考察徐志伟

农村义务教育的"离农"倾向:表现、危害与思考袁潇

基于反思性教学的反思罗永勤

文化资本视角下农村小学生语文教材适应性探析金本能,王守恒

由课堂"异类"现象引发的思考叶梅,孙贞锴

中学生心理健康自评量表的编制高翔,郑日昌,刘视湘

高中生物理学习兴趣与自我效能感、成就目标定向的关系研究高光珍,胡象岭,王德才,彭军生

高考作文命题与评分的新思路——以交际信息学为视角赵年秀

我国高考公平的价值及实现路径张和生

2008年五课改实验区高考化学试卷评析及启示曾兵芳,陆余平,彭仁伟

浅析美国基础教育课程评价的类型与特点刘丽群,林洁

中法高中毕业会考制度的比较与借鉴教育测量与评价(理论版) 陈园园

评课——不妨先让学生说话何秀凤

需要警惕的三种课堂评价欧阳锡龙

由一道试题想到的姜军

没有"问题"的课最有问题王树云

德育评价:从"以评促管"出发李香民

心理健康测评和全人教育模型郑日昌,高翔,刘视湘

我国基础教育评价的回顾与反思刘尧

深圳市新安中学学生评教的调查与分析郭凯

中小学名校长的评价问题探析王磊

温州市中小学教师发展性评价的行动研究董加选

课改三议山子

"预、探、点、做、思"五环节主体探究型课堂教学模式述评于义良

小学语文课堂理答的多维视角及应对策略彭永帆

论德育评价中的人文关怀叶飞

亲子分离对留守儿童安全感发展的影响研究曹中平,杨元花HtTp://

"从考试到评价"的实例分析张警鹏,郑启跃

我国百年作文命题的考究与求索刘光成

小学语文学业水平考试命题走向例谈帅晓梅

中美教育考试分数的报告与使用之简要比较杨志明

区分性教师评价制度及其对我国教师评价改革的启示刘兰英

考试的起源(上)杨学为

评课:让课堂回归阳光生态代保民

"尺子"论黄玲,任胜

测评:从教育理想出发邓书云

构建促进理解力的学业评价郝京华

把握方向,贴近实际,积极稳妥地推进湖南新课改高考命题工作陈最华

PISA评价中性别表现差异的特点分析赖小琴,刘秋生

构建概化理论分析思路的新框架黎光明

中小学教师工作满意度及其激励策略陈虎强,杨思

教师评价:由奖惩依据到促进专业发展——以浙江省瑞安市安阳实验中学为例翁庆双

高中语文模块学习过程性评价的实施策略及反思——以浙江省温州市第十九中学为例刘胜文

一年级小学生的汉字书写质量测查赵冬臣

中学校本课程开况的调查及思考——以江苏省无锡市三所中学校本课程开发为例环蓉,樊小杰

不同社会支持对留守儿童心理健康的影响研究教育测量与评价(理论版) 雷芳,贾艳杰,徐黎玲,周林霞

初中生班级归属感的调查与思考——以浙江省象山县为例江丽丽

1978~2008:高考语文试卷研究报告黄俊

美国华盛顿州中小学学生学习评定及启示范晓婧

学生发展:课堂教学的终极追求陈瑞生

别让问题学生的教育成为问题教育李飞鸿

课堂教学应着眼于学生后续学习能力的发展王奎生

让"连问"成为开启学生思考的金钥匙钱忠娟

以共同愿景助推学校发展李霞

课堂语言要有针对性严丽仙

教育行政组织绩效评估指标体系的构建胡伶

唐海县开展初级中学教学管理评价的实践与思考桑德宝

新课改背景下中学生综合素质评价的成效及问题审视吴熙龙

甘肃省农村中小学教师职业压力调查研究赵志纯

长沙市开福区中小学艺术课程实施现状的调查与评析教育测量与评价(理论版) 罗炜

《湖南地方文化常识课程标准(修订稿)》述评周小青

淄博市淄川区高中生物理学习自我效能感调查彭军生,胡象岭,王杰,王德才

中学生主观幸福感与家庭因素的相关研究童玲玲,谢敏芳,李黎

我国十省(市)新课改高考方案述评刘丽群,刘一砖

关于应用回归分析监控教学质量与预测高考的思考温涵

再谈"巧用回归分析监控教学质量与预测高考"韩裕娜

英、德教育督导制度的比较研究及其启示石灯明

正视课堂教学中的不和谐"音符"雷群东

教育测量评价论文篇8

前言:现代世界在信息化中进行高速的发展,数学是现代科技产品开发的基础保障,是国家创新建设的重要支柱,也是人才培养的重要方向之一。为了使我国在国际市场中更具竞争力,科技型人才的培养是一项重要工作,而保证科技人才培养的一大重要前提就是保证数学教学的质量。在各个国家的基础教育中,数学都是一门重要的学科。鉴于数学在在未来社会发展中起到的重要作用,二十世纪六十年代初便逐渐出现研究学者致力于数学的研究工作。而我国对数学研究成果相对不完善,需要吸取先进经验进行充实。

一、全美教育进展的评价

1、NAEP的发展

NAEP是全美教育的简称,NAEP的发展要从20世纪60年代说起,美国教育部门针对学生学习质量缺少了解,开展了一项全国范围的周期性研究项目,称之为全美教育进展评价,也就是NAEP。此项目使用多维度的评价框架,详细的描述了学生的学习状况,科学的反映出学生对教学知识的掌握情况。此项研究使全美对学生的学习质量有了初步的了解。到80年代时期,不同地区的要求下,NAEP在各州开展了测评体系[1]。随着NAEP发展逐步成熟,越来越受到各教育部门的重视,不仅如此此项研究在国际教育事业中也引起了极度的重视,1988年国际教育进展评价研究使用NAEP的评价体系,在所参与的6个教学机构进行了教学质量评价。足以见得NAEP教学研究成果的质量。

2、NAEP数学评价系统

NAEP的数学评价系统力图描绘出,全美中小学生数学教学成绩的变化状态。NAEP在1990-2003年这个阶段所使用的评价结构包括了,数学内容、数学能力、数学质量三个方向,其中数学内容所指的是书的性质、运算、测量、代数与函数等等,数学能力所指的是对概念的了解、程序性知识等,数学素质干改了推理、交流与关联。到2005年NAEP的数学评价结构所反映的是最新的课程重点与课程目的[2]。为达到在数学内容与了解做数学的方法上保持平衡的效果。

二、国际学生评价项目的研究

1、PISA的评价体系

PISA的概念是国际经济合作与发展组织所进行的国际学生评价项目。PISA的评价是基于终身学习的理念,所提出的论据是认为数学素养是理解与使用数学的能力,以及数学对人类在未来生活与工作中所起到的作用于良好的判断能力。所以PISA的方向是学生未来的发展,所重视的是学生发展的潜能。不只是倾向于学生对数学课程的掌握程度,与数学教学的目的,而是同时吸收校内的教学内容与校外所学习的元素,关注学生在平时生活中使用的数学能力。

2、PISA的数学评价结构

PISA同样是属于定期的持续的评价项目。第一次的评价测查开始于2000年,参与国家高达30个OECD成员国,此后PISA的进度是每三年进行一次测查。PISA的目标是以一个更开阔的角度对学生进行数学的考察。PISA的基本结构涵盖了三个方面,第一个是数学内容,通过更广泛的意义去理解数学内容,例如定量推理、从属关系等等。第二个是数学过程,所指向的是思考与推理、交流、解决问题等等呢过。第三个是数学情景,所指向的是人的生活、工作、科学关系等想关联的情景。更加开阔了评价的范围。

三、已有研究结论对我国教育评价的启示

1、确定正确评价目标的前提

正确的评价目标属于建设可续评价系统的前提。对于技术数学质量的评价需要以提升教学质量,以及学生数学素质为方向。国内现阶段的数学教育评价对基础数学教育的改革行程了阻碍。现阶段的书序质量评价主要重视的是高难度方向,目标是甄别与选拔服务,在一定程度上屏蔽了评价系统的反馈学生发展的性能。科学性的数学评价系统需要着眼于学生未来的发展,科学的反应学生的学习状态。

2、确保教育评价的科学规范实施

目前已经形成的国际数学研究结论是,客观的研究资料、严格的测查过程是进行成功评价研究的保障。结合研究过程来看,要先保证调查抽样的随机性,对国内中小学生进行测评时,要涵盖各个范围的中小学教学机构,避免抽样调查的不全面性。在进行全面测查前,可进行小范围内的测评,对测查中可能出现的问题进行提前掌握,确保测查的有效进行[3]。测查方式可选择多种渠道,最后在进行测查结果分析时要确保其真实。可靠,在收集测查结果是要细致,测查结果不仅要显示学生的数学学习情况,还应该查看数学素养的发展进程。

结论:国际数学测评的最新理念与测评的最新方式,对我国进行素质教育为中心的教育改革具有一定的启发。我国教育的发展长期以来受制于应试教育的模式,形成的教育发展进度的重要阻碍。在我国教学模式中各类的考试也是在进行学生的测评,若是在测评过程中,加入学生过程测评与数学素养测评则更具现展的意义。对中小学数学测评的研究,可对国际现有的先进研究成果进行借鉴,充分丰富我国中小学数学测评的理论依据,提升教育改的的进度。

参考文献:

教育测量评价论文篇9

一、建立监测与评价模式的意义

(一)建立监测与评价模式是高校加强和改进“90后”大学生爱国主义教育的需要。爱国主义教育是一项具有战略意义的基础性工程。它是基础,是面向全社会、全民族、全国人民的教育,是提高民族素质和加强社会主义物质文明和精神文明建设的基础性工程。爱国主义能极大地调动全民族的力量,增强民族凝聚力,形成全民族的最大合力,推动社会主义现代化建设;爱国主义能够激发每一个人的爱国热情,唤起人们和祖国同呼吸共命运的爱国情怀,使人们为祖国取得的每一个重要成就感到欢欣鼓舞,为国家碰到的灾难和人民受到的损害而伤心忧虑。我国党和政府长期以来都十分关注大学生爱国主义教育工作,推出了一系列举措,各高校也相应地采取了一定措施,对爱国主义教育进行监测的过程,实质上是推动高校提高爱国主义教育质量和效率的过程。

(二)建立监测与评价模式是弥补爱国主义教育不足的需要。我国高校长期以来在爱国主义教育方面偏重于在课堂上对学生的正面灌输教育和日常生活中的严格管理,只关注教师在教学方面的质量如何和学生考试的成绩高低。单纯的衡量标准虽然对教学质量起到了促进作用,但是对于爱国主义教育的真实效果如何却没有一个完善的监测与评价标准。因此建立爱国主义教育的监测与评价模式是促进爱国主义教育全面发展的必然。

(三)建立监测与评价模式是“90后”大学生特点的必然要求。从当前的情况来看,一是“90后”大学生对待爱国主义教育存在模糊性,对待爱国主义教育在态度上存在偏差;二是“90后”大学生的多元性特征导致其爱国主义价值取向削弱,良好的成长经历导致其爱国主义意识淡薄;三是大学爱国主义教育存在着内容缺乏时代性,理论缺乏创新,教育对象缺乏连续性、长期性和针对性,教育方法直接且过于单调等问题。“90后”大学生本身处在一个思想不断发展成熟的时期,承受巨大的学业、心理和就业压力,极易受到外来思想的侵蚀,这就更加迫切需要加强以爱国主义为核心的民族精神和以改革创新为核心的时代精神教育。也迫切需要建立爱国主义教育的监测与评价模式推动高校改革原有的爱国主义教育体系,使之更好地适应“90后”大学生的需要。

二、构建监测与评价模式的原则

(一)坚持社会主义原则。思想政治教育工作需完全服从于政党和阶级的需要,体现了政党和阶级利益。因此在对爱国主义教育进行的监测和评价的过程中要按照无产阶级的立场、观点、方法和党的社会主义初级阶段基本路线对照爱国主义教育工作,坚持用科学的、发展的眼光制定相应的监测和评价模式,同时应结合90后大学生中存在的错误思潮进行批判,帮助学生树立正确的爱国主义思想。

(二)坚持实事求是的原则。新时期的大学生对于新思想、新事物的接受能力非常快,爱国主义教育工作也不能脱离实际情况,要做到理论联系实际。同样作为爱国主义教育重要一环的监测与评价工作也要坚持实事求是的原则,掌握实际情况,了解实际效果,作出实事求是的判断和分析。其根本是为了实实在在地推进爱国主义教育工作,使其能取得显著的效果。

(三)坚持针对性的原则。高校爱国主义教育的监测和评价必须针对爱国主义教育的目标和要求,无论对爱国主义教育的内容、方法还是实现途径,以及实际效果都要契合爱国主义教育的根本目的。此外,由于“90后”大学生的不同特点,要充分考虑到他们不同的成长环境、不同的思想状况和不同的文化背景,同时他们的接受能力和思考能力也已大大超过前人。因此,要始终坚持以学生为本,在进行监测与评价的时候要根据不同层次的学生制定不同的标准,不能以偏概全、以点概面。

(四)坚持系统性原则。高校爱国主义教育的过程是一个规范的系统性过程,这就决定了高校爱国主义教育的监测与评价具有突出的系统性特征。它要求高校爱国主义教育的监测与评价工作立足于全面把握,从整体上真实反映学校爱国主义教育的基本情况与成效。同时要求学校内部各行政机构、教学、教辅部门及各基层院系都明确责任,层次分明,管理有序,各部门做到分工明确,协同合作,做到各个环节紧密相连,环环紧扣,形成爱国主义教育的合力,充分发挥教育、管理这两大要素在爱国主义教育这一系统工作中的巨大作用。

(五)坚持动态性的原则。建立爱国主义的监测与评价模式一方面要充分继承和发扬我国监测公正、评价客观的优良传统,同时充分汲取国外在此领域内的先进经验和优秀的成果,把它们和我国高校爱国主义教育的实际相结合。另一方面时代的发展及互联网的普及应用使爱国主义教育处于不断发展和完善的过程,其教育效果也是一个逐步显现和不断强化的过程,这就决定了爱国主义教育的监测与评价的内容、方式方法要经常性地根据客观条件和具体情况的变化而变化。只有坚持这种动态的变化才能准确及时地反映出高校爱国主义教育的变化和发展。

三、监测与评价模式的运行

(一)明确组织领导机构。设立校级领导机构,建议各高校党委成立由校领导为主要负责人,教务处、学生工作部等部门负责同志,以及各二级学院分管学生工作的党委(总支)书记共同参与的一个直属于高校党委领导的爱国主义教育监测与评价领导小组,负责全校的爱国主义教育监测与评估工作。具体由教务处主导教学监测系统和教学评估系统,校学生工作部主导管理监测系统和管理评估系统,相关职能部门和各二级学院一起协助做好管理监测和评估系统。此外还应建立健全机构的相关管理制度和绩效考核标准。

(二)进行逐阶分级式的监测与评价。“90后”大学生的爱国主义教育是一个具有高度整体性和系统性的工作,它需要学校党委、行政把它作为一个全局性的问题进行考虑和布局,它不是某一个部门或者某一位老师能够组织和实施的。高校应结合“90后”大学生的特点,构建具有现代爱国主义教育特色的监测与评价体系。该体系分为两个主系统,分别是教育系统和管理系统。

1.教育系统。由学校教务处主导,相关的职能部门例如教学设备处、现代教育中心、评估中心等教辅部门协助管理,下设教育监测系统和教学评价系统。其监测与评估的内容主要包括两方面:一是施教者的主体状况,包括他们的政治素质、人格素质和理论修养;二是受教者个人的思想品德情况及受教群体的思想品德的状况。目前各高校的教育评价系统已经相对比较完善,国家也专门进行本科教学水平合格(审核)评估促进高校不断改进教学,完善教学评估。对于教学监测系统,主要包括教学前的准备监测、教学过程监测和教学效果监测与信息反馈三部分职能,由于目前高校职能部门人手有限,往往对于教学监测都是通过教案检查、督导组听课、学生评教等方式进行。

2.管理系统。由校学生工作部主导,相关职能部门例如团委、招生就业处等部门协助管理,下设管理监测系统和管理评价系统。管理监测系统主要通过二级学院进行,以各学院的学生科、团总支为基础,通过辅导员和学生组织对党团组织活动开展情况,学生会和学生社团开展活动情况,校园文化建设情况,以及社会实践活动开展情况进行监测。管理评价系统则通过学生对辅导员和班主任的测评、对学生活动的参与程度、对学生干部的拥护程度等方面进行评价。

3.两个主系统的地位与关系。在系统论的构建原理下,教育系统和管理系统都处于同等重要的地位。学生爱国主义教育监测与评价领导小组可以通过构建这两个系统对学生的理论、实践及评价进行有机整合,两个主系统下的子系统一旦出现问题就可以及时得到协调和解决。

四、监测与评价的结果反馈

对爱国主义教育工作进行监测和评价的最终落脚点是增强爱国主义教育的效果。因此将监测和评价的最终结果对监测和评价的主体和客体进行反馈,促进他们不断进步显得尤为重要。监测和评价必须有结果,不能有头无尾,只有过程,没有结论。如果只有监测和评价的过程而没有结果的反馈,那么整个监测与评价体系的构建也就失去了意义。

对于监测与评价的结果,应当采用恰当的方式表现出来。可以采用评语、等级、数量或者综合以上的表现方式。但是无论采用哪种方式都必须把结果反馈给被评价单位和被评价者。反馈的过程中应当注意方式和方法,可以采用集体讲评、个别谈话的方式,一方面保护了被评价者的隐私,另一方面实现了反馈过程中的思想沟通。在整个反馈中应以表扬为主,批评为辅,重要的不是将被评价人一棒子打死,而是让他通过评价反馈找出不足,寻求解决之道。最终把爱国主义教育的工作提高到新的水平。

爱国主义教育的监测与评价是一个系统的工程,可以对爱国主义教育的效果作出更加真实可信的结论,对于帮助和改善高校“90后”大学生爱国主义教育工作具有非常重要的理论意义和现实意义,值得更多的思想政治教育者关注和研究。

参考文献:

[1]梁建桃.高校大学生健康教育实施监测与评价的研究[J].武汉体育学院学报,2007(9).

教育测量评价论文篇10

一、西方教育评价发展的历史梳理

对于西方教育评价的历史发展,以色列著名教育学、课程论专家利维(A.Lewy)将其分为三个时期:1.古典的考试型时期;2.心理测量占统治地位的时期;3.后现代时期。美评价专家古巴和林肯(E.G.Cuba&Y.S.Lincon)通过深刻分析与把握评价的内涵,将其划分为四个时期:1.测验和测量时期;2.描述时期3.判断时期4.建构时期。[1]我国有些学者把其划分为六个时期:变革时期、教育测验运动时期、泰勒时期、稳定发展时期、兴盛时期和专业化时期。[2]这几种分法都有其合理之处,当前评价领域多以美国评价专家古巴和林肯的划分为基准来探索评价理念的发展与变化。在这三种评价的划分中利维是以历史的大跨度的划分,虽对每个阶段的特征做了阐述却没有十分清晰的时间划分段,所以这种大跨度的划分有种笼统感。古巴和林肯对评价的划分,主要是从十九世纪末开始,以阶段发展的特点为主要发展线索;这时的评价已慢慢开始正规化,他们不仅对每个时期的时间界以清晰的划分而且对每个阶段的特点进行了详细的阐述和深入的分析,并归纳每个阶段的主要特征且以其为划分阶段;对于每个阶段的代表性事件也加以叙述,给读者清晰的时间感、时代感,脉络清晰,纹理清楚,能让人很快把握教育评价发展脉络。我国学者是以时间发展线索为主一贯而下,主要是对前人的研究结果做了详尽的概述,其中对教育评价的发展初期也做了概述。而后两者的划分却有着异曲同工之妙。通过对这三种评价的综合分析,现将教育评价的历史发展梳理为两个时期:一是初萌期;二是发展期,其间包括发展历史期和现今发展状况。这种梳理以时间为脉络,呈现教育评价发展的历程。

(一)初萌期(19世纪中期到19世纪末期)[3]

在利维的大跨度的教育评价划分时期中,古典的考试型时期的评价的特点以口头提问来检验学生是否学习并记住重要的知识。而美特雷范斯(Travers)认为19世纪之前的口头评价不是正规的评价,最早的正规评价应该是1845年波士顿产生的以书面考试取代以往的口试的改革。并第一次大规模地使用试卷测验学生成绩,其科目主要为地理学、语法、历史、自然哲学、天文学、写作和算术。因为它首次用学生的测验分数评价一所学校的教学质量或方案,增强了评价的客观性,所以这次改革也成为教育评价史上的里程碑。为了进一步增强评价的客观性,从十九世纪六十年代开始一些学者做了有价值的工作。

1864年,英国格林威治医学校的校长菲奢(G.Fisher)首先用科学方法研究教育测量问题,并规定了五分制评分的标准,这是用科学方法研究教育测量问题的最初尝试;1879年冯特(Wundt)在德国莱比锡建立了第一个心理实验室,并设计了种种揭示人的心理本质问题的测量方法,同时,他与卡特尔(Cattel)、霍尔(Hell)等一起研究了教育的许多问题并提出了实验教育学的基本思想和方法;1882年英国高尔顿(SirF·Galton)在伦敦设立人类学测验实验室,进行人类个别差异研究,并在统计学者皮尔逊(K·Pearson)的帮助下设计了许多统计方法,一些教育学家借鉴这些统计方法,将不同的学生学习能力与学习效果量化,进行客观比较,增强客观性。1897年美国人莱斯(T.M.Rice)对学生所做的拼字测验的结果表明:8年中每天花45分钟同每天花费15分钟进行拼字练习的学生的测验成绩区别不大,所以他提出对教学评价方案进行改革;这在教育界引起很大的反响,引起人们的关注,而他也是最早以明确形式提出对教育现象进行测定的人,因此,现今的教育评价便以此作为教育评价研究的开端。

教育评价发展的初萌期测验和测量并无明显的分别,而且教育评价更多的是侧重于测量的客观性,注重对学生的分数等级的人为划分。但也就是在以上这些测量研究潮流的推动下,教育评价向教育测验方向发展。

(二)发展期(19世纪末至今)[4][5]

教育评价的发展阶段经历了不同的发展时期,不同的教育专家根据教育评价发展的阶段特点将其分为不同的时期。现将其综合分析如下。

1.中国一些学者所划分的教育测验运动时期,与美国评价专家古巴和林肯所划分的测验和测量时期处于同一时代,即为19世纪末至20世纪30年代。在这个时期,测验或测量等同于评价。由于受科学管理运动的影响,学校被视为工厂,学生被视为原材料和产品,教师成为产品加工者,而产品合格与需要测验或测量来检验,各种统计学,测量技术得以发展。一批教育学、心理学者开始将这些技术运用于教育领域。1904年桑代克(E·L·Thorndike)发表了巨著《精神与社会测验学导论》,书中提出了"凡是存在的东西都有数量,凡有数量的都可以测量"的著名信条,并在此激励下,他与他的学生积极投入教育测量工作,陆续编制了各科标准测验和标准测量表等。桑代克的这个著作也成为测验运动蓬勃发展的开端,这之后出现了许多有影响性的研究。而且在1915年以后,大学介入了教育测量的研究,并推动教育评价的发展。在这个时期各种智力的、学业成就的、人格的测量工具也随之发展,法国"比纳-西蒙智力量表"、德国冯特的实验心理学研究成果等也相继问世。这一系列的科研成果满足了当时社会发展的客观需求,同时也为评价理论的系统发展提供了良好的数量化基础。

2.中国一些学者所划分的泰勒时期和平稳发展时期,与美评价专家古巴和林肯所划分的描述时期处于同一时代,即为20世纪30年代至20世纪50年代末。这个时期主要是根据预定的教育目标对教育结果进行描述,评价更侧重于可操作的行为目标,而且评价也不再等于"考试"与"测验"。评价在这个时期有如上特点,主要是得益于美教育专家泰勒的"八年研究"。泰勒作为八年研究的评价组主任,指出评价应该是一个过程,而不是仅仅是一两个测验;评价不仅要报告学生的成绩,更要描述教育结果与教育目标的一致程度,从而发现问题,改进课程教材和教学方案。[6]在泰勒的影响下,教育评价取得了一些成就,如:1947年林德克威斯特(E·F·Lindquist)、泰勒和其他人建立了教育测验服务机构,促进教育测验的进一步发展;1950年,古里克生(Gulliksen)发展了经典测验理论,使其系统化;1954年,美国教育调查联合委员会和国家教育测量委员会提出心理测验和诊断技术方案;在泰勒参与并指导下,1956年布卢姆(Bloom)与其同事对认知领域的教育目标进行了分类,这对今后完善学习和教育评价起了重要作用。

3.中国一些学者所划分的兴盛时期,与美评价专家古巴和林肯所划分的判断时期处于同一时代,即20世纪50年代末至20世纪70年代初。这个时期的特点是:评价视为判断的过程,评价不仅对预定教育目标的结果进行描述,目标本身也进行价值判断,认为价值判断是评价的本质;在这个时期形成了诸如"形成性评价"、"目标游离评价"等新的评价理念。

4.中国一些学者所划分的专业化时期,与美评价专家古巴和林肯所划分的建构时期处于同一时代,即20世纪70年代末至今。在前三个时期中的评价尽管每一时期的理论都力图克服上一代的缺陷,但其管理注意倾向、忽视价值的多元化、过分依赖科学范式等不足,促使这一时期内以"共同建构"为特征的评价时代。这个时期的到来是与质性评价方法的应用联系在一起的。因为随着社会的不断进步发展和课程改革运动的深入,评价由原来的量化评价融入了质性评价,而且许多评价专家在进行评价模式的设计中力求做到质与量的相结合;同时评价是一种民主协商、主体参与的过程,并受"多元主义"价值观的影响。教育评价在不同的历史发展时期中的侧重点不同,但其发展越来越规范、专业化。

三、西方教育评价的历史沿革对我国现实教育评价发展的借鉴意义

教育评价的发展对一个国家或地区的教育发展有着极其重要的,因为一个国家教育评价系统的发达与否,是衡量一个国家或地区教育事业发展水平高低的重要标准之一。虽然教育评价的发展经历了一百多年的历史并逐步走向专业化,但至今,教育评价仍为评价专家和学者所头疼的问题。因而了解了教育评价的发展史,有助于把握评价发展的基本脉络,掌握不同时期教育评价发展的特点及其缺憾,从而对我国教育评价的发展有着现实的借鉴意义。

(一)深入研究和开发教育的量化评价与质性评价的最优结合

从教育评价的历史发展来看,评价理论的产生和发展离不开测验理论与技术的研究。虽然定量评价有其局限的地方,如只适用于评价能够量化的方面,在无法量化或不应量化的地方使用了量化会产生误解和歪曲,但从评价的本质来讲,评价虽是个主观行为,但必须有一个客观的基础,而这个基础就是通过测验技术来实现的。因此对于学生评价的各种问卷、量表、常模、校标等的建立和计算机软件的开发和应用需要进一步的研究和深化。而质性评价强调评价过程中人与人之间的交流,具有很强的灵活性与针对性强,注重评价过程中多种因素的交互作用。但是这种评价方式主观性强,对评价者的个体依赖性较大,易受非本质问题的干扰或迷惑,影响其对本质问题的评价。因此,评价者在进行评价是就要注意如何对质性评价与量化评价的优化结合,有些项目适合以量化评价为主,有些适合以质性评价为主,在在实际操作中要依据不同条件合理选用评价方法,使得优势互补,充分发挥他们的优越性。

(二)教育评价由单一走向多元化发展

随着社会的不断发展,世界多极化格局的形成,多元化也成为时展的脚步。多元化倡导一种多视角看问题的思维方式,它渗透了社会、文化、经济、政治等多种领域,这也要求教育评价不再局限于一种单一的只重视分数而忽视能力的评价机制,从而建立一种既促进学生全面发展,教师不断提高,而又促进课程不断发展的评价体制。因为人是多元的,而不能以一元的方式去评价和扼杀人的其它方面,同时人与人之间具有一定的差异性,对待不同的学生,要根据其差异性来发展他们的特长,而不是以一种规范的格式来发展他们,固化他们的思维。

(三)确保资金充足,提高法律保障,办好专业杂志,促进评价发展

纵观国内外教育评价发展史可以发现,资金、法律、专业杂志是促进教育评价发展的重要因素。充裕的资金是保证教育评价顺利实施的前提条件,有效地法律保障是教育评价顺利实施的外部动力,高质量的专业杂志为教育评价的传播、交流提供了发展平台。政府对教育改革提供充裕的资金可以进行一定规模的教育实验研究和评价实践活动;可以考虑设立独立于教育决策部门的教育评价税务所,专门从事评价的实际工作,确保评价公正、科学和专业化,同时政府对这些机构做有力的监督和管理,确保评价的有效、准确、客观。政府要提高评价质量,确保评价政策的准确性就要颁布一定的具有法律效力的教育评价制度,避免评价的主观随意性,保证评价的权威性、连续性、时效性,增强评价系统的监控力,促使学校和教育行政部门做好自己的工作。在评价领域中存在着较多的、公认的评价信息,同时也存在着许多争论,这就需要一个有利的平台来增强各界人士的联系和交流,促进评价信息的沟通和研究,

以上是对国内外教育评价发展所作的简单回顾及其对我国现时教育评价价发展的可借鉴之处,从中可以看出强有力的评价系统可以有力促使教育的改革和实施。除了社会的需要促使教育改革外,大规模的教育实验研究、测量方法的实践、政府的重视、有利的法律保障等都可以促进教育评价的迅猛发展。同时教育评价在连续的发展中得到不断的完善,成为有力的监督系统,更好的促进教育的健康发展。

参考文献:

[1][4]李雁冰著.课程评价论[M] .上海:上海教育出版社,2002:47-52.

教育测量评价论文篇11

一、文献法

在评价活动中,评价者为了要获取第一手资料,常常会优先选择对已有的文献及档案等现有资料进行分析、判断。因此,文献法是评价者收集信息资料过程中最基础,也是使用最广泛的一种方法。

二、测验法

测验是心理和教育测量的基本手段,也是教育评价中最常用的一种收集信息的方法。著名教育评价学家斯塔费尔比姆说:“评价最重要的意图不是为了证明,而是为了改进”。每位教师都希望能够把学生培养成才。然而,学生个人的个性特点、学习习惯和智力发展程度都参差不齐,因此,教师通常用测验的方式获取评价信息,然后做出客观、公正、合理、恰当的评价,使不同的学生能够“长善救失”。

三、访谈法

访谈法在教育评价中也有着广泛的应用,无论是评价机构还是评价个体,评价者常常通过访谈的方式收集评价信息。访谈法是通过对被评价对象直接提问,从而了解真实情况的方法。访谈法获得的信息是被评价对象自己陈述的,一般可作定性分析。

四、观察法

观察法在对学校、教师,还是学生进行评价时,也得到了广泛的应用,是教育评价中常用的收集信息资料的方法之一。如,校外的评价者经常通过观察,了解学校的校园建设和师生的精神面

貌;通过听课评价教师课堂教学。在评价学生的素质发展时,观察能获得其他方法收集不到的重要信息。

五、问卷法

问卷法是教育评价过程中最常用的收集信息的方法之一,它的特点在于效率高,并且能够对所得的信息进行定量分析。例如,在教育评价中,评价者可以采用问卷的方式向教师了解对教育教学及对学校工作的看法,或了解学生对于教师的教学工作的反映等。

文献法是对现有的文献进行调查;测验法、问卷法是通过以问题的形式系统地收集信息;访谈法和观察法是评价者通过感官搜集资料。

各种收集信息的方法都各有所长,不同的方法能够收集到的信息也不尽相同。因此,评价者需要在收集信息时根据所要评价内容的特性,结合最适当的方法,收集到所需要的信息。在评价中评价者还应当同时使用多种方法,以获得更全面、更完整的信息,从而使评价能够真实地揭露被评价对象的本质特征,使评价结论具有坚实的依据,进而发挥评价的积极作用。

参考文献:

教育测量评价论文篇12

1 科技教育经济社会的计量评价理论

科技教育经济社会计量评价原理研究的由来与基础有以下几点。

1.1 计量评价的地位和重要性

社会经济领域的理论多种多样,而笔者在对科技教育经济社会的计量研究中发现,整个社会科学乃至自然科学讨论的客观对象,无非是揭示事物与事物之间的关系。这些被揭示的数量关系可以归结为三大类。

一是事物与事物之间的大小多少强弱相比较而得出的指标值的关系,是某阶段不同事物发展状态的指标比较关系。

二是事物自身随着时间的推移而形成的非因果性时序关系,即人们常说的历史规律的计量表述。

三是事物与事物之间在运动变化中的相关关系与因果关系是最复杂的关系,也是讨论得最多,在理论体系中占比重最大的科学。

所有的基础理论科学(不包括技术与方法性科学)所讨论的计量分析内容都没有超出这三者的范围,任何一个学科都是研究这三大关系中的某一部分内容。这三大关系都可以用数学方法表述出来。

计量评价要讨论的是第一种关系,即已经给出评价对象的数量多少、规模大小、水平高低、能力强弱、影响大少、发展速度快慢等等一些条件。它是研究客观世界的三大关系之一。

在这三大关系研究中,事物的计量评价关系研究是基础。因为事物的时序关系(历史规律)是事物状态(计量关系)的变化过程与变化规律,通过状态数据的变化体现出来,没有事物在各个时点上的状态数据,便无法定量讨论事物发展的过程与规律。事物的相关关系与因果关系的定量分析也要建立在统计评价数据的基础上,没有数据作基础的相关分析,因果分析就成了无源之水。需要说明的是因果关系与相关关系两者之间只是程度上的差别,因为相关关系也是部分程度的因果关系。

由此可见,我们要进行规律分析、相关分析、因果分析,必须先了解不同事物的各自状态,从各自状态在相互运动中发生的变化,来分析他们之间的连带关系。如果各个事物的状态数据都没有,便不能分析事物之间的因果关系与相关关系。因此,事物的状态计量与评价是关于事物的一切分析的基础,没有事物的状态计量就没有其他定量分析,可见其地位是多么重要。

1.2 计量评价的历史现状与需要解决的几个问题

正因为社会领域的计量评价如此重要,所以这方面的探索有着较长的历史、较多的成果、较大的规模。美国早在20世纪初就成立国会服务部(CRS),直接针对各委员会及议员们提出的各类问题进行研究分析与评价,而其中与科技有关的分析与评估即可认为是评估的雏形。经过近百年的发展,该项工作在美国已成为制度化、经常化的工作,并建立了科技教育经济社会评价支持系统。其它一些国家如法国、德国、加拿大、日本、丹麦开始于20世纪的40-60年代:瑞士、瑞典、英国、澳大利亚、韩国开始于20世纪80年代;西班牙、新西兰、泰国开始于20世纪90年代。其中基本效仿美国开展科技教育评价活动的国家有瑞典、德国、丹麦、荷兰、澳大利亚;部分借鉴美国科技教育经济社会评估的国家有瑞士、匈牙利、墨西哥、俄罗斯等。日本的科技教育经济社会评价开始于20世纪40年代的日本科技审议制度,到90年代已形成了完善的开放型研究评价体制,增加了科技教育经济社会评估的透明性、公开性,使科技教育经济社会的评价发展到了一个新的阶段。

现在世界各国对科技教育经济社会的计量评价都已形成了自己的方法与步骤。由定性分析转向以定性分析为基础,定量分析为手段,采用定性与定量相结合的方法,也有以定性分析为主的国家。美国、法国、日本等国家的评价采用定性与定量相结合的方法,英国、瑞士的评价以定性为主,瑞典基本上是定性分析。

科技教育经济社会评价已形成了一个庞大的组织机构体系。概括起来这些机构已有两种属性(政府性的和非政府性的)和三个层次(部级、地方或省级、科研院所高校级)。由于各国从事科技教育经济社会计量评价的历史背景不同等诸多原因,组织机构的设置和作用也有所差别,美国、法国、英国、澳大利亚、马来西亚等国家的评价组织机构的设置都相当健全,两种属性和三个层次的机构并存,所不同的是日本高层的评价机构较多,欧美则较少。

科技教育经济社会计量评价至今还存在不少问题,其中有些还是根本性的,非解决不可的问题。主要表现在缺少系统的科技教育经济社会计量评价的理论基础;评价的主观性、经验性太强,而科学性太差;评价的组织者不规范;评价的内容较紊乱;评价的数据源多种多样;评价的方式参差不齐等方面。

1.3 科技教育经济社会计量评价理论的构成

社会计量系统评价基础理论体系的构建是一个重要问题,方法研究较多,对基本原理的研究较少。因此,构建计量评价学的基础理论体系还不成熟;但与评价相关的统计学、数量经济学等学科则较成熟。笔者提出以下观点。

1.3.1 科技计量评价理论由总论与各论两部分构成

总论包括两大块理论,即各种评价都需要运用的最基本的四大评价指标(数量指标、质量指标、效益指标与综合指标)理论和评价过程中的四大关键环节。即指标选择、指数分类、指标建模、结果检验的数学规则与方法。

各论是把基本指标用于特定对象的评价。在总论中我们用四大指标基本覆盖了科技教育经济社会评价中的全部内容,在各论中,有多少评价对象,就有多少种评价。各论的计量评价方法体系要庞杂得多,但它们都离不开对四大基本指标的运用。现把各论分为两大块,①特定对象评价,包括:区域评价(一个省、一个市等的某一方面评价或几个方面的综合评价)、部门评价(如工业评价、农业评价、教育评价等)、单位评价(如对一个企业、一个学校、一个医院等单位的评价)、工作要素评价(如职工队伍评价、经济状态评价等)。②工作方面评价,包括工作水平评价、工作质量评价、创新程度评价等。

总之,各论中的各种评价都是运用总论的理论

与方法,结合实际进行的评价是应用性评价。

1.3.2 科技教育经济社会计量评价的四大基本指标的内在联系

科技教育经济社会的所有评价指标都可以按从简单到复杂的依次包含关系分为四个等级(或叫四类),每个等级(每类)又包含一些子指标。如图1所示。

科技教育经济社会的评价也好,测算也罢,所有指标都包含在以上四类指标之内,它们四者构成了层次分明、相互联系、指标繁多的体系,覆盖了评价领域的各个方面。

数量指标是直接从测算对象数出来的与量出来的单个指标。如一个地方的生产总值、国民收入、科技人员数、科技经费数、科技成果数等。

质量指标是由两个以上数量指标而体现的,在数量指标的基础上得出一定规模的地方与单位的活动效果水平的大小,质量指标包含了数量指标,如人均生产总值、人均收入、科技人员的人均受教育年数、人均科研经费等等。由效能指标、功能系数、标高分析等方法解得的数据也是由两个以上数量指标结合计算而来的。

效益指标是数量指标、质量指标与成本的关系的体现。效益指标既包含了数量指标与质量指标,又增添了成本指标,因而更复杂。

综合指标是近些年讨论最多的。但又是不明确的指标,现在看来它是由数量指标、质量指标、效益指标、能力指标等四者所构成,并经复杂计算而得的指标。

由以上可见,各指标的关系是从简单到复杂的关系,是依次构成和包含而不可替代的关系。

1.3.3 提出科技教育经济社会计量评价的四大环节的基本方法与处置原则

即评价指标选择的原理方法,评价指标分类的原理方法,评价指标组合建模的原理方法,评价指标结果的诊断方法原理。

2 科技教育经济社会四大基本指标测评的数学原理

笔者认为对科技教育经济社会系统四大基本指标的评价,总的指导思想是远离主观意识,贴近客观自然,在具体研究上找出科学的测度方法和计算方法,用科学方法代替经验方法。具体的创新性思考如下。

2.1 科技教育经济社会数量指标评价的科学原理

科技教育经济社会的数量指标是整个评价指标的基础,其他三种指标都是在此基础上繁衍出来的。数量指标本身多种多样,有直观的、有潜在的、有明确的、有模糊的。对于明确直观的数据,直接统计即可,如人口数、生产总值等;对于间接的、潜在的数据,可以通过特定的测度方式或特定的数学转换方式把它测定出来,如统计学上的定类尺度、定序尺度、定距尺度、定比尺度就很好地解决了一些问题。

对于模糊不清的数量指标,一直是不能不面对的难题。过去大多采用人为的划等级赋值的方法处理,现有不少人提出用模糊数学的方法解决。但评价实践中很少有人运用这种方法,原因是计算太复杂,不适用,要求实际测评者有深厚的数学功底。

笔者提出运用隶属函数和模糊判别的方法进行简化,得出步骤清晰明显的处理方法。

①隶属函数的模糊事物截距方法。首先要明确两种不确定性,即评价对象论域U到[0,1]上的映射是反映客观事物的复杂性,而概率论中从事件集合到[0,1]上是反映客观事物的随机性,但两者都具有不确定性。隶属函数的方法就是在复杂的不确定性事物的[0,1]范围中,找出其临界值,在之上为1,在之下为0,使不确定的模糊数字变成了精确的定量的概念。

②模糊识别与科技教育经济社会的数据测度方法。评价对象的某些数量特征模糊。有明显层级性,但无精确数据,如人的能力大小、水平高低等。要转化为精确数据,运用模糊识别的方法,通过建立模糊向量及其内积外积、笛卡儿乘积、贴近度等途径,采用最大隶属原则、择近原则等方法抽取事物的数量指标。

③理顺了不同的繁多的数量指标,并进行分类构建。首先分为总量指标、相对指标、平均指标、内在差别指标等四类,每类再细分,由此形成体系。

2.2 科技教育经济社会质量指标的评价原理

科技教育经济社会质量指标是测度其评价对象内部和不同评价对象之间的能力价值内涵的指标,它是由两个有联系的数量指标进行对比而产生的。另外,两个有联系的质量指标对比也产生新的质量指标。把物体的变量(数量指标)与体积(数量指标)对比得出比重(质量数据):把受不同教育程度的人(质量指标)与相应人口数(数量指标)对比得出人口文化程度构成的质量指标,质量指标的高低与总体范围与规模没有直接关系。对质量指标的测度有直接测评法,如衡量论文著作质量被引频率的测度、单位生产水平的无量细化测度。

因为现在评价质量指标最常用的方法还是数量指标乘权重。过去的权数多为主观赋给的,现在要运用相对客观的数学方法。目前常用的有质量指标权数的模糊评价法、质量指标权数的模糊关系方程计算法、质量指标权数的矩阵向量评价法。

通过直接测度法、无量纲化测度法、权数评价数学法等方法,基本上能给出有理论基础的、科学的、相对客观的评价方法。

2.3 科技教育经济社会效益指标的评价原理

在科技教育经济社会计量评价中,明确了效益指标的内涵。它与质量指标相比有共性也有差别,共性是两者都表征着评价对象所达到的水平与能力,不同的是质量指标只考虑评价对象所达到的整体水平与整体能力,而不考虑成本和投入,不考虑总成本与总收入的关系。近些年关于大学评价与排序,绝大多数评价者只考虑了各高校在本、专科教育上所达到的相关产出指标与拥有量,即各高校在论文、著作、科研立项、获奖等达到的指标,不考虑政府与社会对各高校在投入量上的差别,所以这只是一般的质量指标评价,而不是效益指标评价。效益指标是考虑投入的,要把投入与产出联系起来分析。

科技教育经济社会效益指标的计算方法,总的指导思想同样是尽量避免主观感性的定量分析,采用具备科学性的全面定量的评价方法。目前运用的方法有效益指标的直接比较计量方法、多因素简易计算法、量本利分析方法、拓扑分析方法、数据包络分析法,这些方法在文献中都有详细的讨论。通过这些方法对科技教育经济社会进行的评价既全面系统又较为彻底。特别是社会科技教育经济社会的拓扑分析方法是《科技教育经济社会计量评价原理》一书中首创的分析方法,它包括了从一因一果到多因一果,再到多因多果的分析方法,从线性变化关系到非线性变化关系的分析方法。从正常时期到非正常转化时期的投入产出分析方法。同时还都给出了详细的计算模型与检验方法。从这些模型特点出发,推论出了科技教育经济社会的关系和影响机制。

2.4 科技教育经济社会综合指标的评价原理

科技教育经济社会综合评价的指标叫综合指

标。综合评价是用得最多,而评价的主观性太强。为了在综合评价中把主观经验性评价转变为科学客观性评价,笔者首先把综合指标看成由数量指标、质量指标、效益指标、能力指标(也可把能力指标列入质量指标)四者所构成的综合体系。

①列出科技教育经济社会综合指标体系。该体系分为四大部分,即社会发展指标体系、教育发展指标体系、经济发展指标体系、科技发展指标体系。这是一级指标,还可从中划分出二级指标和三级指标。

②科技教育经济社会综合指标的功能系数评价法,即运用功能系数评价科技教育经济社会的综合指标的方法,这是一套相对系统的方法。

③科技教育经济社会综合指标的模糊聚类评价方法,包括明确二元模糊关系等概念。

④科技教育经济社会综合指标联合概率评价法,也是《科技教育经济社会的计量评价原理》一书中首次提出的方法,即把各分子都看成各自的概率指标(各指标都有不确定性),各子系统的概率指标之间的关系我们称其为联合概率关系,这些都可以用数据表达出来,也可以用概率的方法计算总体结果。

3 科技教育经济社会评价的四大环节的处置规则

在科技教育经济社会评价过程中,有四大基本环节,这都是评价中的根本性问题,包括评价指标的选择标准和分类问题、各评价指标之间在构成数学模型时的方法原则问题、评价结果的检验问题等。能否提出科学的数学方法对此予以解决,本文提出了一些新的思路与系统性方法。

3.1 科技教育经济社会计量评价指标选择的数学方法与原则

在科技教育经济社会的计量评价中,往往有许多的相关指标,有的直接,有的间接;有的作用程度大,有的作用程度小。在评价中收集采用的指标越多,所得结果越准确,但计算的工作量则越大。如何既把主要指标不遗漏地收集进来,又把作用稍次的指标放弃,这就需要对指标进行科学的选择。在该领域用得最多的是温伯格的科学评价指标选择准则。基本要点如下。

①要回答的问题:开展哪些研究是更合适的?该领域科学家的研究能力如何?

②外部准则:包括技术价值、科学价值、社会价值。根据其价值大小,确定临界值进行选择。

③内部准则:包括研究方向选择的正确与否:研究主体的研究能力如何?技术研究本身所达到的高度如何?

根据以上几个方面给出的指标,采用数学方法得出评价标准,进行判断选择。

3.2 科技教育经济社会评价指标分类的依据与方法

科技教育经济社会评价指标的分类,过去是凭主观经验进行,现在要用数学方法依据事物间的相似性作为类层划分准则对评价指标进行区分和分类。因此,属于无监督分类的范畴,在分类过程中人们必须先给出一个分类标准,分类分析能够从样本数据出发,自动进行分类。分类分析所使用的方法不同,常常会得到不同的结论;不同研究者对于同一组数据进行分类分析,所得分类数据也未必一致。

①层次分类及Q型聚类与R型聚类。层次分类是根据评价指标之间的亲疏程度,将最相似的对象归类在一起,以逐次归类的方式将评价指标分类。直到最后所有样本都聚合成类,分为Q型聚类与R型聚类两种形式。前者使具有共同特点的样本归在一起,以区分不同类的样本,后者是将具有共同特征的变量聚在一起,以便从不同类中分别选出具有代表性的变量作分析,从而减少分析变量的个数。

②指标的相似程度测量。有一个测度方法,即对一群有待分类的指标标志值用P个变量描述,则每个样本点可以看成是R空间中的一个点。因此在数学上可以用“距离”来测度标志值之间的相似程度,即最短距离法与最长距离法。

3.3 科技经济评价指标的综合建模方法与规则

科技教育经济社会的评价过程始终离不开建模,将复杂样本的模糊数据转化为精确数据,要建模测算。将不同数量指标转化为质量指标,将数量指标与质量指标转化为效益指标。将数量指标、质量指标、效益指标等概括为综合指标,每一步都离不开建模测算。建模是根据评价目标、各指标之间的关系来构建的。在数学上建模有以下基本规则。

①加法规则:根据评价的需要与数据的可能,采取直接相加或加权平均等方法测算的基本规则。

其中各项指标可以线性地互补,一项指标得分低,哪怕为0,其他指标得分高。其总评价值仍较高。

②乘法规则:有自己的建模测算方法,这种方法主要应用于要求各项指标都取得较好的水平才能使总的评价较高,只要有一个指标低,总分就低。如有一个指标为0,不管其他指标多高,总分便为0。

③其他规则:除上述两种常用规则外,还有比率法、乘除法、功能系数法、主次兼顾法、指标规划法、指标分层法等,各自都有自己的建模规则与适用范围。

教育测量评价论文篇13

许多小学教育教学的事实表明:教师通常仅用“学科成绩”的变化评判学生水平的变化;教师纯粹通过直觉或经验来评价学生学习;教师无法准确把握学生的学习情感和体验。新课程要求每个教师能够检查和评价教学目标、学习目标的完成情况;能够监控、评价、反馈和调整相关的教学活动;能够做出更科学、更客观的评价以促进自身和学生的积极发展。为能让师范专业的学生提前具备扎实的教育测量与评价能力,作为教师教育的培养机构,就要确保有训练学生这方面的操作与实际运用。我校在小学语文、数学教育专业开设了《教育测量与评价》课程。为体现课程的专业特点和实用性,避免课程开设的形式化,对课程的实践教学环节进行了设计,从2007年起,在语文教育06级、数学教育专业07级和08级学生中作了尝试,并对实施的意见进行了调查。

2.设计方案

课程的实践教学主要部分是校内实训和校外实践,在这过程中又注意关于统计软件使用的教学,培养学生的统计实践能力。

2.1 校内实训

校内实训内容的设计突破传统的以教师、教室、课堂为中心的教学方式,让学生联系自身实际,结合课程的学习,既调查、测量和评价了学生的学习方面,又直接对任课老师的教学态度、教学内容、教学方法、教学目标、教学评价等方面进行了评价。这种在真实的情境中建构知识体系,培养教育测量与评价的实际能力的方式,提高了学生参与的积极性,体现了以学生为主体的教学模式。

2.2 校外实践

结合学生的教育实践活动,组织学生以小组为单位,组内进行明确的分工和安排,以合作的方式,到所在的见习或实习小学开展调查研究,了解该学校教育测量和评价现状、问题和改革情况;调查及测量某班级或年级的教和学情况,找出问题和不足,提出自己的看法和意见;辅助学校教师的评价工作,参与设计试题、评价方式,对学生的学习活动进行诊断。通过课外实践,加强本课程理论联系实际的锻炼,学生掌握了教育测量和评价的技术,提早适应了今后教育岗位上教育教学的评价和改革。

实训或实践项目完成后,通过撰写分析报告或是以总结的形式进行考核。考核结合学生自评、小组互评、教师评价及专家评价,从实践态度、实践能力、完成效果等几个方面综合评定学生课程实践部分的成绩。

2.3 统计软件的应用实践

教育测量和统计中涉及大量的数据处理,让学生掌握一门具有数据和统计功能的软件也是本课程的教学目标。本课程选取SPSS专业统计软件处理测量所得数据,侧重于使用该软件中的统计检验和量表分析方法进行成绩的分析、评价量表的分析、调查结果的统计等。

3.课程意见调查

3.1 调查结果

在06、07和08级学生中发放352份调查问卷,其中有效答卷331份,统计结果有:

3.2 结果分析

由调查结果可以看出,72%的学生对本课程实践环节的设计持赞成的态度,在不赞成的学生中深入了解后发现,这部分同学之所以不赞成多是存在畏难情绪,担心课程考核不通过,并非否决实践环节对课程学习的作用。超过65%的学生肯定自己经过课程的实践训练,教育测量与评价能力得到了明显的提高。

4.结语

本课程的实践设计使得理论与实践紧密结合,让学生在真实情景中学习理论知识,锻炼实践能力,有利于他们今后在教育岗位上贯彻新课改理念,实施素质教育。将学生见习或实习的小学作为本课程教学的课外实践基地,既节约了费用,又收到了良好的教学效果。而让学生掌握SPSS软件的使用,不仅能提高教育测量与评价的效率和正确率,对学生今后的工作和科研也有很大的帮助。

在线咨询