教育测评概念实用13篇

首页 > 精选范文 > 教育测评概念

教育测评概念实用13篇

时间：2023-07-12 16:28:09

教育测评概念篇1

一、背景与意义

1.国内外现状之一

奥苏贝尔(David P. Ausubel)在其《教育心理学》扉页上这样写道，“假如要我把所有的教育心理学原理浓缩为一句话，那我会说：影响学习的最重要的、唯一的因素就是学生已经认识了什么，弄清楚它，然后进行教学”。在教学过程中，教师只有重视并有效捕捉了学生的前概念，才有可能帮助学生真正掌握知识。显然，捕捉学生的前概念，是实现有效教学的关键性环节。

前概念(Preconception)是存在于人们头脑中相对于新知识的已有认知。它可能是正确的，也可能是模糊或错误的。人们在学习任何概念性知识之前，都已经有了前概念。无论是哪一个年龄段，也无论是对哪一门学科知识的学习，都是这样。

国外对前概念的研究可追溯到20世纪初。1929年，皮亚杰（Jean Piaget）出版了《儿童关于世界的概念》，涉及前概念的早期研究。20世纪50～60年代，西方一些国家的学者采用调查问卷、访谈、作业分析等方法，捕捉学生已有的前概念。到20世纪80年代，对前概念的研究转向讨论学生形成前概念的成因。

国内对前概念的研究相对较晚且研究不多，主要集中在物理、化学等教学领域。国内学者一般都认同前概念是教学有效性的主要障碍，但在如何有效捕捉前概念的策略研究上几乎为空白。

综合国内外对前概念的研究，不难发现存在这样一些情况：从“前概念”研究涉及的范围看，国外较多涉及心理学、哲学、医学等领域，而国内则聚焦在物理、化学教学上，很少有人在其他学科进行探索。从“前概念”产生途径的研究看，比较有代表性的观点是将形成前概念的心理途径归结为：先入为主的日常生活经验，知识的负迁移，旧有概念的局限，由语词带来的曲解，进行不当的类比等。从“前概念”捕捉策略的研究看，国内只有本项目组的成员从2005年开始至今有过研究和实践，其结论是“用好互联网教育数据服务平台是一条可行之路”。

2.国内外现状之二

教育质量监测与评估，是监控有效教学的主要手段。它至少涉及这样几项基本要素：测评目的、测评样本、抽样过程、数据采集、数据分析。

我国20世纪90年代中期就已经开展义务教育质量监测，但这项研究存在一些问题：主要服务于上级决策，对一线教师提高教学质量的帮助明显不足；监测样本的数量偏少，形成的评估意见缺乏针对性；抽样过程不一定客观；数据采集较困难，无法常态化；相关因素纷繁复杂，仅靠人工手段无法进行较为深入系统的运算、分析和预警。

在国外，尤其西方国家，教育质量测评工作的主体通常不是教育行政部门自己，而是第三方水平测评机构。其主要特点有：为一线教学质量服务；也采取小样本，也很难形成有针对性的指导意见；抽样过程不可控；数据采集也无法常态化；人工手段无法进行深入分析。

综合上述国内外现状，可明显看出：常规情况下由于存在几乎无法克服的困难，人们在做教学质量测评时，无可奈何地采取了小样本；无可奈何地偶尔使用一下测评这一教学质量监控的主要手段；无可奈何地在采集到的海量数据面前望洋兴叹，白白浪费了99%的有用信息；无可奈何地形成自知针对性不强的教学评估指导意见。

3.发展趋势

在学科教学领域，课堂教学的有效性取决于教师备课的针对性，而备课的针对性又取决于教师真正了解学生的程度。因此，能否在重视并有效捕捉每一个学生的前概念、形成有价值的分析等关键环节上有所突破，将是未来各学科教学质量能否实现飞跃的关键所在。

在教育评价领域，近年来，无论是国内还是国外，都相当重视测评，但问题是怎样规避抽样中的人为因素？评估报告给谁看？期望报告阅读者看出什么来？因此，建立一个科学、公平、客观、有效的质量监控体系，将是未来教育评价工作的一项重要使命。

在教育技术领域，近年来，国内教育技术学和教育信息化工作似乎遭遇了瓶颈，鲜有突破。因此，能否突破当前教育信息化发展应用瓶颈，利用信息技术解放教育生产力，将是对教育技术学和教育信息化价值测评技术的重大考验。

在互联网应用领域，我国自1995年第一个网站诞生以来，从只是浏览网页，到今天实现网络汇款，从只有几十个用户，到今天拥有4.5亿网民，互联网发展迅猛。然而互联网对教育的应用价值还远远没有被发掘出来。因此，让强大的互联网为教学过程、教学评价、教学研究提供强有力的支撑，将是未来互联网发展的一个重要方向。

4.研究意义

“利用现代测评技术捕捉前概念和过程性数据促进有效教学”的研究意义，可以用下面这幅图来简要表示。

二、实践与方法

2008年浙江省教育厅教研室与浙江大学现代教育质量监测与服务研究所共同成立了“利用互联网技术实施教育质量监测”课题组。在前7年研究的基础上，课题组用了3年时间对浙江省11个地区272所小学、初中的20万学生和相关的教师、家长、教育行政领导使用网络平台，监测教育质量，提高有效教学的情况进行了实验。

1.教育质量监测从专业化走向普适化

利用互联网技术实施的教育质量监测可以对学生学业进行常态化、全方位检测，及时查找、反馈，从根本上解决学生怎样学习的问题。利用互联网技术实施的教育质量监测不仅可以进行专业化的施测，也可以帮助学校、教师随时进行自我检测，包括对学生的平时作业、综合素质、学习兴趣与动机、师生关系以及影响学生学业质量的学校、家庭、社会等相关因素的测评。它在技术上实现零门槛，实施教育健康体检，任何测评项目间的数据可以任意组合分析，实现教育质量监测科学化、平民化、普适化，成为一种辅助教育教学及学校管理的日常工具。

2.捕捉学生前概念，实现以学定教的重大突破

前概念指学习者在接受正式的教育之前，在现实生活中通过长期的经验积累与辨别式学习而获得的一些感性印象、一些缺乏概括性和科学性的经验，以及一些与科学知识相悖或不尽一致的观念和规则。传统的教学过程中，教师了解学生前概念的渠道有限、覆盖面窄。教师课堂提问环节由于时间限制往往只能顾及少数学生，学生反馈的信息可能因受到干扰而不真实。互联网技术为突破传统教学瓶颈带来了重大突破。

（1）了解学生的前概念。教师可以课前在互联网平台专有的“讨论”模块中第二天需要学习的讨论题目或前置性作业，每个学生都在没有受到任何干扰的情况下将潜藏在头脑中的“前概念”表达出来。如此一来，教师上课不再仅凭简单的主观猜测来断定学生的已有认识。学生的前概念是丰富多彩的，不同的学生有不同的前概念，教师只有充分了解学生头脑中真实的前概念，才能有针对性地设计教学活动，才能更好地为学生的学习提供指导和帮助。

（2）有针对性地设计不同的学习活动。教师将“讨论”模块中所有学生对某一问题的各种认识归类，理出几种认识模式，有针对性地设计不同的学习活动，最终实现个性化教学、分层教学。

（3）关注可测性或量化。利用网络平台，课前捕捉学生的前概念，就使教师的教学目标非常明确、具体，学生的学习结果实现自动分析，教师的教学效果和工作效益易于检验。在过程与结果中定量与定性的检测，更全面、客观、科学地显现出学生的学业成就与教师的工作表现。

（4）让教师具备一种反思的意识。利用网络平台，课前捕捉学生的前概念，就使得教师可以根据学生的回答，反思以往的教学是否恰当：是否给学生造成了错误、片面的前概念；是否有效地纠正了学生错误的前概念；自己以学生的前概念为教学起点，为实现教学目标或教学意图而采用的一系列具体的问题解决行为方式是否有效。

3.以学生为中心，关注学生全面发展

在新课程的背景下，将过程性评价纳入学生学业评价体系的观点得到了广泛的认同和重视，它有利于改变终结性评价占比过重，一考定终身的现状。过程性评价认为，凡是学习过程中产生的信息都应当得到评价，而不管这些信息是否在预定的目标范围或预期结果内。常规手段下，教师一般都是依据自己的经验对学生进行观察、记录，或者调动学生进行自评、他评和互评，但是由于教师的工作压力和工作负荷、学生作为评价者的专业能力不足和对评价的片面认识，传统的过程性评价在实际操作中比较混乱，收效并不理想。网络平台可以将过程性评价定位到每一个学生，并对每个学生每一天的学习、情感、态度进行跟踪记录，统计分析记录数据，并自动将分析结果推送给教师。教师能够准确及时地掌握每一个学生每一天的学习发展、心理成长等问题，从批改作业等大量简单的劳动中解放出来。教师根据分析结果，重点进行有针对性的差异化教学设计，提高了劳动价值。

网络平台可以实现把每个评价对象的过去与现在进行比较，或者把个体的有关侧面进行比较，实现个体内差异评价。基于互联网的过程性评价是一个过程，通过评价过程得到的不是一个等级或评语，而是大量经过价值判断，反映被评价对象工作或学习质量和水平的、定量和定性的数据和资料。评价的反馈和导向作用，使学生获得最大收益。

基于网络平台的过程性评价是一个综合性评价体系，它不仅有延续性的一面，也有阶段性的一面。从延续性的一面看，评价关注的是在发展过程中的情感态度和行为表现；从阶段性的一面来看，评价关注的是每一阶段的学习效果，包括智能的与情态的效果。

三、成果与创新

1.在学科教学方面

项目组基于多年设计经验，设计研制了有效捕捉每一个学生前概念的平台模块，教师可以打开平台直入个人首页。如，点击讨论模块布置讨论题。学生利用学校的网络教室和信息技术课程活动时间，互不干扰、完整地表达自己的前概念。

在两组对比性公开课上，对照组没有参与过本项目实践，实验组授课教师均来自项目学校。两堂课的结果可谓大相径庭：实验组教师由于在课前捕捉了每一个学生的前概念，知道了多少学生会，多少学生不会，会的程度如何，不会的有几种类型等，使课堂教学效果大大提高；而对照组教师在课堂的前20分钟几乎是浪费时间。这一现场对比令与会代表惊讶不已。

2.在教育评价方面

项目组基于多年的研究实践，大胆提出了“基于互联网的现代测评理念及其技术支撑体系”――基础教育质量监测与评估现代公共服务体系，设计并研制了承载着现代测评理念、方法、技术的基于互联网的教育数据服务平台。

（1）目标定位：服务并促进一线教学质量的提高，兼顾为宏观决策提供数据支持。

（2）样本来源：项目覆盖到的所有学校及其所属全体实名制的教师、学生、家长。

（3）数据采集。基础类信息：姓名、性别、出生年月、民族、籍贯等。过程类数据：前概念表达，平时作业，自助式体检(知识点检测、单元检测)，在线考试，综合实践活动记录，学习兴趣与动机、心情变化等。分析类数据：按出错频率分类的错题本、按教学内容分类的错题本、按地域分类的错题本、任意时间段的作业分析报告、学习跟踪曲线、电子成长记录等。

（4）分析内容：集中趋势、远离中心程度、分布形态等，难度、区分度、积差相关、效度、信度等，最高分、最低分、难度值、能力值、离均值等，方差分析、回归分析、主成分分析、因子分析等。

（5）监测预警。所有与用户强相关的信息或预警信息，会以设定的方式被数据库抓取并自动推送到相应用户的个人首页。

项目组在近3年的时间里为实验学校展开了以前概念、平时作业、心情、学习兴趣与动机、师生关系等为主要指标的过程性数据的跟踪，提供了学习质量分析报告、错题本、相关知识点错题补练、自助式学习“体检”等服务，基本形成了一个能适应区域、学校、教师、学生、家长的基于现代技术的基础教育质量监测与评估体系，实现了全样本跟踪、差异化教学、促进教学质量提高等现代测评的基本要求。

3.在学校发展方面

对教师来说，利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究，实现了课前了解所有学生在不受任何干扰及影响情况下头脑中真实的“前概念”，教师据此进行针对性、差异化教学，从而大大提高了课堂教学效果，提高了教学质量；实现了可根据教师自定义的跟踪提醒规则实行自动跟踪提醒服务；实现了随时关注班里每一个学生的学习动态及走势，分析相关性；实现了可关注到平时最容易疏忽的中间群体和临界群体，确保整体提高；实现了可利用该数据跟踪系统为教科研提供发展性数据，使教科研上一个新台阶；实现了用带有自动批改、补练功能的网上作业系统进行自动采集数据，减少了工作量。

对学生来说，利用现代测评技术捕捉前概念和过程性数据促进有效教学的研究，实现了对每个学生个体的关注；实现了将错题归入错题本并可标注经验教训，使学生复习上一个新台阶；实现了在时间控制下做作业，提高了做作业的效率，使作业习惯上一个新台阶；实现了在当天就发现漏洞并在当天补上漏洞，使学习的有效性上一个新台阶。

教育测评概念篇2

研究的进展不大，学科的成熟度不高，与我国广泛开展的教育评价活动很不适应．我国各省市都有考试院（中心），也成立了许多评估、评价机构，广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟．尤其值得重视的是教育评价与教育研究和发展，以及对教育评价实践的指导．鉴于此，本文对与教育评价相关概念进行简述和辨析．

一.关于教育评价相关概念简述

教育测验：即为考试，它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统，它由主考、

被考（考生）、试卷（试题的集合及其评分标准）、考分四要素组成。考试的过程就是主考组织编制试题，通过试题作用于被考，将正确答案、评分标准与被考的反应（答案）相比较，然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用，可分为常模参照性考试和标准参照性考试。按考试对象分，有学业的成就考试、学术能力倾向测验（其目的在于测量考生学习的潜在能力、发展倾向，如音乐能力倾向测量）、人格测验（如测量态度、兴趣、情绪、性格等）．按测验人数分，有个别测验、团体测量．接测验方式分，有纸笔测验（用笔时试卷作答）和非纸笔测验（如口试、实验操作、表演等）。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验（其成绩的使用有权威性，要求严格，标准化程度高）、教师自编测验（即教师自编用于课堂教学的测验）等．[1]

教育统计（学）：运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理，准确地掌握教育

情况，为制定教育方针、政策提供科学依据，为开展教育科学研究，探索教育规律，制定教育方案，检查教育效率提供科学方法，也为教育管理和教育评价提供有效的工具．它分为两大类：一是描述统计学，研究简缩数据和描述这些数据，二是推断统计学，用数据进行统计检验，统计分析和非参数统计法作出决策。前者只是分析某一样本的特点，而后者则是通过抽取母体的一个样本，并以此样本为根据来分析母体的特点．它是在教育问题的研究中，描述样本，分析样本，分析样本与总体的关系，从而进行教育科学推论的一种原理和方法．其研究方法一般有：大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量（学）：研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具，根据教育目标或教学计划的要求，研究如何测量和评价教育效果，如何编制测量计划，各种类型试题的优缺点，衡量一个学业成绩测验好坏的数量指标，如何进行测验结果的统计分析，测验分数的解释和评价等．其主要内容包括：测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估：是一种有系统地去寻找并搜集资料，对评估对象作预测性、估计性的评判，以便协助教育决策者从若干种可行的策略中择一而

行的过程．在我国教育评估与教育评价不作严格区别，在实践中具体运用时，不同的范围和场合有不同的习惯用法．如高等教育中多用评估，在督导部门也称督导评估，而在普通教育领域多用教育评价不过两个概念是有一定区别的．评估有估价的含义，较为模糊粗略，而评价相对而言是较为精确的价值判断，评估多用于群体或单位的状态及效果的估价，而评价则既有对群体和单位的价值判断，也有对个人的判断．教育评估的一个重要目的就是为教育决策提供重要依据，国家教育管理部门要根据教育评估的结果，及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料，而不是行动纲领．[4]

教育评价（学）：以教育为对象，研究各类教育目标与相应的教育现象之间的关系，并给予一定的价值判断的学科．它的研究范围可划分

为：宏观教育评价（研究教育思想评价和教育制度评价）和微观教育评价（研究学校教育系统内部各类教育思想和教育活动的评价，如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等）。它的基本范畴是：教育评价的对象，教育评价的范围，教育评价的模式，教育质的规定性评价，教育量的规定性的评价，教育质和量变化的度的评价，教育评价的指标体系，教育评价的类型．其研究的基本原则有：客观性原则、理论联系实际原则、发展性原则和联系性原则．其种类包括目标评价、过程评价、条件评价、贡献评价等．[5]

教育评价（学）：教育评论学是研究教育评论现象和教育评论活动规律的科学．或者说它是研究教育评论的历史、现状，教育评论现象的

本质联系，教育评论工作的性质、任务和作用，以及教育评论工作的原则、方法的科学．教育评论学是与教育理论、教育史并列的一门教育学科．要建立教育评论学的学科体系，必须解决两大难题，即建立教育评论学的范畴体系和概念体系，并给予科学的揭示和阐述，使这些概念和范畴形成一个有机整体．同时，还要运用这些概念、范畴及其所固有的内在联系，采取科学的方法论证教育评论活动中最普通、最一般的科学原理；从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务，从根本上规定了教育评论学的学科性质和范畴．首先，教育评论活动是一种教育科研活动，它的直接结果是鉴别、评判教育文化的优劣，进而对教育界产生社会舆论导向作用；而教育文化本身及其所产生的依附于受教育者身心的精神产品，都属于意识形态范畴，可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律，建立完整的教育评论学学科体系。所以，教育评论学也属于基础理论学科。再次，教育评论学的研究对象决定了教育评论学涉及整个教育领域，内涵十分丰富。也可从不同视角，针对不同范畴建立多部门、多层次的分支学科（如：教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等），所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系：教育测验是对人的知识、技能和能力以及其他某些心理特征的检测，是教育评价的一种手段，确切地说它是

教育评价获得评价信息的工具之一．教育评价获取信息的测验法就是来自于教育测验．

教育评价与教育统计的关系：教育统计是运用数理统计的原理和方法研究教育现象中的数量关系，通过数据的分析和处理确切地掌握教育

情况，也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系：教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定，为教育评价提供依据，是教育评价信息的主要来源．如果没有教育测量提供的资料，教育评价将成为无源之水，失去了作价值判断的依据，其科学性、准确性便无从谈起。另外，教育测量的结果只有通过教育评价才能获得实际意义，成为改进教育工作有参考价值的信息．[7]

教育评价与教育评估的关系：教育评价与教育评估是非常相近的两个概念，在许多场合是通用的。评价是精确的价值判断；而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著，以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面，对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系：教育评论是对教育文化的反思和展望，它的对象是以教育文化中的精神文化和制度文化为主的，以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差，但它与教育评价分属于教育科学的不同领域，有着重大区别。比如，教育评价是一种管理活动，而教育评论则为观念活动；教育评价由评价机构按严密的程序实施，而教育评论则由教育评论家个人采用灵活多样的方式方法评述；教育评价有明确的指标体系并要求量化，而教育评论无需指标体系更不用量化，教育评价的对象是具体的可控的，而教育评论的对象是抽象的，不可控的；教育评价的结果多用于改进工作，而教育评论的结果则多用于改变观念；等等。这不是说教育评价与教育评论一点关系都没有，它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论，而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为，价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的，它探讨客体“是怎样的“、”是什么“，探讨事物的现象、本质和规律等实体属性，即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象，它探讨客体的价值属性，即客体的社会意义------对社会需要意味着什么，它以多种意识形式-----认识（价值与事实判断）、情感（对价值的态度体验）、意志（对价值的自觉保证）等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出，教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析，而且要进行质的分析，

把所有考查绩效的材料和分析综合起来，在多大程度上达到了预期的目的作出价值判断。从这里可以看出，教青评价行为是建立在事实判断基础上的价值判断．教育评价中的事实判断在于诊断与鉴别教育的性状，价值判断则是对诊断鉴别而得的结果或结论，按其价值取向进行合乎目的的推断和判断；事实判断是价值判断的基础，价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向，对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程，我们不能说教育测验丝毫没有价值判断，如在测验什么不测验什么的问题上是有价值判断的；同样，我们也不能说教育评论就无点滴的事实判断，教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系，尽管概念、体系有待完善，但已为下一步的研究打下了坚实的基础。与此相应的考

试学（研究教育测验的学科）、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展，形成了一个共生的教育评价学科群。21世纪，要使这个学科群得到良好的发展，我认为首先对各个学科的研究范围有个明确的划分，尤其是对教育评价学要有合理的定位，不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围，要让它们以独立的学科更好地为教育评价学服务。另外，教育评价学还要把属于教育精神文化、制度文化类的抽象的，教育评价无力评价的范围还给教育评论学，让教育评论学更快地发展．同时，要把教育评估与教育评价的关系处理好，可将两者合二为一，形成统一的学科．其次，各学科要明确自己的研究对象，形成概念体系和学科体系，把一些已成熟的概念和理论约定俗成稳定下来，逐步形成相对稳定的学科知识和概念体系。第三，要处理好理论与实践的关系，加强理论研究，使其适应实践的要求，要积极总结实践经验并升华为新的理论，丰富和发展教育评价学学科体系．第四，要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论，还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践，进行修正使其“本土化”和“教育化”。

综上所述，搞清教育评价相关概念的关系，对理清教育评价学科群内各学科的关系，促进该学科群的发展，为丰富和发展教育科学，加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》（第二版）·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

教育测评概念篇3