统计学基本概念实用13篇

统计学基本概念

篇1

2.搜集资料。搜集资料是根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。医学统计资料的来源主要有以下三个方面:本文由收集整理一是统计报表 统计报表是医疗卫生机构根据国家规定的报告制度,定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。二是医疗卫生工作记录 如病历、医学检查记录、卫生监测记录等。三是专题调查或实验研究 它是根据研究目的选定的专题调查或实验研究,搜集资料有明确的目的与针对性。它是医学科研资料的主要来源。

3.整理资料 。整理资料的目的就是将搜集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。整理资料的过程如下:一是审核:认真检查核对,保证资料的准确性和完整性。二是分组:归纳分组,分组方法有两种:一是质量分组,即将观察单位按其类别或属性分组,如按性别、职业、阳性和阴性等分组。二是数量分组,即将观察单位按其数值的大小分组,如按年龄的大小、药物剂量的大小等分组。三是汇总:分组后的资料要按照设计的要求进行汇总,整理成统计表。原始资料较少时用手工汇总,当原始资料较多时,可使用计算机汇总。

4.分析资料。分析资料是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,作出科学合理的解释。 统计分析包括以下两大内容: 一是统计描述将计算出的统计指标与统计表、统计图相结合,全面描述资料的数量特征及分布规律。二是统计推断使用样本信息推断总体特征。通过样本统计量进行总体参数的估计和假设检验,以达到了解总体的数量特征及其分布规律,才是最终的研究目的。

二、临床研究中统计学的作用

临床研究中统计学的作用是什么?我们所做的就是区分事实和偶然性。我们需要比较组间差异,并检验干预的效应。

在对试验进行分析时,统计学的作用是什么?我们应当记住,统计方法仅仅是一种帮助我们解释试验中所获得的数据的工具。它们是一种工具而不是试验的最终结果。而且像任何工具一样,使用统计工具必须小心。计算机可以产生一些或有统计学意义的数据,但是只有研究者才知道该使用何种统计学检验来进行统计学分析。已参加培训的研究者可以很容易地选择统计学检验方法,必须记住的很重要的一点是,对于没有足够知识的人而言,有强大功能的统计软件包可能导致致命性的错误。

生物统计学的重要概念之一是其正确性。对于关键性的数据分析、试验的结果尤其是结果的发表,正确性都是其核心。有两种正确性:内部的和外部的(可推广性)。

内部的正确性就是在设定的试验范围内结果是准确的,使用的方法和分析经受得住检验,数据和相关的医学文献均支持研究者对试验结果的解释和结论。

外部正确性或可推广性决定了试验设计是否能够允许所做的观察和所得的结论推广到整个人群。试验人群的选择决定了最大可推广范围,这个概念我们在这个讲座的其它部分已经谈到过。如果研究对象包括男性、女性、不同的种族、不同的年龄分层,那么就有更多的机会将临床试验的结果应用于普通人群。另一方面,受试者的选择也将决定研究和结论可应用的人群范围。例如,如果在临床试验中选择年龄介于5~10岁的儿童,那么该试验的结果就仅能应用于该人群。如果选择45岁以上的男性作为受试者,那么试验结果就只能应用于这个人群。

现在我们将要讨论如何看待一些类型的数据。首先是相对危险度和比值比。这是评价后果的指标,当比较暴露因素对结果的影响时是非常有价值的。比值比主要用于病例对照研究。相对危险度主要用于队列研究。

让我们首先看一下相对危险度。数据显示是如何得到一个相对危险因素的。表格被分为两行两列,第一列是发病,第二列是未发病。我们看一下发病是否是暴露于危险因素的结果或者未暴露于该危险因素。暴露组发病数被标为a,暴露组未发病数被标为b,非暴露组的发病数被标为c,非暴露组未发病数被标为d。从这张表格中我们可以得到相对危险度,相对危险度是暴露组的发病率除以非暴露组的发病率,即(a/(a+b))/(c/(c+d))。这就是相对危险度。用来计算比值比的表格结构与上表相似,但是计算方法不同。仍具有这样的自变量,暴露于危险因素或未暴露于危险因素与发病或未发病比较。即a和b,与c和d。但是比值比与相对危险度不同,它是由(a×d),即病例组有暴露史×对照组无暴露史除以(b×c),即病例组无暴露史×对照组有暴露史。比值比即(a×d)/(b×c)。

篇2

1问题的提出

计算机基础教学旨在为非计算机专业学生提供计算机知识、能力与素质方面的教育,提高学生的计算机素质,为将来利用计算机解决本专业实际问题打下基础。在计算机基础课程系列中,作为第一门计算机课程,“大学计算机基础”发挥着重要作用,承担着普及计算机基础知识,提高学生计算机操作水平,为后续学习做好准备的重任。

操作系统是计算机系统核心组成部分。从理论学习的角度看,操作系统实现中所采用的思想与方法也被广泛应用在整个计算机科学与技术领域。了解操作系统的功能和基本工作原理,对于理解计算机系统的工作机理具有重要意义。从操作技能培养的角度看,应用软件与操作系统的关系十分密切,学习操作系统知识有益于对应用软件的理解和对操作技能的掌握。

与计算机专业“操作系统”课程相比,“大学计算机基础”操作系统部分的教学存在着特殊之处:

(1) 教学目标不同。“操作系统”课程是计算机专业的核心课程之一,目标是使学生掌握操作系统基本概念和结构,理解各子系统的工作原理及设计方法,培养其操作系统应用、维护、管理的能力,重在学习原理,掌握设计与开发技术。与之不同的是,“大学计算机基础”操作系统教学以基础知识教学为主、操作技能训练为辅,目标是使学生掌握一些系统软件基础知识,结合操作训练,加深其对计算机系统工作机理的认识,重在理解与应用。

(2) 教学对象不同。计算机专业“操作系统”课程安排较晚,原因在于前导课程的教学需要一定的周期,包括“计算机程序设计”、“数据结构与算法”、“计算机原理”等,经过前导课程学习的学生建立了支持理解操作系统知识的知识结构,较为熟悉计算机系统。而“大学计算机基础”课程开设在入学之初,大部分学生缺乏系统的学习,对计算机的认识很多是靠经验和直观感觉获取的,与科学概念之间存在着差距。

(3) 教学条件不同。从前导内容看,“操作系统”课程的前导课程较为完善,知识结构之间的衔接更为连贯;而“大学计算机基础”操作系统部分的前导内容仅涉及计算机基本组成、基本工作原理等,知识点之间联系较为松散。从课时上看,“操作系统”课程课时安排充分,而“大学计算机基础”能够分配给操作系统部分教学的课时相当有限,以我校为例,课堂学时仅4学时。从实验环节看,“操作系统”课程开设的多是验证性实验,与理论教学相呼应;而“大学计算机基础”操作系统实验以操作训练为主,重在对操作技能的培养。

这些区别表明“大学计算机基础”操作系统教学不可能采取“操作系统”课程的教学模式,要在短学时内取得较好的教学效果应设计更符合该课程特点的教学策略。虽然随着计算机技术的发展以及信息技术教育在中小学的普及,越来越多大学新生的计算机基础水平已经摆脱了“零起点”,但是,他们对一些基本概念的理解还仅限于直观认知的水平,大多并不系统和准确。大学计算机基础操作系统部分的教学重在理解与应用,其内容以基本概念为主,辅以基本操作训练,可以帮助学生建立基于科学概念的对计算机系统工作机理的正确认知。但是,根据认知理论,学生的学习是以其原有的经验、心理结构和信念为基础来建构知识的,学生缺乏对计算机系统准确的认知基础必然会给大学计算机基础课程教学带来不利的影响,增加其难度,因此,根据教学对象的认知特点设计教学策略就成为“大学计算机基础”课程教学研究的重要问题。

2基于迁移理论的教学策略设计

根据“大学计算机基础”课程教学对象的特点,我们可以将教学内容归纳为两类,一类是学生已经具有了一定的经验和直观认识,但认知不够准确或全面的知识点,另一类是学生完全缺乏相关经验和背景的新知识点。学习是一个连续的过程,任何学习都是在学生已有的知识经验和认知结构等的基础上进行的,而新的学习过程及其结果又会对学生原有的知识经验和认知结构等产生影响。因此,教学应尽可能的利用其原有知识、创设情境,促成新知识点与学生原有知识之间的关系。

迁移理论是教学策略设计中的常用理论,它体现了新旧学习之间的相互影响。迁移是“在一种情境中技能、知识和理解的获得或态度的形成对另一种情境中的技能、知识和理解的获得或态度的形成的影响”(James M. Sawrey)。迁移既可以是顺向的,也可以是逆向的。如果学生根据所学的科学概念解释了操作系统问题,或利用原有的其他领域知识获得了操作系统知识或解决了操作系统问题,这就是顺向迁移;如果学生原有的知识不严谨、不全面、不正确,不足以支持对操作系统的理解,需要通过教学,在肯定原有知识合理性的基础上,对其进行补充、改组或修正,这就是逆向迁移。

2.1基于前概念的教学策略

基于前概念的教学策略主要针对学生已经具有一定观念的知识点,教师应在肯定或者补充学生概念的基础上实现教师的引导。学生在科学领域学习某一概念和原理之前,根据日常经验或在学校教学情境中,对事物和现象的正确或不正确的看法和观念,称为前概念。前概念与错误概念不同,它可以与科学概念一致,只是缺乏严谨而科学的表述,对于这部分概念,教师只要稍做引导即可;它也可以与科学概念相冲突、甚至相悖,对于这部分概念,教师应该转变观念,试着去理解其合理性,进而对概念进行补充修正,实现知识的逆向迁移。根据我们的教学经验,大学新生的前概念相当普遍,如表1所示:

学生持有的前概念对于科学概念的学习既可能产生积极影响,也可能导致消极影响。利用与科学概念基本一致的前概念进行教学,教师只需对这些前概念做适当引导即可获得较好的教学效果,这并非研究的重点。与科学概念相冲突的前概念却可能给教学带来负面影响,学生的操作系统前概念大多是基于自身对计算机系统的观察和以及计算机操作经验而形成的,通过直观经验建立起的前概念通常具有相当的稳定性,拥有这些与科学概念相冲突的前概念,学生往往难以接受科学概念。

实现前概念向科学概念逆向迁移的首要条件是引发学生认知冲突,使得学生不满意自己的观点,认识到已形成概念的不足和不合理的地方,意识到新概念对于自己的价值,从而做好将新概念内化为自己知识体系内容的心理准备,提高教学的实效性。在“大学计算机基础”的操作系统教学中可以采取有针对性的设计实例或反例,或创设具体情境或背景的方法,使学生原有的操作系统观念无法解释新现象,转而接受更为合理的科学概念。

下面,以并发概念为例说明前概念向科学概念逆向迁移的方法。一般学生操作计算机时都会有同时运行多个应用程序的经验,如使用QQ聊天,同时使用MP3播放器听音乐,甚至还浏览网页、处理邮件等,但不会感觉到明显延迟。教学中可以基于这些直观认识引入并发概念。但是根据现实世界的经验,学生通常会认为在同一时间内有不同程序的多条指令在计算机中执行,如果排除高级体系结构、多CPU等因素,这显然与常用微机系统存在着不一致,此时如果提示学生注意只有一个CPU,即在同一时间内只可能有一个程序的一条指令能够获得执行,前概念认知就无法和实际系统相统一,从而引发学生的认知冲突。教师继续就该问题连续提问获取不同回答,则会进一步激化这种冲突,激起学生的求知欲,促使其积极思考。此时教师再适时提出正确的概念表述,科学概念就会很容易排除前概念的稳定性影响,得到学生的认可与接受。在原有观念被修正的同时,学生对并发概念的认知也进一步深入。过程如图1所示:

2.2基于相似情境的教学策略

一般而言,“大学计算机基础”中的操作系统内容比较浅显,以基本概念居多,大多可以通过日常经验或在教学情境中形成前概念,并以此为基础进行教学。但是,也有一些涉及计算机系统运行机理的基本原理、主要技术,受实验条件所限,很难获取直接经验,加上缺乏必要的前导知识,学生理解难度较大。学习是基于已有的知识经验和认知结构等进行的,因此,对于这些缺乏经验和背景的知识点,应采取不同的教学策略。我们可以从社会文化背景出发,创设学生熟悉的情境和背景,使其能够在已有生活经验的基础上建构知识体系。常用的方法之一就是根据日常生活经验设计相似情境,通过相似情境向新知识点的顺向迁移实现教学。一个好的相似情境不仅易于实现向新知识点的顺向迁移,使学生更容易理解和接受新知识点,而且能够提高学生的学习兴趣。

下面以进程三种状态的转换过程为例,说明基于相似情境的教学方法。该知识点属于操作系统基本原理,难以通过操作获取直观经验,我们选择排队就诊作为相似情境来阐释进程状态的变化过程,帮助学生理解。

进程状态转换与排队就诊之间的概念对应关系如表2所示(假设只有一个医生,一队病人)。

设计的排队就诊相似情境流程如图2(a),进程状态转换过程如图2(b)。

虽然设计的排队就诊流程与现实存在着一定差别,但是由于排队就诊是日常生活中的情境,因此,学生拥有足以理解该设计流程的经验背景。依图2可知,设计的流程与进程三种状态的转换过程具有很大的相似性,基于上述的概念映射关系,学生很容易实现从排队就诊流程向进程三种状态转换过程的顺向迁移,理解并接受新知识点。

3结束语

“大学计算机基础”是普通高等学校计算机基础教学的重要课程,操作系统在计算机系统中的重要地位决定了相关知识必然是该课程教学的重要内容。由于教学目标、教学对象和教学条件的差异,操作系统基础知识的教学历来是“大学计算机基础”课程的一个难点。本文根据这些特点以及教学实践经验,在知识分类的基础上,对“大学计算机基础”操作系统教学策略进行了一些探讨。实践表明,这些教学策略较好地解决了学生听操作系统内容枯燥、理解操作系统概念难的问题,不仅活跃了课堂气氛,而且更易于学生理解和接受操作系统基本概念、基本原理和方法,改善了教学效果。“大学计算机基础”课程还在不断发展完善中,随着社会的进步,该课教学目标、教学对象、教学条件等因素也在不断发展变化,相关的教学策略的研究也将继续。

篇3

教育部于2003年出台了《普通高中数学课程标准》,从课程理念、内容与框架角度出发,新标准相对于传统教学标准发生的变化较大。而相对于中学数学而言,大学数学的改革较为滞后,尤其是在中学与高校的改革过程均属独立,因此,大学数学与中学数学必然在教学内容等方面出现严重的脱轨或重复现象。在这种情况下,高校势必要做好大学数学与中学数学的衔接工作。

一、概率内容的衔接

(一)高中概率教学内容分析

高中新课标概率教学部分主要包括五部分构成:随机变量的数字特征、概率应用、集合概型与古典概型、随机事件与概率、条件概率与事件的独立性。针对于高中概率部分,新课标提出的教学任务有:实际教学中,学生要充分了解随机事件发生频率的稳定性和不确定性,并掌握概率的意义,同时能够区分概率及频率的本质。

(二)大学概率教学内容分析

大学概率教学部分主要包括以下几部分构成:随机变量及其分布、概率论基本概念、中心极限定理、随机变量的数字特征、多维随机变量及其分布、大数定律。针对于大学概率部分,提出的教学任务有:学生要对样本空间及随机试验进行深入的了解,并掌握随机事件的运算和概念,能够清晰地对概率和频率的公理化概念以及统计概念有所了解,认识到概率的基本性质。

二、统计内容的衔接

(一)高中统计教学内容分析

高中新课标统计教学部分主要包括四部分构成:变量的相关性、随机抽样、统计案例、用样本估计总体。针对高中统计部分,新课标提出的教学任务有:学生要具备从其他学科或实际生活中抽象出具有统计价值的相关问题能力,并能够对具体的实际问题情境进行有效结合,随即了解了抽样学习的重要意义以及必要意义。在统计问题的解决中,学生要掌握从总体中抽取样本的简单随机抽样方法。

(二)大学统计教学内容分析

大学统计教学部分主要包括六部分构成:参数估计、回归分析、样本、抽样分布、方差分析、假设检验。针对于大学统计部分,提出的教学任务有:大学生要掌握样本、总体、统计量与个体的概念,并对两重点估计的定义以及区间估计的定义进行深入理解。与此同时,大学生还要具备计算单个总体的方差的置信区间与均值,能够解出两个总体的方差比的置信区间与均值差。并对假设检验的基本思想进行深入了解,掌握单个正态总体的均值的假设检验。

三、大学概率统计教学与中学数学教学内容衔接的注意事项

(一)概率部分

通过上文的大学与中学概率教学任务来看,有许多重复的内容,部分中学概率教学任务要求相对较低,主要体现在概率概念中仅对概率的概念以及区别概率与频率提出了要求,不要求较为严密的概率的公理化定义。从数字特征角度出发,只对取值有限的离散型随机变量的方差与均值的计算与理解提出了要求。大学与高中概率内容讲解最大的区别体现在全概率公式、对偶率、贝叶斯公式以及差事件上。由此可见,在概率教学中的概率论基本概念部分,大学教学主要是对重复的内容进行复习。例如,中学古典概型问题讲解也很细致,题目的难度系数也能满足教学要求,那么大学概率教学在这部分就没必要花费过多的时间。针对几何概型问题,学生在高中阶段普遍掌握得较好,为此,大学教师仅需要列举几个相关的教学实例即可。另外,大学概率教学阶段涉及数学期望、有限个离散型随机变量的分布律可以简单讲授。但相对其上述两项内容而言,高中阶段方差的练习还是较少的,那么,大学任课教师就要正常讲解有关方差的内容。

(二)统计部分

中学统计教学任务倾向于实践应用,不要求统计理论的掌握,对大学统计部门的教学体系建立基本不产生影响。在这种情况下,高中介绍数理统计基本概念相对于大学而言,系统性和详细性较为逊色,因此,大学统计教学的执行应该基本以原大纲为导向。综上所述,针对大学概率统计教学,任课教师要采取最佳教学策略,避免出现教学内容重复的现象,并以学生的实际统计概率掌握情况出发,不断探索大学概率统计教学与中学数学教学内容相衔接的方法,精心设计教学流程,促进大学概率统计教学水平的提升。

参考文献:

篇4

数学概念是数学知识的细胞,也是思维的单元,是学生在学习数学中赖以思维的基础。只有树立了正确的概念,才能牢固地掌握基础知识,概念不清就谈不上进一步学习其他数学知识。数学教育改革的不断深入,对数学概念学习也提出了更高的要求,高中数学新课标的课程目标中指出:“获得必要的数学知识和基本技能,理解基本的数学概念、数学结论的本质,了解概念、结论等产生的背景、应用,体会其中所蕴涵的数学思想和方法,以及它们在后续学习中的作用。”从课程目标中可以看出,数学概念是高中数学的重要组成部分。因此,数学概念的学习与教学是最重要的课题之一。然而,传统的数学教学,注重数学概念内涵的教学,忽视概念的外延,忽视学生的认知结构,甚至灌输孤立的数学概念。于是,学生会在学习数学时出现种种问题,这与没有掌握好有关的数学

概念有很大的关系。本文在新课程理念的指导下,谈谈高中数学概念的教学设计。

2 教学设计

教学设计(Instructional Design,简称ID)也称教学系统设计(Instructional System Design),国内外学者有自己的观点,如加涅(R. M. Gagne,1987)认为:“教学系统设计是计划教学系统的系统化过程。”国内学者乌美娜先生认为:“教学设计是运用系统方法分析教学问题和确定教学目标、建立解决教学问题的策略方案、试行解决方案、评价试行结果和对方案进行修改的过程,它以优化教学效果为目的,以学习理论、教学理论、和传播学为理论基础。”从上述对教学设计的定义可以看出,所谓教学设计,也就是为了达到教学目标,对“教什么”和“怎样教”进行的规划。教学设计的研究对象是对不同层次的教学系统的各个教学环节进行具体计划和决策的过程;教学设计是为解决教学实际问题而创设一个有效的教学系统;教学设计是基于一定的理论基础(如传播理论、学习理论、教学理论等)应用系统科学的方法对教学系统的各个要素、结构和功能进行整体研究,从而揭示教学要素之间必然的、规律性的联系,达到教学过程的优化控制,使教学效果最优化。教学设计与课堂教学是教学工作的两个很重要的环节,凡事“预则立,不预则废”,教学设计是课的“灵魂”,它很大程度上决定了教学过程和教学效果,事实上,教学设计的根本使命或许就是给学生提供一个良好的受教育的环境,为它们的发展设计一个“系统”的发展计划,使学生们能够在这样的环境中得到最合适的发展机会,能够最充分地用运自己的潜能发展自我。

数学教学设计是指基于一定的数学学习规律、数学教学规律、数学学科的特点等,应用系统科学的方法对数学课堂教学系统的各个要素、结构、功能进行整体研究,从而揭示教学要素之间必然的、规律性的联系,达到数学教学过程的优化控制,使数学教学处于有效教学的系统过程。数学课堂教学设计的确定既取决于具体的数学内容和培养目标,又依赖于具体学与教的理论的支持。

3 数学概念教学设计

3.1 数学概念的学习原理

数学概念是数学知识的基本单元。从理解的层面看,掌握数学概念不仅要简单地用语言将数学概念表述出来,而且要真正理解概念的内涵和外延,表现为能对数学对象进行识别和归类,用自己能够接受和可以储存的形式对概念的本质属性或特征进行理解。数学概念的获得有两种基本方式:概念形成与概念同化。

概念形成是学习者在对客观事物的反复感知和进行分析、类比、抽象的基础上概括出某一类事物本质属性而获得概念的方式。近年来关于概念形成的心理活动过程的研究表明,概念的形成有以下几个阶段:

①辨别不同的刺激模式,在教学环境下,这些刺激模式可以是学生自己感知过的经验或事实,也可以是教师提供的有代表性的事例。

②分化和类化各种刺激模式的属性,各种具体模式的属性不一定是共同属性,为了找出共同属性,就需要将从具体刺激模式中分化出来的属性进行比较。

③提出和验证假设,一般来说,事物的共同属性不一定是本质属性,因此,在数学概念的学习过程中,学生首先要提出各个刺激模式的本质属性的假设,然后在特定的情景中检验假设以确认出概念的本质属性。

④把新概念从以前学过的相关旧概念中分离出来,把新概念的本质属性推广到这个类目的一切例子,这个过程实际上是明确概念外延的过程,也是新概念与其他旧概念相区别的过程。

⑤用符合习惯的数学语言和符号表示新概念,即形式化。

概念的同化是指:在教学中,利用学生已有的知识经验,以定义的方式直接提出概念,并揭露其本质属性,由学生主动地与原有认知结构中的有关概念相联系和掌握概念的方式。以概念同化的方式学习数学概念的心理活动大致包括以下几个阶段:

①辨认。

②同化。建立新概念与原有概念实质性的联系,把新概念纳入已有的认知结构中,使新概念被赋予一定的意义。

③强化。通过辨认概念的肯定和否定例子,使新概念和原有概念精确化。

然而,我国传统数学概念教学大多采用“属+种差”的概念同化方式进行的。学者张奠宙先生认为,数学概念具有过程―对象的双重性,既是逻辑分析的对象,又是具有现实背景和丰富寓意的数学过程,因此必须返璞归真,揭示数学概念的形成过程,让学生从概念的现实原型、概念的抽象过程、数学思想的指导作用、形式表述和符号化的运用等多方面理解一个数学概念,使之符合学生主动建构的教育原理,仅从形式上做逻辑分析(属+种差)让学生理解概念是远远不够的。

杜宾斯基(美国)等人对学习数学概念的研究表明,数学概念的认知过程经历四个阶段:①Acton(活动)阶段,通过活动让学生亲身体验、感受直观背景和概念间的关系;②Process(过程)阶段,过程阶段是学生对活动进行思考,经历思维的内化、概括过程,学生在头脑中对活动进行描述和反思,抽象出概念所特有的性质;③Object(对象)阶段,对象阶段是通过前面的抽象,认识到了概念的本质,对其进行“压缩”并赋予形式化的定义及符号,使其达到精致化,成为一个思维中的具体对象,在以后的学习中以此为对象去进行新的活动;④Scheme(图式)阶段,“图式”的形成是要经过长期的学习活动进一步完善,起初的图式包括反映概念的特例、抽象过程、定义及符号,经过学习,建立起与其他概念、规则、图形等的联系,在头脑中形成综合的心理图式。这个被称为APOS的理论,不但清楚地指明了学生建构数学概念的层次,而且为数学教师如何进行数学概念的教学提供了一种具体的策略。

3.2 数学概念教学设计的模式

根据数学概念的学习原理,提出以下几种数学概念教学设计的模式。

(一) 概念形成模式:具体例子或形成概念域(系)――观察共性――抽象本质――形成定义――强化概念――概念应用。

* 操作程序:教师提供概念的正例――学生概括例子的共同、本质的属性――讨论、观察、思考――师生共同归纳实例的本质属性――给出定义――学生举正例、教师举反例――概念应用――形成概念域(系)。

* 案例(人教A版必修1函数概念教学设计)

1) 先给出两个实例,炮弹发射时间与高度的关系,归结为数集A={t|0≤t≤26}与B={h|0≤h≤845}的对应关系。臭氧层空洞的面积随时间变化情况,归结为数集A={t|1979≤t≤2001}与B={s|0≤s≤26}的对应关系。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

2) 引导学生观察思考例子的共性,回答表中恩格尔系数和时间(年)的关系。进而设置思考题:“分析、归纳三个例子,它们有什么共同点?”

3) 师生共同归纳上述几例的共性,得到:对于数集A中的每一个x,按照某种对应关系f,在数集B中都有惟一确定的y和它对应f:AB。

4) 给出函数的定义。

5) 强化概念,要求学生举例,如y=2x+1,y= ……教师可以举反例,如y=± ,下例是否为函数……

6) 概念应用与形成概念域(转入函数相关命题学习)。

(二)概念的同化模式:先行组织者――定义概念――强化概念――概念应用――形成概念域(系)。

* 程序:呈现先行组织者――给出定义――概念的辨认、剖析与同化――强化概念――概念应用。

* 案例(人教A版必修2直线与平面垂直概念教学设计)

1) 呈现学生已经习得的生活中的例子(呈现先行组织者),如旗杆与地面的位置关系、大桥的桥柱与水面的位置关系等等。

2) 给出直线与平面垂直的定义。

3) 辨认、剖析概念。区别“任意一条”与“无数条”的关系,把直线与平面平行与垂直作一比较,从而完善直线与平面位置关系的认知体系。

4) 强化概念。除定义外,如何判断一条直线与平面平行?进一步研究直线与平面垂直。

5) 直线与平面垂直概念的应用。

6) 形成概念系。

(三)问题引申模式:问题情境――问题解决――引入概念――强化概念――概念应用――形成概念域(系)。

* 程序:创设问题情境――引导学生解决问题――在解决问题中形成概念――强化概念――概念应用。

* 案例(人教A版必修1二分法概念教学设计)

1) 创设问题情境。如电话线路的维修问题,“幸运52”的猜商品价格的问题等等。

2) 引导学生思考解决上述问题的方案――采用逼近思想。如上述的电话线路的维修问题,可以从中间一根电话杆开始检测,若正常,则故障在后面;若不正常,则故障在前面,一直有这样的方法逼近故障点,最后把问题解决。

3) 引出函数的零点问题,给下定义。

4) 用二分法求函数的零点。如怎样求方程x +2x-1=0的近似解。并归纳二分法求函数零点的步骤。

5) 概念强化与应用。借助计算器或计算机,用二分法解决求方程近似解问题。

总之,数学概念教学是高中数学教学的重要组成部分,新课标下的数学概念教学地位尤为突出,这一点一定要引起我们的重视。令人欣喜的是,人教A版数学新教材数学的概念大都是按照概念形成、概念同化与问题引申的模式编写的,因此,我们一定要在数学概念学习原理的指导下,按照学生的认知规律进行数学概念教学设计。

参考文献:

[1]刘绍学.普通高中课程标准实验教科书必修1,3[M].北京:人民教育出版社,2006.

[2]喻平.数学教育心理学[M].南宁:广西教育出版社,2004.

[3]曹才翰,章建跃.数学教育心理学[M].北京:北京师范大学出版社,2002.

[4]孙杰远.现代数学教育[M].桂林:广西师范大学出版社,2004.

[5]张奠宙,宋乃庆.数学教育学概论[M].北京:高等教育出版社,2004.

[6]严士健等.普通高中数学课程标准解读[M].南京:江苏教育出版社,2004.

篇5

在教学过程中将“内存储器”比喻为“一幢楼房”;将“内存单元”比喻为“一套住房”;将“内存单元的地址”比喻为“门牌号码”;将“硬件”比喻为“人体”;将“软件”比喻为“人的思维”等。通过这些恰当的比喻加深了学生对概念的理解和记忆,收到“画龙点睛”的效果。

二、借助故事,辨析概念

职业学校对计算机概念的教学要求相比高校要求虽然降低了不少,但有些计算机概念在教学实践中还是很有难度的。设计好一个生动的故事,将各种相关概念串联起来比较分析,既能提高学生的学习兴趣和注意力,又能促进学生对概念的理解和明辨,从而掌握其内涵要旨。借助故事,讲述概念、串联概念既直观易懂,又省力有效。

三、层层分析,揭示联系

“概念”是人们对客观事物的一种抽象认识,是反映客观事物特有属性的思维形式。这就要求计算机教师在教学过程中想方设法剖析基本概念的组成内涵,分析其外延,有机地帮助学生弄清此概念与彼概念之间的内在联系。在讲解“计算机系统”这一概念时,从“硬件系统”和“软件系统”两方面来阐述,指出“硬件”是构成计算机的物质基础,如,主机、显示器、键盘、鼠标等。“软件”则是各种各样的程序、数据。根据软件的性质又可分为系统软件和应用软件。为了帮助学生理清这些概念之间的联系。我采用树状层次结构图的形式来表示:

计算机系统硬件主机CPU运算器控制器主存输入设备输出设备外存储器软件系统软件操作系统语言处理软件数据库管理系统服务程序应用软件应用软件包用户程序

由于层次分明、内容详尽,学生对“计算机系统”这一概念的理解也较为深刻。

四、通过操作,理解概念

计算机是一门知识与技能并重的课程。通过操作强化对概念的理解,正所谓“事必躬亲”方会“熟能生巧”。如,学生对“人机对话”这一概念,不易理解。在《BASIC语言》教学中通过“INPUT”语句设计以下上机步骤,使学生理解其实质。

1.用“INPUT”语句编写程序,要求一次键入3个变量。

2.加提示信息,一次给3个变量赋值。

3.删除提示信息,再运行程序。

4.键入的常数个数少于语句中变量的个数,计算机询问后再继续键入下面的常数。

5.键入的常数个数多于语句中变量的个数。

6.应键入常量时,按了回车键。

这样,学生通过这一连串的“人—机—人”对话操作,一般都能较好地理解“人机对话”这一概念的含义。学生上机除了应有“技能”方面的要求外,还应该重视对概念的理解。概念不理解不可能有正确的操作。

五、分析单位,弄清概念

计算机中的概念有时不像其他基础学科出现的概念那样内涵稳定。往往同一概念名称在不同的场合有着不同的含义。帮助学生弄清这些概念可从量的单位着手。

六、循序渐进,逐步掌握

学生对计算机概念的认识总是逐步深化的,对概念的理解、掌

握其过程是渐进的。本人在教学过程中通过不同阶段的反复引导加深了学生对概念的理解。

七、反复求证,上下贯通

由于计算机学科新出概念多,其含义往往不同于日常用语或基础学科同一词,要准确理解它们,要求教师不断学习、摸索、体会。

总之,计算机教师要有一种“衣带渐宽终不悔,为伊消得人憔悴”的刻苦钻研精神,一定可以水到渠成地达到“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”的教学境界。

参考文献:

[1]柳青.计算机组装与维护.高等学校教育出版社,2002.

[2]周丰治,Visual FoxPro 6.0:基础与应用.高等教育出版社,2001.

篇6

一、大类招生背景及《概率论与数理统计》课程教改的需求

目前很多原因迫使我国高校公共数学课程进行教学改革,其中我国高校相继开始实行了大类招生是非常重要的原因,这种从细分专业招生到大类招生的变化是迫使各高校必须进行公共课程教学改革的内在动力之一,其次大学课程面向实际、面向应用的定位也成为促进大学课程教学改革的深化实际动力,再次高中新课标也从下向上推动了大学数学公共课程的教学改革,当然这种改革是相互的[1]。《概率论与数理统计》是大学重要的三大数学课程之一,因此高校《概率论与数理统计》课程改革的深化也随之全面展开,不同的高校都进行了相关的探索[2,3],有的院校还建议对《概率论与数理统计》课程实行双语教学[3,4]。在大类招生的条件下,如何使《概率论与数理统计》课程的教学适应这种变化,激发同学们的学习兴趣,体现出宽口径、强基础、重应用的新要求,这是我们深入研究《概率论与数理统计》课程教学改革的主要动力。而在改革中,既要突出相近专业的共同需求,也要体现工科大类与经济管理大类专业的差异需求,又要进一步考虑该课程教学的改革必须满足大多数同学掌握《概率论与数理统计》知识的需求,还要考虑到部分优秀同学继续升学深造的需求。

二、基于教改需求《的概率论与数理统计》课程教改内容的基本分析

以上需求明确了《概率论与数理统计》进行教学内容改革的方向[5],要做到教学内容上的及时更新,更加注重教学内容与新应用的结合;注重知识的连贯性,比如在高中概率初步知识的基础上引入概率的各种定义,重点突出古典定义、几何定义;在清楚把握随机事件的基本原理基础上,指出引入随机变量的必要性,掌握一维随机变量与二维随机变量之间的联系与区别,使同学们理解二维(或多维随机变量)随机向量不是一维随机变量简单的罗列,更重要的在于研究随机变量间的关系;从简单概念入手先理解离散型随机变量的概念与公式,进一步引出相应的连续随机变量的概念与公式;随机变量的数字特征是大类招生背景下的《概率论与数理统计》课程的重点内容之一,无论工科大类还是经济大类都有各自的应用背景,可以通过这部分内容深挖案例教学,在基本的教学内容中激发学生的兴趣学习;大数定律和中心极限定理是连接概率论与数理统计的桥梁,是进行数理统计中参数估计等内容的基础,比如通过相应案例的教学使经济管理大类的学生学会借助大数定律和中心极限定理理解保险产品定价的科学性和合理性,工科大类的学生就要注重学会借助大数定律和中心极限定理理解如何通过计算编程进行定积分计算,通过模拟的精度理解频率和概率之间的关系;统计量的分布理论是进一步掌握基本的参数估计和假设检验的前提,统计量的三大统计分布――χ2分布、t分布、F分布中χ2分布尤其重要,χ2分布是理解t分布和F分布的基础,因此要通过不同的角度、不同的案例深入分析;参数估计和假设检验是做好实际工作的有力工具,让同学们理解借助抽样调查我们可以实施监控产品的质量、资金的运作、人员的管理等,实现工作效率的提高,案例教学和基本教学内容的相互渗透使同学们能够通过实际的案例理解更抽象的概念,从而对概率论和数理统计这个处理随机现象最有力的工具有更深入的理解和把握。大类招生下数学统计类专业除了注重以上基本内容外还要注意理论内容的研究,比如“概率”的概念除了在理解概率的统计定义、古典定义和几何定义的基础之上还要加深概率的公理化定义的理解,从数学的角度去把握理解每一个基本概念和原理,数学统计大类除了和工科大类、经济管理大类学习相同的内容外,还要研究方差分析和线性回归分析的基本内容、基本理论,让学生理解线性回归分析的适用基本条件,学会运用基本的统计软件或数学软件(比如spss或matlab)解决回归系数的求解、模型的解释效果等,从过去数学统计类教学中重概率论的理论教学、轻数理统计的教学,转变为既重视概率论的理论研究又注重数理统计的应用内容,同时引入相关的软件去分析模拟相关的结论,比如用计算机编程的方法模拟计算圆周率π的大小,通过计算精度的变化使学生理解概率的统计定义和几何定义的关系,进一步理解概率的基本概念。大类招生下还要满足优秀学生考研学习的需求,条件许可的情况下可开设提高班,从理论上和内容上进行扩展,为将来进一步搞好科学研究打下良好的基础,这部分教学既要突出理论知识的重要性,还要突出学习兴趣的广泛性,通过激发兴趣克服理论学习的困难。

三、《概率论与数理统计》课程教改需要的教学方法、教学手段满足的层次分析

教学方法上也要突出《概率论与数理统计》课程的创新特点,这种创新不仅体现在内容上,还要结合软件使教学内容更具有启发性,激发同学们的学习兴趣。同时,这种创新要满足双层次的发展需求,首先,在新条件下第一层次是满足不同大类的共同的基本需求,第二层次是满足不同大类方向上的不同需求,再次是更深层次上的进一步升学深造的需求。这就要求在教学内容上引进创新的案例教学,讲清楚第一层次上的基本概念、基本知识,注重第二层次上的不同大类间的需求,举出能结合专业应用的案例教学,第三层次是基本概念、基本原理的扩展教学,满足升学提高的需求。教学手段上,结合新的软件进行多媒体使《概率论与数理统计》教学更加生动,变抽象的想象为有趣的形象表达,比如结合软件作图解释事件的随机性,在小班教学中还可以适当引入讨论式教学,在教师的引导下通过对某一具体问题的讨论引导学生掌握基本知识和基本概念,体现不同层次上教学手段的不同。教学手段在课堂练习的处理上,可以分工科大类、经济管理大类、数学统计大类,设计出不同层次教学内容上的相关填空题、选择题及计算题,及时巩固所学内容,使学生做到活学活用、全面理解,激发学生对《概率论与数理统计》课程的兴趣学习。网络教学、幕客的引进也是同学们学习该课程的有力工具,从国外高校的教学来看,我们没有理由忽视网络教学的重要性,如何恰当地引进网络教学是值得教学改革关注的一个地方。网络教学不能仅仅满足于网上听课,教学实践中还应结合手机APP软件进行课程开发,实现分大类、分层次的教学辅助内容的网络化,使同学们实现随时随地学习《概率论与数理统计》课程的需求。我们对两类班级的教学效果进行了对米,一类是利用邮箱管理课堂练习的班级,一类则是没有实行该措施的班级,从对比结果来看,实行该措施的班级教学效果非常显著,同时,这种方法符合学生随时随地学习的特点,具有较高推广的价值。考试手段的改革也是整体教改的一个重要环节,重基础就要重视平时的教、学、练几个环节,不再仅仅依赖最后的期末考试去评定教学效果的好坏,实行分阶段、分层次的网络测验成绩与期末考试成绩相结合,使同学们在每一个教学环节中都能有较高的学习兴趣,实现对概率论与数理统计知识真正的理解。所有这些都表明,《概率论与数理统计》课程在原来教学研究的基础之上,必须进行更深层次的教学改革,以满足大类招生的教学需求。在满足不同层次的教学需求的同时,又满足了解决难点、突出重点的教学理念,适合宽口径、严基础的大类招生需求,教学内容的扩展上可以参看盛骤等编写的《概率论与数理统计》及刘喜波等编写的《概率论与数理统计》中的主要内容,进行进一步深入研究[6,7]。

四、结论

综上所述,在大类招生的背景下,《概率论与数理统计》课程教学改革的任务迫在眉睫,我们突出分析了《概率论与数理统计》课程教学内容分三个大类――工科大类、经济管理大类和数学统计大类教改的重点,分析表明《概率论与数理统计》课程中第一层次基本概念、基本方法教学是进一步学习的基础,是教与学的重点领域,过难的概念、定理要分解,让学生学会从不同角度、侧面去理解,设计好完备的教学内容,利用现代化及网络化的教学手段去实现;适合不同大类的案例教学是教学改革的亮点,结合不同的实际案例让学生理解概率论与数理统计的基本知识如何在实际中应用;三个不同层次强调了大类招生教学的需求及解决方法;最后分析了教学手段、网络教学及考试考核方法在实际教学中的进行改革的必要性。当然我们仅仅作出一些探讨式的研究,我们相信会对大类招生下《概率论与数理统计》教学改革有所帮助,抛砖引玉会引出更多更好的研究,进一步有利于《概率论与数理统计》的教学。

参考文献:

[1]武新乾,杨万才,杨森,许丽萍.高中新课标影响下的大学数学教改对策与实践探索[J].中国电力教育,2013,(25):116-117.

[2]王庚.《概率论与数理统计》课程的一种新教改模式[J].南京财经大学学报,2009,(02):102-105.

[3]张民悦,黎锁平,杨胜良.工科《概率论与数理统计》课程的教改研究[J].教育教学论坛,2013,(26):21-23.

[4]黄建华,李建平,冯良贵,易东云.大学数学公共基础课双语“1+1”教学模式研究与实践[J].湖南工业大学学报,2010,(01):86-89.

篇7

当今社会随着信息化时代的到来,数学与其他学科的相互交叉,使得人们越来越认识到数学的重要性。各学校相继加强数学教育,以便增强学生的数学思维能力。概率与统计在数学知识中占有十分重要的地位,它可以培养学生随机性数学思维,培养学生通过发现问题、解决问题的形式,达到对现实世界的空间形式和数量关系的本质的一般性的认识的思维过程[1]。用概率与统计的知识预测随机事件发生的可能性,在日常生活中、自然界中甚至在科技领域中都有着广泛应用,它也是我们解决一些日常生活中的实际问题所必不可少的知识。特别是在当今社会,我们处在一个大数据时代,所以概率与统计显得尤为重要。学习概率与统计的知识,无论是对参加社会实践活动还是今后继续深造都是十分必要的。

概率认知在概率学习中占有十分重要的地位,认知障碍是高中生概率学习的障碍之一。教师只有真正了解学生认识概率、认知概率的情况,才能更好、更有效地开展概率教学。学生只有真正了解自己学习概率统计的认知障碍才能更好地学习概率统计。所以本文通过对高中生在概率学习中认知情况的调查分析,探讨性别差异在高中生概率学习认知过程中主要有哪些差异。本研究对学生学习和教师教学都具有重要的实际价值。

2.数据来源与研究方法

(1)测试对象

参加调查的被试学生采用整体随机抽样方式产生,是从南宁市一所示范性高中和一所普通高中随机抽取四个班级的学生,其中高一高三均两个班,被试学生共有262名,其中男生132人,女生130人。对被试学生实施测试,回收问卷和测试卷后逐份检查,凡有漏选题项及所选题项答案为同一性者一律视为无效剔除,其中测试卷有效问卷256份,问卷有效率97.7%,调查问卷有效问卷247份,问卷有效率94.2%。

(2)研究方法

为了确保选取的试题具有科学性、实用性和有效性,在深入研究高中数学概率统计内容[2]的基础上,采用测试题和调查问卷。所选的题目类型涉及频率的定义、古典概型、互斥事件、对立事件、中位数、平均数、频率、数学期望、分层抽样、系统抽样共10道题。

(3)测试过程

测试时间为40分钟,学生统一匿名答卷。在施测过程中有任课老师的积极配合与帮助。

3.问卷结果及其分析

为了了解性别差异在高中生概率认知中的影响情况,从南宁一所示范性高中所有平行班中随机选取的两个班级学生和一所普通高中所有平行班中随机选取两个班级的学生共计四个班级的学生进行测试。发放测试卷262份,全部收回,其中有效试卷256份,包括男生128人,女生128人,问卷有效率97.7%。

在测试卷中,其中第1、2、6、7、8、9题是考查概念与公式的辨析与转换障碍、概率模型构建或转化障碍的测试,第3、5题是概率模型构建或转化障碍的测试,第4题是关于言语信息中对关键词、概念表征障碍和概率事件的描述或表示障碍的检验,第9题、第10题是思维的批判性与片面[3]。

第1-8题调查结果如下:

题1是一道关于古典概型与几何概型的题目。从表一中可以看出关于古典概型与几何概型这方面的知识,高中生大都掌握得比较牢固,大多能准确地区分出古典概型和几何概型,并且进行计算。从表一出还可以看出,关于古典概型与几何概型,男生的整体掌握情况略好于女生。

题2是一道关于互斥对立事件的概率表征障碍的题目。从表一中可以看出,关于这部分的知识高中生整体掌握情况较差,大多不能不能正确区分出对立与互斥的联系。其中男生整体掌握水平略差于女生。

题3是一道关于概率模型构建或转化障碍的测试。从表一中可以看出高中生关于概率模型建构的整体掌握情况较差,他们大多不能正确建构概率模型。从表中可以看出其中男生掌握的整体水平略高于女生。高中女生解题时,由于自身思维特征,不善于概括题目中的关键点和以往的学习经验,考虑问题不全面,只会生硬地套用公式、定理[4],因此更容易先入为主。

题4是一道关于考查概率统计中概念辨析的题目。从表一中可以看出,关于概率统计基础概念意义,高中生大多掌握得比较牢固,他们大多能准确地掌握到基础概念的意义。其中在基础概念意义的辨析方面女生要略好于男生。

题5是一道关于概率统计的图表题目。考查学生对概率统计的概念的理解掌握并能准确的在图形中识别出来。从表一中可以看出关于概率统计基础概念意义并识图高中生大多掌握得比较牢固,他们大多能准确掌握概念的意义并在图中识别。其中女生掌握的整体水平略高于男生。

题6是一道关于求样本容量的题目,考查学生对基础概率统计概念公式的辨析。从表一中可以看出高中生在对基础概率统计概念公式的辨析方面掌握得比较好,其中男生掌握的情况略好于女生。

题7、题8是关于分层抽样和系统抽样的题目,考查学生是否能准确区分分层抽样和系统抽样等概念的辨析。从表一中我们可以看出,高中生大多能准确算出分层抽样的题目,掌握情况比较好,其中女生掌握情况略好于男生。但是关于题8的系统抽样的题目,高中生的普遍掌握情况比较差,其中男生的掌握情况要略好于女生。通过翻阅大量试卷的分析,笔者发现是因为题8系统抽样的题目最后的答案计算完成之后不是整数,而正确答案是需要取整数,所以大多数学生不会取关于系统抽样的最终结果的整数,这反映出一部分学生掌握的基础知识不够牢固。

题9是一道关于中位数与平均数的题目,调查结果如表二。在第一问中,求给出的16个数据的中位数与平均数,从表二中可以发现高中生整体掌握水平较一般,其中女生掌握的整体情况普遍比男生好。经过对比试卷发现,这些学生大多给出了正确的公式步骤,但是最后的结果往往算错。笔者认为这些学生大部分是因为计算能力不扎实而导致算错,或者是粗心等原因,而女生比男生细心,所以会呈现女生整体水平高于男生的结果。在第二问中,问这两种数字特征哪一种描述这个数据更合适并给出理由,从表二中可以发现,选择平均数的学生较中位数更多,其中选择中位数的学生大多给出的原因是每个数字相差太大,平均数不能正确地表达这组数据。而选择平均数的同学认为只有平均是比较公平,才能准确地表达这组数据。从表二中可以看出,男生与女生在选择哪种数字特征中没有差异,都是63.28%。

题10是一道关于求给出4组数据求概率与分布列和数学期望的应用题类型的题目,调查结果如表三。从表三中可以看出,高中生在关于应用题目的概率统计的题目掌握得比较差,通常他们不会解答。大部分学生不明白数学期望的意义,教师在授课应该让学生清楚数学期望,方差等都是数。它们没有随机性(分布也是如此)。它们是用来刻画随机现象的。这和样本的数字特征、样本均值、样本方差等完全不同,样本数字特征是随机的,它们是用来估计随机变量的数字特征的[5]。从表三中还可以发现男生关于应用题中的概率统计的题目的解答情况比女生好。

4.案例结果的进一步讨论

为了进一步了解性别差异在高中生概率统计认识的影响,对262名学生分发了调查问卷,发放调查问卷262份,全部收回,调查问卷有效问卷247,包括男生130人,女生117人,问卷有效率94.2%。调查结果如下:

在被调查的262名高中生中,有14.17%的学生表示对概率统计非常感兴趣,其中男生有8.09%,女生有6.07%,可以看出男生对概率统计感兴趣的人数稍多于女生。有50.20%的学生表示他们能够完全理解概率统计中的一些关键名词,其中男生有51.53%,女生有48.71%,可以看出男生对概率统计名词的理解稍强于女生。有10.93%的学生表示他们完全可以灵活掌握应用概率统计中的相关公式和概念,其中男生有12.30%,女生有9.40%。有6.47%的学生表示知道概率统计的相关题目所包含的数学思想,其中男生有10.00%,女生有2.56%。

5.结论与讨论

经过上述的调查分析,不难发现高中生受性别差异影响,对概率学习的认知不存在显著差异,只是在一些方面存在差异,而且男女生各有优劣。可以发现高中生受性别差异影响,对概率学习的认知存在以下差异:

(1)男生掌握的相关公式概念优于女生,而女生的公式辨析能力优于男生。

(2)男生对概率统计题目中包含的数学思想的掌握情况优于女生。

(3)在概率统计相关的计算能力方面,女生优于男生。

(4)在概率模型的转换能力方面,女生优于男生。

概率统计现在已经成为高中课程中重要的一部分,特别在新课标中又有加强,首先加强了体会数据的随机性,其次是增加了一些教学案例[6]。在具体的教学实施中,要解决上述存在的问题:(1)教师要改变教育观念和教育方式,要用现代的教育观念树立与新课程标准相符合的教育观念教育学生。因为概率统计中包含了大量的生活实践内容,所以教师需要从知识的传授者转变为参与者、引导者与合作者。(2)教学中教师要善于结合教学内容巧妙地设计教学环境,使学生能够更容易地接受概率统计中的思想。教师可以挖掘数学史,渗透数学文化,还可以应用数学软件促进课程实施。(3)在教学中教师要力求讲清概念,使学生能够把握概念的本质,懂得相近概念的联系和区别,在讲授概率公式及其应用时,力求讲清每个公式成立的前提条件,以便使学生能准确无误而又合理地使用这些公式进行各种运算。(4)针对一些概率图表题目,教师可以应用现代教育技术手段,如采用多媒体进行讲解。(5)教师要注重培养学生养成善于思考、善于动手的能力。思考每一道题目中所包含的思想,动手练习每一道计算题目,做到速度与准确率都达标。对男生来讲,要多进行动手能力的培养,努力做到速度与准确率都达标,还要注重基本概念、基本名词、基本公式的辨析;对于女生来讲,要注重课本知识牢记公式概念,并且要多关注实际,做到理论联系实际。最后男生与女生都要养成课后总结反思的习惯,多对学习过的内容进行总结概括,逐渐加强对知识点的理解,才能更好地学习概率统计。

参考文献

[1]张德然,茹诗松.高中概率统计教学中关于随机性数学思维的培养[J].课程・教材・教法,2003,9;39-42.

[2]普通高中课程标准实验教科书数学3(必修).北京:人民教育出版社,2006.

[3]王连国.高中生概率学习认知障碍分析及对策研究[D].济南:山东师范大学,2011:4-10.

[4]何小亚.数学学与教的心理学[M].广东:华南理工大学出版社,2003:204-207.

篇8

Abstract: The similarity calculation based on natural language understanding is still a research content of the computer language processing technology. Based on the knowledge representation of "HowNet", considering the both factors of depth and density, by using a more sophisticated multivariate semantic similarity algorithm, and with a full-text search matching technology, an online answer system in the limited field is designed and implemented. The experimental results show that, the system is reliable, the answer effect is more obvious, and the desired goal is achieved.

Key words: natural language understanding; semantic similarity; full text retrival; on-line answer system

0 引言

随着计算机网络技术的飞速发展,传统的教学手段已不能满足当前大信息量的教学内容需求,因此,创造一个在教师指导和引导下学生自主式学习的智能系统平台很有必要。智能的网络答疑系统可以利用自然语言处理技术对学生的疑问进行自动匹配处理,它的出现为网络教学提供了交互的情境,成为支持网络教学顺利进行的重要条件。智能网络答疑系统是传统课堂教学的重要补充,并逐渐在学生学习、认知、再学习这样一个闭环的学习过程中发挥着举足轻重的作用[1]。

1 设计思想及算法原理

基于计算机自然语言处理技术,充分利用校园网络资源,通过人机互动等丰富信息表现形式,实现一个智能的、高效的基于自然语言理解的专业课程自动答疑系统。系统设计的关键是如何实现快速、高效的智能搜索答案。该过程实际上类似于一个搜索引擎,其核心就是构建一个结构合理、具有完整丰富内容的知识库,并能够在自然语言理解的基础上,快速、准确的完成自动答疑工作。基于自然语言理解的在线答疑系统中两个关键技术分别是:中文分词技术和相似度计算。

1.1 中文分词技术

自然语言理解(Natural Language Understanding,简称NLU)研究如何让计算机理解和运用人类的自然语言,使得计算机懂得自然语言的含义,并对人给计算机提出的问题,通过人机对话(man-machine dialogue)的方式,用自然语言进行回答。为了使计算机系统能够较好地理解用户提出的问题,首先需要对问题进行处理,这一过程最先用到的最为关键的技术就是分词技术【2,3】。由于中英文之间的语言组织、词法结构不同,使得中文分词一直以来成为制约中文自然语言处理的主要因素。而中文文本中,只是字、句和段之间可以通过明显的分界符来简单划界,词与词之间没有天然的分隔符,中文词汇大多是由两个或两个以上的汉字组成,并且语句是连续书写的。这就要求在对中文文本进行自动分析之前,先将整句切割成小的词汇单元,即中文分词(或中文切词),相比英文语句处理,中文分词难度更大。

从算法处理上看,目前主要有三种【4-6】:一是基于词典的分词方法,它使用机器词典作为分词依据,分词效率高,目前应用范围较广;二是基于统计的分词方法,它是利用统计方法,通过对大规模文本的统计,让计算机自动判断的方法,该方法使系统资源开销较大;三是基于人工智能的分词方法,如专家系统和神经网络分词方法等,这类方法目前尚处于实验室阶段,尚未投入实际应用。

1.2 相似度处理技术

相似度计算在自然语言处理、智能检索、文本聚类、文本分类、自动应答、词义排歧和机器翻译等领域都有广泛的应用[7]。其计算方法按照基于规则和统计分为两种情况:一是根据某种世界知识(如Ontology)来计算,主要是基于按照概念间结构层次关系组织的语义词典的方法,根据在这类语言学资源中概念之间的上下位关系和同位关系来计算词语的相似度[8];二是利用大规模的语料库进行统计,这种基于统计的方法主要将上下文信息的概率分布作为词汇语义相似度的参照依据[9]。

⑴ 常用语义词典

对于基于语义词典的相似度计算方法,由于存在计算简单、基础条件低、假设条件易于满足等优点,受到越来越多研究者的欢迎。常用语义词典主要有[10-12]:WordNet、FrameNet、MindNet、知网(HowNet)、同义词词林、中文概念词典(CCD),以及叙词表、领域概念网、概念图等概念网络结构。本文对于相似度的计算主要是基于知网(HowNet)结构。其概念结构如图1所示。

⑵ 相似度计算

与概念相似度密切相关的一个概念是语义距离(semantic distance)。在一棵树形图中,任何两个节点之间有且只有一条路径,在计算语义相似度的时候,这条路径的长度就可以作为这两个概念的语义距离的一种度量,通常认为它们是概念关系特征的不同表现形式,两者之间可以建立一种简单概念词相似度用来描述概念树中两个节点之间的语义接近程度,一般最常用的是刘群提出的以《知网》为基础的相似度计算方法[13]:

式⑴中,p1和p2表示两个概念节点,dis(p1,p2)是树状结构中两节点间的最短距离,α是一个调节参数,表示相似度为0.5时的路径长度。

文献[14,15]综合考虑深度与密度因素,提出了多因素义原相似度计算方法:

式⑵中,h为义原树深度,l为LCN层次,LCN为最小公共父节点。

文献[16]认为该方法存在两点不足:一是该式仅把相似度取为密度、深度因素的算术平均值,显然对于概念节点分布不均的情况不够合理;二是该式没有对密度、深度两者的影响程度进行分析,这样对他的使用范围受到了限制。基于此考虑,提出了改进的语义相似度计算方法:

式⑶中,l(p1,p2)为分别遍历概念网中节点p1,p2到达其最小公共父结点所历经的父结点(包括最小公共父结点)数的最大值。w(p1,p2)为p1,p2所在层概念数的最大值。算法关键部分引进了一个调节参数λ(p1,p2),并保证在该参数的作用下,当节点p1,p2所在层概念数较多,即w(p1,p2)增大时,密度因素对相似度的贡献值大;而当p1,p2离最小公共父结点较远,即l(p1,p2)增大时,深度因素对相似度的贡献值较大。同时算法约定,当p1,p2的父结点和最小公共父结点相同,且同层只有p1,p2两个节点时,调节参数为0.5。该方法即为本文在相似度计算方面采用的算法模型。

2 模型设计

下面我们参考文献[17],按照一般教师对于问题的处理方式,在上述概念语义相似度计算的基础上,从计算机建模层面上给出计算机自动答疑模型的建模过程。

Step1:计算条件

已知标准问题库A可以表示为关键词序列:A=(a1,a2,…,an);学生提问B可以表示为关键词序列:B=(b1,b2,…,bn)。

Step2:相似度计算

⑴ 知识点关键词信息提取

该问题的处理主要通过提取学生问题中每一个关键词,对照系统知识库,从底层开始遍历搜索,当找到对应的概念节点时,提取该节点的高度、密度等属性信息,并保存起来,搜索完成后即可参加相似度的计算。

⑵ 概念相似度求解

概念相似度的计算采用语义相似度技术,设标准问题库A可以表示为知识点的一个向量组A=(a1,a2,…,an),循环遍历每一个学生输入的问题关键词序列,通过概念语义相似度算法可得到任意两概念之间的相似度Sim(ai,bj),其中i=1,2,…,m,j=1,2,…,n。

Step3:匹配结果输出

前面已经完成了输入问题和标准问题库之间的循环相似度匹配计算,为了将需要的信息提取出来,模型还需要设置一个阀值δ。通过阀值δ这个关卡,将相似度结果大于δ的问题提取出来,并按照降序排列输出即可。论文答疑系统模型建模流程如图2所示。

3 系统实现与验证

系统设计环境为Visual Studio 2005,数据库服务器为SQL Server 2000。采用B/S网络模型进行构架设计,按照系统功能需求划分为用户表示层、应用逻辑层和数据访问层三个层面。系统测试界面如图3所示。

如图3所示,在答疑系统界面中输入问句:“计算机包含哪些硬件?”,系统自动分词后生成的关键词语汇单元为:“计算机;硬件”(其中“包含;哪些”等作为停用词已经被过滤掉了),然后系统自动在数据库中检索匹配,最终反馈了12条相关结果,图3为部分结果截图。这里说明一点,反馈结果的多少取决于阀值δ,测试中我们选取的阀值δ为0.8,一般我们取阀值δ在0.8左右即可。

为了进一步验证系统的查询能力,我们将刚才的问句调整为:“计算机包含?”,这时系统自动分词后生成的汇单元只有一个关键词“计算机”,最终匹配结果如图4所示。

这里读者或许会发现,系统反馈回来的结果与问题毫不相关。其实,这并不是系统出错,而是“知网”概念网络中“计算机”与“硬件、软件”两个概念关系比较密切,表现为在概念网络中的节点位置较为接近,匹配结果相似度值较高,因此才有了上述的结果。也就是说,也许在某些时候当查询某个概念时,相近的结果就会被检索出来(或者当不确定查找的问题时,只需输入相近的问题,也会查询到想要的答案),这就是基于自然语言理解的语义相似度计算模型优势所在。

4 结束语

由于汉语词汇表达的复杂性和词汇语义概念较强的主观性,以及具体应用领域的专业性等因素影响,目前基于自然语言理解的相似度计算仍是计算机语言处理技术需深入研究的内容。本文在“知网”知识表示的基础上,充分考虑“知网”深度和密度因素影响,基于全文检索匹配技术,设计并实现了一个限定领域内的在线答疑系统,大量的运行结果证明了该系统是可靠的,达到了系统设计的目的。但在准确性方面还存在不足,从第一个测试中可以看出,提问人员真正需要的是:“计算机的硬件组成”。其重点关注的是计算机、硬件,而答案给出了太多的“计算机特点,计算机发展”等其他一些与“计算机”有关的匹配答案,其原因是关键词权重的影响因素没有体现出来,离真正的自然语言理解还存在一定的距离,这是系统下一步有待改进的地方。

参考文献:

[1] 冯志伟.自然语言问答系统的发展与现状[J].外国语,2012.35(6):28-30

[2] 黄,符绍宏.自动分词技术及其在信息检索中的应用研究[J].现代图书情报技术,2001.3:26-29

[3] 沈斌.基于分词的中文文本相似度计算研究[D].天津财经大学,2006:12-17

[4] 张波.网络答疑系统的设计与实现[D].吉林大学,2006:30-31

[5] 张丽辉.计算机领域中文自动问答系统的研究[D].天津大学,2006:14-18

[6] 朱.中文自动分词系统的研究[D].华中师范大学,2004:12-13

[7] 周舫.汉语句子相似度计算方法及其应用的研究[D].河南大学,2005:24-25

[8] 于江生,俞士汶.中文概念词典的结构[J].中文信息学报,2002.16(4):13-21

[9] 胡俊峰,俞士汶.唐宋诗中词汇语义相似度的统计分析及应用[J].中文信息学报,2002.4:40-45

[10] Miller G A, Fellbaum C. Semantic network of English [M]//Levin B, pinker S. lexical & conceptual semantics. Amsterdam, Netherlands: E lsevier Science Publishers,1991.

[11] Baker C F. The Berkeley frameNet project [C]//Proceeding ofthe COLING -ACL.98.Montreal, Canada,1998:86-90

[12] 黄康,袁春风.基于领域概念网络的自动批改技术[J].计算机应用研究,2004.11:260-262

[13] 刘群,李素建.基于“知网”的词汇语义相似度计算[C].第三届汉语词汇语义学研讨会论文集,2002:59-76

[14] AGIRREE, RIGAU G. A Proposal for Word Sense Disambigua-tion Using Conceptual Distance[EB/OL],1995:112-118

篇9

关键词 :通用技术 跨学科概念 新课题

21 世纪,知识的增长一日千里。要想在这个世纪更好地生存,人们所需学习的知识和技能日益增多, 特别是科学和技术知识。人们学习的时间和精力是有限的, 为此,在当今国际课程领域提出新的变革,那就是跨学科概念(Crosscutting-Concepts)。跨学科知识整合有助于对事物整体属性的揭示和复杂性问题的创造性解决,已成为人类进行知识建构和知识生产的重要方式。在本文中跨学科概念是指一些可以在不同学科或相近学科与领域中都能应用的概念或概括性的理论等。

一、跨学科概念:国际科技课程改革的新主题

2009 年,一个目的为确定学生在科学教育中应该接触到的核心概念的国际研讨会在英国邓斯召开,研讨会中提出了科学教育中的大概念这一术语。科学教育中大概念的选择考虑以下一些情况:能普遍应用;能通过不同的内容来展开; 可以运用于新情况,使得大概念可以提供一些有力的工具,有效地应用于理解和解释改变着的世界。学过科技课程, 学生应该能理解一些物质科学、生命科学、空间科学、能源等以及它们在自然界中相互关系的大概念,也就是本文所使用的跨学科概念。美国国家研究理事会(NRC)于2011 年7 月正式颁布的新一代科学教育框架(A Framework for K-12 science Education:Practice,Crosscutting Concepts,and CoreIdeas)中写到“跨学科概念(Crosscutting1Concepts)是指那些能应用于所有科学与工程领域的通用概念,它们都具有解释的价值”。主要包括7 个,分别是:模式,原因和结果,尺度、比例和数量,系统和系统模型,能量和物质,结构和功能,稳定和变化。跨学科概念超越了科学中各分支学科间的界限,能培养学生以通用性的思维来思考科学和看待世界。

此外,国外日益流行的STEM 教育更是包括了科学、技术、工程和数学等学科,在STEM课程学习中显然也更需要跨学科概念的学习和使用,才能更好地理解和学习STEM 课程。跨学科概念已经成为了国际科学技术类课程改革的新主题。

二、通用技术课程的多学科属性

普通高中通用技术课程属于通识教育范畴,是以提高学生技术素养为主旨的课程,面向全体学生, 拓展每一位高中生技术学习的经历。通用技术课程坚持基础性、通用性、选择性与时代性的高度统一, 注重国际经验与我国国情相结合,体现未来走向,是具有中国特色、富于开拓创新的高中技术课程新架构。技术课程与自然科学和社会科学都有着密切的联系, 强调各种学科资源的融会贯通和整合运用, 注重在综合各个学科知识基础上的技术探究、技术设计和技术操作。

通用技术课程包括必修模块与选修模块,必修模块的基本内容是技术设计,技术设计是技术的基础内容和发展关键,是所有技术的通用性的基础内容,也是培养学生技术素养,让学生理解技术、使用技术解决问题的前提。选修模块有七部分,分别是:电子控制技术、建筑及其设计、简易机器人制作、现代农业技术、家政与生活技术、服装及其设计、汽车驾驶与保养。

从通用技术课程的内容可以看出,通用技术课程是通识类的教育课程,具有多学科的属性。现代社会科技的发展日新月异,新技术不断涌现,使得中小学技术教育的内容越来越丰富,技术发明、创造与使用中涉及的学科与相关学科的知识越来越广泛。

三、通用技术课程中的跨学科概念

跨学科概念能加强学科之间的联系,有助于学生形成对技术的整体、连贯的认识,形成适应社会发展的技术素养。通用技术课程具有高度综合性, 是对学科体系的超越,现行的通用技术课程中有如下几个跨学科概念较为重要,它们分别是:设计、结构、流程、系统和控制。

(一)设计

设计是对造物活动进行预先的计划,可以把任何造物活动的计划技术和计划过程理解为设计。设计是一个跨学科的概念,一般意义上的设计是指综合设计, 它涉及广阔的领域。技术世界中的设计,其核心是技术设计。在通用技术必修1 模块中,技术设计是核心内容。关于设计的主要内容有:技术与设计的关系、设计中的人机关系、设计的一般过程和一般原则等。通过技术与设计关系的教学,学生可以学习到设计这个概念的丰富含义,也可以了解到设计在技术发展中的重要作用。在设计中的人机关系课程中主要学习如何合理地处理人机关系以达到高效、健康、舒适、安全的目标,合理人机关系的实现需要综合考虑普通人群与特殊人群、静态的人与动态的人、人的生理需求和心理需求以及信息交互等方面的问题。产品设计的一般过程包括发现与明确问题、制定设计方案、制作模型或原型、测试评估及优化、产品使用和维护等阶段。

《普通高中技术课程标准(实验)》指出:“技术设计具有通用性强、适用面广、可迁移性大、实施条件灵活等特点。”设计的一般过程和设计的原则是设计这个跨学科概念学习的重中之重, 它不仅可以应用于技术上,还可以运用在一般的问题解决上。

(二)结构

结构是指不同类别或相同类别的不同层次按程度多少的顺序进行有机排列。从通用技术角度来讲,结构是指事物的各个组成部分之间的有序搭配和排列。世界上任何事物都存在着结构,结构多种多样且决定着事物存在的本质。结构不但在技术领域广泛使用,在文学、科学、工程、建筑等众多物质相关的学科中都是一个较为核心的概念。由此可见,结构是一个广泛使用的跨学科概念。

在通用技术课程必修2 模块中, 对结构这一跨学科概念进行了详细的讲解。首先从力学角度对结构进行了分析, 不同的结构其受力分析不同,不同的结构适应不同的力,分析结构的受力情况可以更好地根据设计需要设计出与之相适应的结构。从力学架构与形态方面考虑,结构通常有实体结构、框架结构和壳体结构等基本类型。从技术设计中来考虑结构, 主要是要学习如何设计结构使结构具有更好的稳定性和强度。总之,在进行结构设计时注意追求的是牢固、稳定、简约、和谐、美观。

把握物质或产品的结构, 使结构牢固、简约、美观等,是一种技术设计思想的体现。学习和掌握结构这个跨学科概念,有助于对其他具有一定抽象或者具体的结构的理解和把握,从而更好地把在通用技术学科中学习过的结构的知识迁移应用到别的学科、领域和生活中去。

(三)流程

流程是指事物进行中的次序或顺序的布置和安排。人的任何活动都是在一定的时间和空间内按照一定的顺序和规则发生的。生活学习和工作中处处都有流程, 科学、合理地安排流程可以指导我们正确地做事,提高工作和学习的效率。

在通用技术必修2 模块中主要从流程的含义、流程与生活工作和流程的设计优化等方面对流程进行了阐述。流程是一项活动或一系列连续有规律的事项或行为进行的程序。通过流程的学习,为日常生活中常见的活动和技术活动中工艺流程的安排提供了优化设计的可能。流程设计的改进通常以提高工作效率,或降低成本,或节约能源,或省力,或减少环境污染等为目的。流程的表达有多种方式,包括文字、表格、图示、模型等多种方式。流程的优化是一个需要不断探索的过程,根据不同的目标可以安排确定不同的流程。

流程的设计根据不同的目标需要考虑许多不同的因素,流程需要根据具体事务的内在性质和本质特点进行安排。很显然,流程是一个跨学科概念。

(四)系统

系统是由相互联系、相互作用、相互依赖和相互制约的若干要素或部分组成的具有特定功能的有机整体。系统论的基本思想方法,就是把所研究和处理的对象当作一个系统,分析系统的结构和功能,研究系统、要素、环境三者的相互关系和变动的规律性,并优化系统观点。世界上任何事物都可以看成是一个系统,系统是普遍存在的。

通用技术必修2 模块从系统的结构、系统的分析和系统的设计三个方面对技术中的系统进行了阐述。系统的基本特性是整体性、相关性、目的性、动态性和环境适应性。

整体性是观察和分析系统的基本思想和方法,掌握进行系统分析的步骤、原则和方法,学会对系统进行分析,并在分析的基础上对系统进行优化,提高系统的效益。系统分析要坚持整体性、科学性和综合性的原则,系统优化是指在给定的条件下,根据系统的优化目标,采取一定的手段和方法,使系统的目标值达到最大化(或最小化)。

系统是现代社会最重要的方法论之一,是一个跨学科概念,在各学科、技术、工程领域中均可以应用。在通用技术课程中教学“系统”这一跨学科概念,可以拓展学生的思维,帮助学生形成系统的思维和方法,有利于学生把这一方法论和思想迁移应用到生活、学习和工作中去。

(五)控制

事物的发展有多种可能性, 人们根据自己的目的, 通过一定的手段使事物沿着某一确定的方向发展,就形成了控制。控制的概念是很普遍的,工程技术中的调节、补偿、校正、操纵,社会过程中的领导、指挥、支配、管理、经营、教育、批评、制裁等,都是一定的控制行为。在生产和生活中的应用十分广范。

通用技术必修2 模块主要从控制的手段与应用、控制系统的工作过程与方式、闭环控制系统的干扰与反馈、控制系统的设计与实施四个方面对控制进行了阐述。过去人们对事物的控制主要采用人工控制的手段, 随着科学技术的发展,出现了自动控制。在现实生活和工作中,往往需要对各种事物进行控制,从而提高人们的生活质量。而任何一个控制都需要若干个环节来共同实现, 这些环节所涉及的装置就构成了控制系统, 控制系统主要有开环控制系统和闭环控制系统。

四、研究小结

通用技术课程中的跨学科概念具有广泛的迁移价值。设计、结构、流程、系统和控制是现代社会广泛使用的跨学科概念, 可以在各学科之间相互迁移使用, 也可以迁移到人们日常的生活、学习和工作中去。在通用技术课程中教学具有广泛迁移价值的跨学科概念为学生的迁移能力的形成和技术知识与思想的迁移应用,打下了坚实的知识基础。

目前,尤其是广大通用技术教师还没有意识到这些跨学科概念对学生终身发展的巨大价值和意义。因此,通用技术跨学科概念的教学需要进一步的探索和研究,从而最大限度地开发通用技术课程的价值,更好地服务于学生的终身发展。

参考文献:

[1]陈英和,张淳俊.基于跨学科概念图的跨学科知识整合模型[J].北京师范大学学报(社会科学版),2010(1)

[2]【英】温·哈伦.科学教育的原则和大概念[M].韦钰译.北京:科学普及出版社,2011

篇10

本体的本质是概念模型,通过概念模型对信息作完全的形式化描述。它描述某个领域甚至更广范围内的概念及概念之间的关系,使得这些概念和关系在共享的范围内具有大家认可的、明确的、唯一的定义,这样,人机之间以及机器之间就可以进行交流。领域本体用于描述特定专业领域,定义该领域的概念和概念之间的关系,描述该领域的基本原理、主要实体和主要活动,提供领域内部知识共享和知识重用的公共理解基础。

近年来,随着语义网运动的发展,作为基础性工作的一部分,实现自动或半自动构建本体逐渐成为一个研究热点,而用来实现本体元素自动获取的一系列方法和技术称为本体学习。

按照数据源的结构化程度,本体学习技术分为三大类:基于结构化数据的本体学习技术、基于半结构化数据的本体学习技术和基于非结构化数据的本体学习技术。数据库中的数据是典型的结构化数据,而XML、HTML、DTD等包含隐含结构的数据称为半结构化数据。非结构化数据是指没有固定结构的数据。文本数据是非结构化数据,大量存在于Web中,是用来构建本体的最重要的数据源。因为现有的研究方法在处理半结构化数据时,通常按照纯文本对待,所以一般将基于非结构化数据的本体学习和基于半结构化数据的本体学习统称为面向文本的本体学习。

本文将概念、概念间关系视为本体的构成要素,对比分析相关的面向文本的本体学习的一系列方法和技术,并结合实例阐明领域本体学习的步骤与方法,进而讨论当前领域本体学习技术存在的主要问题和进一步的研究方向,为构建领域本体理清思路。

1 面向文本的领域本体学习

根据本体的定义和结构,本体学习的任务可分为三部分:①概念的自动获取;②概念间关系的自动获取;③公理的自动获取。现有研究主要集中于概念和关系的获取,公理的获取研究较少,所以本文着重讨论前两者。

首先,自然语言处理技术(nature language process-ing,NLP)是面向文本的本体学习的基础,这是因为文本数据缺乏一定的结构,要使机器能够自动地理解文本并从中抽取出所需要的知识,则必须利用自然语言处理技术,如词性标注、词义消歧和短语切分等技术对其预处理;然后,在此基础上,利用基于统计、基于规则或机器学习等方法从中获取知识。

1.1概念获取方法

领域概念是领域知识在文本中的外在表现,是在特定领域内具有语义的词或短语的集合。领域概念的获取就是从领域文本集合中抽取最能够代表该领域概念的概念集合,这个过程包括从领域文本中抽取术语集合、词性规范以及领域概念的筛选和确定。

1.1.1基于词典的方法 专业词典和叙词表等经过领域专家多年的有序组织,涵盖了学科领域内的表达事物相关概念的大量词汇。同理,也可以利用停用词表识别无用的常用词。以此为依据,从文本中抽取领域概念或过滤无用词汇,准确高效、简单易行,国内外有很多成功的实践,但叙词表和词典的维护及更新比较缓慢,词汇覆盖面有限,所以经常作为一种基础性方法获取基本概念,需要进一步结合其它方法进行扩充。

1.1.2规则方法 基于规则的方法是指利用人工总结的语法规则、词法规则、语义规则等获取概念。例如,可以使用标注工具对文本进行词性标注,按照词语的形态特征从语料中提取术语。该方法实现比较简单,如果制定的规则完备、合理,则能达到一个比较高的准确率。但是,规则的编写需要具有语言知识和语言学背景的人员,人力资源昂贵,并且规则的制订往往要依赖于具体的语言、领域和文本格式,系统缺乏适应性,不易移植。

1.1.3统计方法 基于统计的方法是近年来常用的方法之一,它利用一些简单的统计量来衡量几个连续字符组成词的可能性。常见的简单统计量有词频、互信息、熵和C-value等。通过计算领域相关度和领域一致度等方法,对候选术语集进行过滤,获取真正的领域概念。基于统计的方法的缺点是容易产生数据稀疏现象,一般适合于输入数据不再改变的系统,即非增加的本体学习系统。

1.1.4机器学习的方法 机器学习的方法需要首先建立一个学习模型以模拟一个特定的任务,然后在已标注的训练集上应用学习算法,在得到一个推广性能最好的学习模型之后,即可从文本中抽取概念。

基于机器学习的方法是目前一种较为有效的概念获取方法,不再依赖于领域专家,只需要有一定专业知识的人对语料进行人工标注,而且能够将概念获取问题转换成丰富的机器学习算法所能解决的问题,但是机器学习的方法会产生噪音数据,影响结果可信度。

1.2概念关系获取方法

不同的组织和研究机构,给出了不同的语义关系类型。联机英语词汇检索系统WordNet将概念之间的语义关系分为同义关系、反义关系、相似关系、上下位关系、整体一部分关系、继承关系和因果关系;微软公司开发的概念知识库系统MindNet把语义关系标记为24种不同的语义类型,包括同义关系、部分关系、属性关系、方式关系、意图关系、目标关系等;知网HowNet共定义了16种语义关系,如上下位关系、同义关系、整体-部分关系、工具-事件关系。

杜小勇等在获取本体中概念之间关系时主要考虑两种类型的关系:分类关系(taxonomy)和非分类关系(non-taxonomy)。分类关系主要指概念之间具有典型的分类结构,将概念组织成树状层次结构,每一个树中的概念都与其它概念构成上下位关系,体现了概念间的包含关系;非分类关系又称为非层级关系,主要指概念之间不具有典型的分类结构,但是概念之间具有一定的联系,反映了概念间的某些语义关系,类型多种多样,非分类体系主要考虑相关概念对的提取。概念间关系的常用获取方法有:基于语法模式的方法、基于概念聚类的方法、基于关联规则的方法、基于词典的方法、机器学习方法、形式概念分析法,或者这些方法的混和。

1.2.1基于语法模式的方法 基于语法模式的方法是在分析处理大量相关文本的基础上,发现频繁出现的语言模式,通过将文本中的单词序列与模式依次进行匹配判断,进而识别语义关系。这类方法的主要缺点是需要事先获得关系模式,但随着领域的变化可能要重新对其进行设计;而且模式的表示形式如果过于“严格”或“宽松”,都将会影响语义关系获取的召回率或精度。

1.2.2基于概念聚类的方法 聚类的实质就是使属于同一类别的个体之间的距离尽可能地小,而不同类别的个体间的距离尽可能地大。大多数聚类方法都具有特征选择或特征抽取、聚类算法设计或选择、聚类确认和结果解释4个基本步骤。利用概念之间的语义距离,对概念进行聚类,同一类簇中的概念将具有语义近似的关系。同时,也可以进行层次聚类,聚类的结果就是概念间的分类关系。关于概念层次聚类的研究有很多,但多存在一个共同的局限性,即只能得到概念间严格的层次关系。

1.2.3关联规则挖掘的方法 数据挖掘中的关联规则方法是用于获取概念间的非分类关系的常用方法,基本思想是如果两个领域概念经常出现在同一个语法单元,即出现在同一句子、同一段落或同一文档中,则这两个概念之间必定存在着一定关系。而它们之间联系的紧密程度和它们所在的语法单元有关。这个语法单元的语义内在聚合度越紧,那么这两个概念之间的紧密程度越高。但是大部分方法都停留在判断两个概念之间是否存在关系的层次上,难以进一步确定拙取出的概念之间具体是什么关系。

1.2.4基于词典的方法 很多词汇词典中定义了同义词、近义词和反义词等知识。叙词表也可视为语义词典,叙词之间的关系利用等同关系、等级关系以及相关关系三种语义关系来描述,可用来获取本体中概念间的分类关系。

1.2.5机器学习方法 与概念获取一样,人们对概念关系获取问题建立了一个学习模型,力求能把语言知识和统计规律相互融合在一个模型框架中,通过对大量真实语料的学习来确定模型的参数,进而解决概念关系获取问题。

1.2.6形式概念分析法 形式概念分析(formal con-cept analysis,FCA)是应用数学的一个分支,它建立在概念和概念层次的数学化基础之上。目前FCA的方法已经大量运用在概念聚类、数据分析、信息检索、知识发现和本体工程的应用之中。其概念通过属性来描述,能够从给定数据中提取出隐含概念以及概念之间的关系,形成概念模型(概念格),并用符号形式化的方式来表现,因此,采用FCA的方法可以帮助构建本体。

FCA的优点在于覆盖度比较大,而缺点是准确度不高而且容易产生数据稀疏现象。当前FCA适用于构建轻量小规模领域本体,不能自动提取除偏序、层次、相似等关系之外的复杂的语义关系。

2 实例

2.1简单实例

此实例使用统计方法提取概念,利用基于关联规则与模式匹配相结合的方法,提取概念问的分类关系。基本框架如图1所示:

其框架可分解为如下步骤:

・收集领域文集和一般对比文集。

・文档预处理。应用NLP技术进行分词。

・抽取候选术语集。候选术语的提取采用基于统计的方法,计算术语的频率。通过设置术语在领域中的出现频率阈值过滤出现频率很低的词或短语。对于一些在各个领域中出现频率特别高但不能反映领域专有知识的常用词,可以通过停用词表把它们过滤掉。

・过滤候选术语集生成概念集。通过选取,虽然从候选术语集中除去了常用词和出现频率较低的词,但集合中还包括一定数量的与领域无关的词,它们常常出现在多个领域文集中但又不在停用词表中,这时必须对候选术语集进行过滤。采用领域相关度和领域一致度相组合的方法来对候选术语集进行过滤,以生成真正的领域术语。这种方法需要对比文集做支撑。

・通过关系提取算法抽取分类关系并建立分类层次体系。利用基于关联规则与模式匹配相结合的方法提取本体概念间关系,其基本思想主要是:首先利用关联规则中的算法,如Apriori算法,在领域文集中发现频繁项目集;然后,利用由频繁项目集产生的关联规则搜索领域文档集,找出含此关联规则的句子,发现其中的模式,并人工排除不是分类关系的模式;最后再用模式匹配的方法抽取出领域文档集中的分类关系并建立概念间的层次关系。

2.2复杂实例

主要研究如何从大量专业文本中自动获取领域概念及概念间三种基本关系的方法。

2.2.1概念的自动获取 利用机器学习的方法,采用分类思想获取领域概念,把领域概念获取问题看成是一个二值分类问题。处理流程包括三个步骤:

・预处理:预处理输入的是训练文本,输出是带标记的候选领域概念集。首先利用自动分词方法和最大词串匹配算法等自然语言处理技术得出候选领域概念集。然后,对候选概念集进行人工标注,若是专业术语标注为正例,否则为负例。

・训练:输入是带标记的候选领域概念集,输出是一个训练好的预测模型。在获得候选概念集后,需要将这些候选概念表示成计算机可以识别的格式,以便训练分类模型。

首先,选用频度特征、词特征、邻居词特征这三类特征,为每一个候选领域概念构造一个带有类别标记的特征向量,由此得到一组训练数据样本。然而这样的样本向量空间维数非常高,给计算带来巨大压力。可针对邻居词特征的特点,筛选出最有代表意义的邻居词特征,降低特征向量的维数。

其次,需要计算不同特征的权重,从而能够更加准确地描述特征项在领域概念中的重要性以及不同特征项对分类所起的不同作用。这里的难点在于非平衡数据处理问题,即在候选概念集中,真正领域概念的个数远远小于非领域概念的个数,也就是说,样本中正例数据与负例数据分布极度不均匀。在文本分类中,有单边统计量特征选择方法和双边统计量特征选择方法两种方法。在非平衡数据下,前者容易使分类器误将负例判断为正例;而后者会导致漏选一些有用的负特征。

最后,运用分类算法从标注的训练数据中,学习一个推广性能最好的分类模型。项目选取了目前在文本分类中获得较好结果的4种分类算法:决策树、朴素贝叶斯、支持向量机和感知器,训练得出4个分类器。

・分类:利用训练好的分类预测模型预测新文本中的候选领域概念,得到真实的专业术语。

2.2.2概念关系获取 概念之间存在着各种不同形式的关系,此示例主要研究如何从文本中自动获取两个概念间的三种最基本的语义关系,即:①同义关系;②上下位关系:也称为从属/上属关系,子集/超集关系,或IS-A关系;③整体-部分关系。

领域概念关系获取问题可转换成一个多类分类问题,要求一个多类分类器能够正确区分同义关系、上下位关系、整体-部分关系三类词对。通常多类分类问题的求解是将其分解成一系列两类分类问题的组合来求解。具体处理流程包括三个步骤:

・预处理:利用前文方法中获得的领域概念集,检索领域语料。查找同时含有两个或两个以上领域概念的句子。然后将句子中的领域概念两两组对,形成候选关系词对集。

・训练:输入是每一个候选词对和每一个候选词对所在的句子,输出是一个训练好的分类模型。

在获得候选领域概念关系词对集后也需要将这些特征词对表示成计算机可以识别的格式,以训练分类模型,得到分类器。通过对标注语料的分析,选用词序特征、词形特征和上下文特征这三类特征,采用相关标引方法,组成特征向量表示每一个候选词对。

在将候选概念关系表示成特征向量之后,使用分类算法,从标注的训练数据中,学习一个推广性能最好的分类模型(分类器)。项目结合朴素贝叶斯和感知器两种分类算法的优点,提出混合分类算法,用以训练领域概念关系分类模型,取得较好的效果。

・分类:将新文本中的所有可能关系词对分别对应于同义关系分类器、上下文关系分类器、整体一部分分类器。经过归一化处理后,选择分值最高所对应的类别作为该词对的最终类别。

3 当前存在的主要问题及进一步的研究方向

经过几代人的努力,与本体自动构建相关的人工智能、自然语言处理等计算机技术已经得到长足的改进和完善,但是,其发展速度明显落后于网上文本内容的增速。在语义网尚未普及、本体和相关元数据相对匮乏的现阶段,我们还是要在这条艰苦的研究道路上继续探索,不断提高本体学习的自动化程度,把语义网运动的蓝图演变为现实。

本文按照领域本体概念和概念间关系这两个构成本体的核心要素,分层次探讨现阶段面向文本的领域本体学习的常用方法以及各种方法的优劣性和适用范围。在验证实例中,详细阐明了自动构建领域本体的思路、步骤和具体方法,并对实验结果加以评价。应当指出的是,在实际应用中不必单一使用某一种方法,为了达到更好的本体学习效果,可以将多种方法相结合,或者在构建核心本体的基础上,再运用其它方法对本体进行增量。

3.1文本分类技术

文本数据是Web中大量存在的一类非结构化的数据,也是用来构建本体的最重要的数据源。根据文本的内容或属性,由计算机自动分类,提取领域概念和概念之间的关系,是形成数据语义的一种有效的辅助手段。虽然文本分类技术近年来得到快速发展,在文本特征表达、特征降维、分类器设计、语料库方面作了大量工作,但仍然面临着很多问题。目前常用的文本分类方法在分类过程中的特征选取、权重计算和分类算法等方面,都存在一些不足之处和局限性。例如当类别规模增大时,准确度会急速下降,以至于分类结果不可用,而且在处理复杂类别的结构时也面临着巨大挑战。可见,对文本分类问题的研究是一个漫长的过程,其中,形成一种成熟的领域概念获取方法是一个长期目标。

3.2概念间关系获取

领域概念关系获取的正确性和难易程度,除了技术因素之外,还依赖于所处学科的复杂性以及领域知识所研究的范畴和所处层次。

在构建学科领域本体时,对于概念关系明确、严格的理工科类,如计算机科学,关系的提取相对容易处理。而对于经济学、管理学等交叉学科,概念的分类和界定存在很大困难。

同时,领域知识所研究的范畴和所处层次也有很大差异,这也是影响领域概念关系正确获取的一个关键因素。在《软科学手册》中,知识被分为0级、1级、2级知识:有关领域里的事实、定理、方程、实验对象和操作知识等常识性知识和原理性知识称为“0级知识”;经验性的知识(如经验规则、含义模糊的建议、不确切的判断标准等)称为“1级知识”;关于如何运用上述两级知识的知识,称为“2级知识”。显然,以当前的技术水平构造1级以上较为复杂的领域本体,将存在很多难以克服的困难。

篇11

一、进行概率统计教学设计意图

教学设计对于发展教育事业、培养人才意义重大,教学设计具有科学性,它能借助有效的教学资源,提高教学水平与质量,促进教学工作者教学素养的提高, 概率统计教学旨在培养学生的统计思维,让他们在进行数字的分析与处理中,领悟到统计方法的特点,加大对数据的直观感受,课程标准对于概率统计教学的要求并不局限于教会学生进行题目的计算,教学设计是为了鼓励学生应用所学的知识于实际中,尝试利用概率统计思想采用不同的方法选取样本,对于整个事件进行较为合理的判断,提升学生的思维能力。

二、高中概率统计教学研究

(一)案例教学培养学生直观感觉

高中概率统计教学注重的不仅是理论教学,更是希望同学能够通过对这些数据的处理,培养寻求答案的能力,案例教学选取贴近日常生活的案例,使学生学会思考与理解,给学生直观感受。

(二)教师素养对概率统计教学意义重大

教师对于高中概率统计教学有着不同程度的理解,部分教师教学概率统计思想意识薄弱,很多统计观念尚未形成,这种认识偏见具有传递性,也会使学生产生学习的偏差,致使学生产生“预言结果法、简单复合”等错误概念。因此,教师的素养对概率统计教学的意义十分重大。

三、高中概率统计教学设计

(一)"古典概型"教学设计

古典概型是概率教学中较为基础的教学内容,课标要求,掌握古典概型的概念,能够用列举法求概率,进行古典概型的教学设计,要明确古典概型的教学目标与教学的重难点,目标我们定位两种,一是知识目标,一是情感目标,知识目标要求学生在学习古典概型后,理解古典概型的相关概念,能计算事件的概率,并在求解的过程中培养良好的概率统计思维,情感目标是追求学生对实际问题的转化能力,在学习古典概型后,能把日常生活中遇到的问题转化为古典概型并思考求解,培养分析问题、思考问题、解决问题的能力,同时也对数学产生浓厚的探索兴趣。本知识的重点是教授概念及教会学生利用古典概型的相关知识求出随机事件的概率,难点是判断一个事件是否为古典概型,及事件发生的概率。

高中古典概型的教学是建立在初中概率学的基础之上的,但相关研究表明,学生对概率统计知识的掌握不会随着年龄的增长而自行增长,需要不断学习与思考的,教师在对学生的知识程度有一定了解的基础之上进行有针对性的课堂内容的教学设计,先创设问题情境引入教学内容,如老师可提问掷一枚硬币,观察它是哪一面朝上的,共有几种可能?然后让学生自由探讨,得出结论。学生答共两种可能,一个是正面朝上,一个是背面朝上,以教师问答形式开场,既能激起学生的学习兴趣与探索欲,活跃课堂气氛,又能引导学生得出概念性的总结。接下来便是教师对概念的解读,阐述古典概型的满足条件,基本事件的个数是有限的,每个基本事件发生的可能性相等,满足上述两个特点的事件才是古典概型的事件。经过概念的解读后,教师便可以举一些相关例子,让学生判断,加深学生对概念的理解,例子的难度是逐渐增加的。最后进行教学内容的总结,可让学生自行回顾课堂内容与所有知识,这样帮助学生构建良好的知识结构,完善知识体系,使学生养成良好的学习习惯。适当的布置一些课后练习,让学生课后巩固一下,可加深学生对知识的理解。

篇12

基本会计准则与财务会计概念框架的区别有以下几点:(1)从中西方会计准则体系比较来看,美、英等国,包括国际会计准则委员会,都把概念框架作为一份单独的会计文件独立于会计准则进行公布,而我国将会计的基本概念归集到基本准则之中,并没有另外单独公布财务会计概念框架。(2)从我国基本会计准则适用范围来看,《企业会计准则》虽说适用于我国境内的所有企业,但在实际运行中愈来愈表现出缺乏调整力度的问题。这个问题的实质就暴露了《准则》适用性所存在的问题。(3)从我国基本会计准则的内容来看,《准则》目前存在着会计科目表达抽象,会计信息质量特征之间的关系模糊,缺乏可操作性,会计要素定义不够科学、完整等问题,因而,尚不能用来指导具体会计准则的制定。

当前我国会计理论界主要有三种观点:(1)“同一论”。即将《准则》认同为我国的财务会计概念框架,并对之进行适当修改。(2)“并存论”,即在对《准则》进行适当修改的基础上,再构建一份概念框架,这样我国的会计准则体系就分成三个组成部分:财务会计基本前提概念、《准则》、具体会计准则。(3)“替代论”。即取消《准则》,重新构建我国的“财务会计概念框架”。

我国具体会计准则的理论依据应采用财务会计概念框架形式。主要理由是:(1)可以保持会计准则相关文件和内在逻辑的一致性,避免不同准则之间的矛盾或冲突,保证会计准则体系的完整性和缜密性。(2)能减少准则制定过程中由于个人偏好或不同学派之间的争论等人为因素所带来的不利影响,从而保证会计准则的科学性。(3)可用来评估已的会计准则,既可据以对原准则做出修订和完善,给新会计准则的制定指明方向,而且还能弥补准则中的某些缺陷,为重大会计问题的解决提供理论上的支持。(4)有助于会计信息使用者更好地理解财务报告所提供信息的目的、内容、性质和局限性,使其能据以作出恰当的分析判断和正确的经营决策。(5)通过财务会计概念框架的研究,既可充分肯定传统会计理论中仍然适用的合理部分,又能及时展示社会经济环境变动情况下会计理论研究的最新成果,从而不断地推动会计理论研究向纵深发展。(6)以财务会计概念框架取代《准则》之后,也就不存在所谓《准则》的适用范围问题,而是将其作为评估、理解和发展具体会计准则的理论依据。(7)以财务会计概念框架取代《准则》,可增强会计信息使用者对财务报告所提供信息的理解。(8)财务会计概念框架的形式可以避免基本会计准则理论深度不够、理论阐述不多、有些原则空泛抽象、缺乏可操作性的弊端,摆脱因具体会计准则的修改而不断修改的局面。可以对一些重要理论问题充分论述,以便在理论发展的基础上,对实践起指导作用。(9)概念框架只是制定和理解会计准则的理论指南,独立于会计准则的理论体系,并不具有强制性,是对有关的会计基本理论问题进行充分论证并指明主流观点的过程。(10)从国际会计惯例上看,美、英等西方发达国家,以及国际会计准则委员会都是把财务会计概念框架独立于会计准则予以,这种成功的经验很值得我们借鉴和学习。

二、构建中国特色财务会计概念框架的原则

构建中国特色财务会计概念框架应遵循如下原则:(1)一贯性原则。要坚持前后逻辑一致、用语一致。(2)立场中立原则。要坚持不偏不倚,保持中立性,不偏向任何一方利益集团。(3)系统、完整性原则。要从总体上把握应包括哪些概念要素,划分为几个层次,如何进行系统归类,应尽可能地保证概念框架基本内容的系统、全面和完整。(4)相对稳定性原则。财务会计概念框架属于规范性文件,要尽可能稳定,避免经常修改和变动。为保持稳定性,概念框架的内容可以考虑有一定的超前性。(5)继承性原则。对传统的会计理论不能全部抛弃,而要“扬弃”,对其合理、科学的部分要继承,做到古为今用。(6)国际化原则。作为会计准则理论依据的概念框架,应向国际化方向努力,加强会计信息的可比性。但是,国际化并不排除国家化。我国的财务会计概念框架应考虑中国的国情,体现中国特色。

构建中国特色财务会计概念框架应处理好如下几个关系:(1)中国特色与国际化的关系。会计根植于特定的环境,不仅具有技术性的一面,更重要的是具有社会性的一面。要在充分考虑中国会计环境特殊性的前提下,积极稳妥地进行会计国际协调和国际会计协调,最终与世界各国会计界一道实现会计的国际化。构建我国的财务会计概念框架一定要正确处理好中国特色与会计国际化的关系,把握一个合理的度。(2)概念框架与会计理论体系的关系。概念框架应该内涵于会计理论体系之中,但两者并不是一个层面上的范畴。会计理论的目标是解释和预测会计实务。概念框架主要是反映财务会计特别是财务报告所赖以建立的基本概念以及它们之间的内在一致的联系,建立这种规律性的联系是为了不断完善会计准则和财务报告。为此,在构建财务会计概念框架时要重推理、重经验,尽量把概念框架构建成浑然一体、协调一致、首尾一统的知识体系。(3)概念框架与具体会计准则或企业会计制度关系。在我国现行的会计标准体系中,具体会计准则或企业会计制度应该属于第二层次。概念框架不是具体会计准则或企业会计制度,它没有建立具体描述交易业务或特定事项的会计程序和披露制度,只是指导具体准则的制定。从这个意义上讲,具体准则不属于会计理论体系的范畴。此外,在财务会计概念框架制定程序方面,还应注意政府会计机构与民间会计团体之间的协商问题。作为制定者的政府,应该按照科学的工作程序广泛听取业内各方面的意见和建议,在保证概念框架权威性的同时,切实考虑其广泛的公认性。

三、构建我国财务会计概念框架的设想

篇13

Abstract:Aimed at the defects of the traditional keyword-based retrieval model,an ontology-based semantic query-oriented information retrieval model was built.Concept of four tuple ontology was defined,the resource mapping scheme was given,ontology concept expansion strategy was formulated, the concept similarity computing algorithm of ontology was described,and the experimental comparison was carried out.The results show that precision and recall rate of ontology semantic retrieval model are higher than the traditional retrieval model,this study has some theoretical and practical value.

Keywords:ontology;semantic;similarity;information retrieval

1 引言(Introduction)

随着互联网技术的快速发展,人类已进入信息时代,尤其是当前大数据背景下网络信息资源的数量越来越庞大,其已成为全球最大的信息库,且网络信息资源随之呈现出更加复杂的特性,暴露出一些亟待解决的问题[1-3]。然而,传统信息检索模式面对文本字符串匹配的语法层面,缺乏针对信息表示及处理和理解的语义层面分析,即信息是丰富的,而知识却是贫乏的,所以依赖传统的信息检索方式已很难满足用户需求,而本体及其相关理论技术的出现为解决这一问题提供了可能。

本文将利用本体建立标签之间的语义关系,并引入语义与Agent技术,实现标注系统的语义检索,通过语义模型丰富的描述能力和强大的逻辑推理能力准确描述信息资源,以Agent组织完成用户交互、信息检索、信息过滤、结果返回,构建一种基于本体学习的能够实现语义层面分析的检索模型,以弥补传统信息检索的不足,进而从信息查全率和查准率方面改善信息检索的效率。

2 基于本体的语义检索模型构建(Construction of semantic retrieval model based on ontology)

基于领域本体的语义检索,可依据领域本体知识库对信息资源或文档进行语义标注,本体概念的语义信息可借助本体概念定义及本体概念之间的关系进行描述,因为特定专业领域的概念可通过领域本体进行描述,这样可使文档或信息资源更具有语义,且可揭示出用户检索词的语义,把从文档和用户查询抽取的关键词转换为具有语义的本体概念,实现基于关键词的语法检索到基于本体概念的语义检索的提升,其中,语义检索与传统基于关键词匹配的检索方式不同,因为语义检索基于信息理解的语义层面对信息资源及用户提交的检索请求进行分析,语义检索方式对检索条件、信息组织以及检索结果均赋予了语义成分,可从语义层面提高检索精度[4-7]。

2.1 领域本体的语义检索理念

基于领域本体的语义信息检索,其理念在于使信息资源或文档进行语义描述,借助领域本体知识库完成对文档和信息资源对象的语义标注,进而揭示出文档和信息资源对象的语义理解,及其用户检索词的语义信息,同时可实现领域本体检索词的语义扩展,最终完成理想检索结果的获取,具体检索过程为:

step1:构建并描述领域本体概念。描述领域本体概念,构建领域本体知识库。

step2:提取文档或信息资源对象特征并进行资源映射。借助领域本体概念描述及知识库构建和管理,对获取的信息资源或文档进行语义标注及资源映射,对信息资源或文档语义内涵进行揭示。

step3:制定本体概念扩展及查询语义扩展策略。在领域本体概念描述的基础上,对用户查询请求的语义信息进行揭示,并对用户检索词进行语义扩展,检索系统完成对生成的备选检索词集的检索工作。

step4:实现领域本体概念相似度算法。依赖本体概念结构图,实现本体概念语义距离计算算法、本体概念节点深度计算算法及语义综合相似度计算算法,以此服务于查询结果排序环节。

step5:对检索系统的检索结果进行排序。基于相关相似度计算算法及规则,完成用户原始检索词及检索系统返回检索结果的相似度比较,基于相似度对检索系统的检索结果进行排序并反馈给用户。

2.2 领域本体语义检索模型

领域本体语义检索模型,如图1所示。

(1)领域本体及其分类体系作为数据资源语义表征的核心,可对文档或数据资源描述给予指导。领域知识也作为查询扩展和查询结果排序的基本依据。因此,领域知识的构建和维护,如领域本体、推理规则的构建和维护,离不开领域知识管理。

(2)数据资源或文档的语义可通过标注进行语义揭示,再借助文档特征提取技术,从领域本体词汇中获取本体概念,建立数据资源或文档的语义特征域,完成数据资源库文档的自动标注,并完成标注和索引信息资源或文档的非语义特征,由此生成文档索引库和元数据库。

(3)基于文档或数据资源标注信息构建索引库,以此为依据,检索出能满足用户需求的文档或数据资源信息。

(4)实现查询扩展及结果排序,就是以领域本体生成的本体词汇库为依据,完成用户查询输入文字的分词工作,将用户查询分成本体概念集合和非本体概念集合。然后,分别对这两个集合按相似度扩展,得到两个查询候选集合,以此为依据,借助相关相似度排序算法获得排序后的查询集,最后,完成查询请求到索引库及检索库的提交环节,将查询结果按查询请求的相似度排序后,将结果推送给用户。

3 关键算法实现(Key algorithm implementation)

3.1 四元组本体内涵及其数学描述

基于四元组的本体概念描述为:,其中,表示用户,描述使用标签管理资源的用户,并且每个用户有唯一的ID号标识。表示标签,描述集合中用户使用过的标签,标签可以是任意的字符串(单词或短语),现定义标签为一组词语序列,,

,公式描述标

签映射成一组术语,术语可以是任意单词。表示资源,描述所有领域相关资源,其内容取决于用户标注集的类型,用户标注集主要由用户、标签、资源三个要素组成,即用进行描述。表示三元关系,其中元素描述用户使用标签标注收藏的资源。函数式描述用户使用一组标签定义一个资源,其中 。

为了理解用户标签含义及标签之间的关系,构建主干本体,用二元组进行描述:,

其中表示概念集,概念,是概念的唯一标识,是同义词集合,包含了概念的同义术语集合,是描述概念的短语,是将概念分类到泛化类中的词类,也可将四个元素分别记为:,,,;

表示概念集之间的关系。现定义为一组同义词集合,资源,定义一组同义词集合及里资源,,每个资源用二元组表示为:,

其中,为资源的频率分配。三元组表示关系集合中的关系,其中,,,是关系的两个关系项。

3.2 资源映射方案设计

一个标签可以映射成一个或多个概念,也有可能只有部分标签可以映射成一个或多个概念,现提供几种资源映射方法。

(1)直接映射

直接映射描述标签到概念的映射,即将每个标签映射到本体中的概念,可表示为:

3.3 本体概念扩展策略制定

(1)本体概念扩展

本体概念扩展步骤如下。

step1:对每个本体概念进行扩展。

为领域本体概念集,为两个本体概念的相似度。如果对本体概念进行语义扩展可形成,

其中集合中每个元素要么为空,要么,且,。

也就是说,可基于相关相似度计算算法扩展单个本体概念,选择相似度大于给定阈值的本体概念,并且被选取的本体概念同其他用户本体概念之间的相似度,比该被选取本体概念同当前单个本体概念之间的相似度小。

step2:构建本体概念查询集。对用户本体概念集的元素进行扩展,其中的每个概念元素都可扩展为一个扩展集,可分别从每个中进行本体概念的选取,构建本体概念查询集,查询本体概念集的组员就是从每个本体概念扩展集中选取的概念,查询本体概念集描述为:

(2)扩展关键词集合

关键词的扩展相对简单,因为关键词不是本体概念,所有扩展的集合所组成的集合为原关键词集的幂集,记为,其中的元素本身也是集合,且与用户输入的原关键词集之间的相似度计算也并不复杂,现令为幂集中的元素,则与之间的相似度计算模型为:

3.4 本体概念相似度算法

领域本体可描述特定领域中的概念及其关系,并可形成本体概念结构图,该本体图可计算本体概念相似度,其实本体概念结构图可看作为带有根节点的有向无环图,本体概念用图中的节点进行表示,概念之间的关系通过有向边进行表示,且该本体概念结构图具有树型结构的层次结构特性,及有向边和多重继承的特性。具体算法步骤如下:

step1:本体概念语义距离的计算。

基于本体概念图,本体概念的语义距离表现为连接两个概念节点的有向边的数量,记为。本体概念语义距离与本体概念语义相似度之间的关系为:两本体概念语义之间的距离越大,则这两个本体概念之间的相似度越小;反之,两本体概念语义之间的距离越小,则其之间的相似度就越大,即两者成反比关系。

step2:本体概念父节点深度的计算。

基于本体概念所体现的层次结构特点,对本体概念节点进行自顶向下的组织,及由大到小的分类,依据本体概念最近共同父节点所在层次,可知其层次越深,本体概念分类越细,从其父节点继承的语义信息就越多,其共同语义信息就越多,即这两个本体概念间的相似度就越大。现用描述两概念的最近共同父节点深度,表示两概念最近共同父节点。

step3:计算语义重合度。

本体概念之间的语义重合度计算可依据两本体概念间所包含的相同父节点个数来完成,但如果同时对本体概念语义距离和本体概念语义重合度加以考虑,则存在重复计算的可能性,因为本体概念语义距离中隐含着本体概念语义重合度信息,所以可基于本体概念语义距离和共同父节点在本体概念结构图中的深度,计算出本体概念相似度,令两本体概念 、,则、的语义相似度可通过、的语义综合距离和、共同父节点的综合深度对相似度影响的加权归一化进行表示,计算如下:

其中,为语义距离加权值,表示共同父节点的加权值,且满足,语义距离决定的相似度可通过调节参数进行调节,表示本体概念树的最大深度。

step4:本体概念综合相似度计算。

如果对用户检索词集中的本体概念进行语义扩展,可生成查询语义扩展集,记为,如果对用户检索词集中的非本体概念的关键词集进行扩展,可生成关键词集的幂集,记为,现从中取一元素,记为,该元素是一个扩展概念集,再从中取一元素,记为,该元素为一个扩展关键词集,便可形成一个提交给检索系统的检索请求,表示为(,),令用户检索词集为(,),每一个扩展的检索请求记为(,),则通过(,)和(,)相似度的计算,可得到用户检索词集和检索结果的相似度。现基于扩展关键词集相似度、扩展本体概念集相似度、分类概念集相似度,可计算出综合相似度,数学描述如下:

其中,、为调节参数,代表本体概念集相似度与综合相似度的比值,代表关键词集相似度与综合相似度的比值,且。

4 实验与结果分析(Experiment and result analysis)

本实验环境为:Windows 7操作系统,SQL SERVER 2008数据库平台,模型数据库动态链接查询实现工具为某专业数据库数据及WEB技术。建立领域本体的开发工具为:5.0的PROPERTY BROWSER环境,每个词条类的构建借助Object Property属性实现,因为Object属性可在类与类之间建立不同层次的关系描述,而且两个Object属性之间存在多种关系。如果基本父类建立完成后,还可为每个父类添加不同的子类和属性,同时还具有继承特性,即所有子类都可继承其父类的基本属性。

实验步骤为:

step1:对选取知识本体的专业领域及范围进行确定,基于自顶向下的顺序,构建本体概念和术语清单。

step2:对基础词库进行完善。

step3:依据分类体系层次,对本体实例进行添加,构建整个领域本体。

本体概念语义信息检索模型测试指标通过查准率和查全率进行衡量,分别描述为:

查全率:

查准率:

同时,借助对检索结果进行评价及对比分析,以便于全面衡量其检索效果,的计算公式描述为:

它为检验本体概念语义信息检索模型,将其与传统关键词检索模型进行实验对比分析,对抽取的某领域的标准词条进行测试,从中随机选择四个词条实验样本,分别以相同词条在本文模型和基于关键词模型中检索,实验结果详见表1、表2和图2所示。

由以上实验结果可知,领域本体概念的语义信息检索模型效率高于传统关键词信息检索模型,且语义检索的 也高于传统关键词检索,表明本体概念语义检索模型具有一定的理论及实用价值。

5 结论(Conclusion)

论文构建了面向语义查询的信息检索模型,对资源映射方案、信息概念扩展、相似度计算等进行了改进,实验结果证明该模型具有较高的查全率和查准率。今后的工作中,将继续研究本体结构中,如何查找到更多概念邻居,以减少数据稀少的影响,进而提高检索效率。

参考文献(References)

[1] Zhang Bin,et bining relation and content analysis for social tagging recommendation[J].Journal of Software,2012,23(3):476-488.

[2] 吕刚,王晓峰,胡春玲.基于本体学习的标签推荐方法研究[J].小型微型计算机系统,2015,3(3):424-426.

[3] 何继媛,窦永香,刘东苏.大众标注系统中基于本体的语义检索研究综述[J].现代图书情报技术,2011,203(3):51-56.

[4] 魏桂英,高学东,武森.基于领域本体的个性化文本信息检索[J].辽宁工程技术大学学报,2011(4):316-320.

[5] 张宗仁,杨天奇.基于自然语言理解的SPARQL本体查询[J].计算机应用,2010,30(12):3397-3400.

[6] 何伟,杨小平.基于词间语义关联性的本体扩展[J].计算机应用与软件,2011,28(11):73-76.

[7] 张胜.一种基于领域本体的语义检索模型[J].软件导刊,2014,13(3):18-21.

在线咨询