统计学的特征实用13篇

统计学的特征篇1

统计学是一门实质性的社会科学，既研究社会生活的客观规律，也研究统计方法。统计学是继承和发展基础统计的理论成果，坚持统计学的社会科学性质，使统计理论研究更接近统计工作实际，在国家和社会得到广泛发展。

二、统计学中的几种统计思想

2.1统计思想的形成

统计思想不是天然形成的，需要经历统计观念、统计意识、统计理念等阶段。统计思想是根据人类社会需求的变化而开展各种统计实践、统计理论研究与概括，才能逐步形成系统的统计思想。

2.2比较常用的几种统计思想

所谓统计思想，就是统计实际工作、统计学理论及应用研究中必须遵循的基本理念和指导思想。统计思想主要包括:均值思想、变异思想、估计思想、相关思想、拟合思想、检验思想。现分述如下：

2.2.1均值思想

均值是对所要研究对象的简明而重要的代表。均值概念几乎涉及所有统计学理论，是统计学的基本思想。均值思想也要求从总体上看问题，但要求观察其一般发展趋势，避免个别偶然现象的干扰，故也体现了总体观。

2.2.2变异思想

统计研究同类现象的总体特征，它的前提则是总体各单位的特征存在着差异。统计方法就是要认识事物数量方面的差异。统计学反映变异情况较基本的概念是方差，是表示“变异”的“一般水平”的概念。平均与变异都是对同类事物特征的抽象和宏观度量。

2.2.3估计思想

估计以样本推测总体，是对同类事物的由此及彼式的认识方法。使用估计方法有一个预设：样本与总体具有相同的性质。样本才能代表总体。但样本的代表性受偶然因素影响，在估计理论对置信程度的测量就是保持逻辑严谨的必要步骤。

2.2.4相关思想

事物是普遍联系的，在变化中，经常出现一些事物相随共变或相随共现的情况，总体又是由许多个别事务所组成，这些个别事物是相互关联的，而我们所研究的事物总体又是在同质性的基础上形成。因而，总体中的个体之间、这一总体与另一总体之间总是相互关联的。

2.2.5拟合思想

拟合是对不同类型事物之间关系之表象的抽象。任何一个单一的关系必须依赖其他关系而存在，所有实际事物的关系都表现得非常复杂，这种方法就是对规律或趋势的拟合。拟合的成果是模型，反映一般趋势。趋势表达的是“事物和关系的变化过程在数量上所体现的模式和基于此而预示的可能性”。

2.2.6检验思想

统计方法总是归纳性的，其结论永远带有一定的或然性，基于局部特征和规律所推广出来的判断不可能完全可信，检验过程就是利用样本的实际资料来检验事先对总体某些数量特征的假设是否可信。

2.3统计思想的特点

作为一门应用统计学，它从数理统计学派汲取新的营养，并且越来越广泛的应用数学方法，联系也越来越密切，但在统计思想的体现上与通用学派相比，还有着自己的特别之处。其基本特点能从以下四个方面体现出：（1）统计思想强调方法性与应用性的统一；（2）统计思想强调科学性与艺术性的统一；（3）统计思想强调客观性与主观性的统一；（4）统计思想强调定性分析与定量分析的统一。

三、对统计思想的一些思考

3.1要更正当前存在的一些不正确的思想认识

英国著名生物学家、统计学家高尔顿曾经说过：“统计学具有处理复杂问题的非凡能力，当科学的探索者在前进的过程中荆棘载途时，唯有统计学可以帮助他们打开一条通道”。但事实并非这么简单，因为我们所面临的现实问题可能要比想象的复杂得多。此外，有些人认为方法越复杂越科学，在实际的分析研究中，喜欢简单问题复杂化，似乎这样才能显示其科学含量。其实，真正的科学是使复杂的问题简单化而不是追求复杂化。与此相关联的是，有些人认为只有推断统计才是科学，描述统计不是科学，并延伸扩大到只有数理统计是科学、社会经济统计不是科学这样的认识。这种认识是极其错误的，至少是对社会经济统计的无知。比利时数学家凯特勒不仅研究概率论，并且注重于把统计学应用于人类事物，试图把统计学创建成改良社会的一种工具。经济学和人口统计学中的某些近代概念，如GNP、人口增长率等等，均是凯特勒及其弟子们的遗产。

3.2要不断拓展统计思维方式

统计学是以归纳推理或归纳思维为主要的逻辑方式的。众所周知，逻辑推理方式主要有两种：归纳推理和演绎推理。归纳推理是基于观测到的数据信息(尤其是不完全甚至劣质的信息)去产生新的知识或去验证一个假设，即以所掌握的数据信息为依据，归纳得出具有一般特征的结论。归纳推理是要在数据信息的基础上透过偶然性去发现必然性。演绎推理是对统计认识能力的深化，尤其是在根据必然性去研究和认识偶然性方面，具有很大的作用。

3.3深化对数据分析的认识

任何统计研究都离不开数据分析。因为这是得到统计研究结论的必要环节。虽然统计分析的形式随时代的推移而变化着，但是“从数据中提取一切信息”或者“归纳和揭示”作为统计分析的目的却一直没有改变。对统计数据分析的原因有以下三个方面：一是基于同样的数据会得出不同、甚至相反的分析结论；二是我们所面对的分析数据有时是缺损的或存在不真实性；三是我们所面对的分析数据有时则又是海量的，让人无从下手。虽然统计数据分析已经经历了描述性数据分析(DDA)、推断性数据分析(IDA)和探索性数据分析(EDA)等阶段，分析的方法技术已经有了质的飞跃，但与人类不断提高的要求相比，存在的问题似乎也越来越多。所以，我们必须深化对数据分析的认识，围绕“准确解答特定问题并且从数据中获取一切有效信息”这一目的，不断拓展研究思路，继续开展数据分析方法技术的研究。

参考文献:

[1]陈福贵.统计思想雏议[J]北京统计,2004,(05).

统计学的特征篇2

1.1施工班组组织模式改革开放以来，施工企业逐步转型为管理型企业，大多以劳务分包的方式组织施工，其用工机制也发生变革，施工现场一线职工已经由原先企业职工变成面向社会的劳务用工。原有的固化劳动用工被多元化的管理及用工模式所代替，催生出诸多“包工头”组建的施工劳务队伍和“散兵游勇”，随意用工、管理不到位，克扣、拖欠农民工工资，转包、挂靠、违法分包等现象层出不穷。这些问题可能会给工程质量和安全带来严重隐患，阻碍行业的可持续发展。本文通过对安徽省、广东省、江西省数个在建项目桥隧工程施工现场的走访和调研，发现除个别未进行分包外，施工企业普遍采用专业分包和劳务分包的模式组织施工生产。由于采用不同的施工组织模式，导致施工班组管理存在多种形态。具体来说，桥隧工程施工班组组建存在以下几种情况：（1）施工班组由本单位职工组成；（2）施工班组长由本单位职工担任，班组成员由劳务分包队伍组成；（3）施工班组长和班组成员全部由劳务分包队伍担任；（4）其他组成方式。其中第（1）种情况在目前的公路桥隧工程施工班组中已很少见；第（2）种情况存在于中铁系统中的架子队，是重难点工程主要采用的班组管理形式；第（3）种情况为现阶段主要的班组组织形式。

1.2施工班组管理水平施工企业对班组的管理，要么采取单一形式，要么同时采取多种形式。施工班组组成形式的不同，势必造成班组建设和管理的不对称和不完善。施工企业对班组的管理存在不规范的情况，如未签订合法劳动合同、未提供相应的劳动保护和职业健康保障、对班组临建和生活设施管理不到位等。另外，管理方法简单、方式粗放、缺乏系统性都是施工班组建设管理亟待解决的问题。

1.3施工班组成员特点施工班组成员大多数来自农村，存在以下基本特点：（1）受教育程度低、文化程度低；（2）综合素质低、安全意识淡薄、自我防范意识差；（3）专业技术水平低、业务能力差；（4）缺乏纪律性和执行力；（5）班组成员年龄结构偏大，人员不固定，流动性大；（6）班组成员安全培训不足。我国在安全教育培训方面相当落后。农村劳动力中，接受过短期培训的人数占劳动力总数的20%，接受过初级职业技术培训或教育的占3.4%，接受过中等职业技术教育的仅占0.13%，而没有接受过技术培训的高达76.4%。相比而言，美国、加拿大、荷兰、德国、日本等国的农村劳动力中受过职业培训的比例则在70%以上。

1.4施工班组安全职责我国施工行业安全监管体系现已基本完善：政府相关部门负责对企业安全生产的监督，企业负责自身的安全生产管理。在当前形势下，施工组织基本为劳务分包模式，班组安全管理由分包队伍的负责人负责。但现实中由于安全管理需要相应的投入，这在一定程度上造成班组安全管理职责不明确，以包代管问题严重，班组内未设专人负责安全检查，各自为政。生产活动中，大多只重视进度和效益，而不重视安全管理。

2施工班组人口统计学特征

2.1研究对象及其特征变量的选取由于缺乏人口统计学特征变量选取的相关标准，本文将借鉴其他同类研究成果，结合公路桥隧工程施工班组特点，选取施工班组人口统计学特征变量开展研究。梁振东研究了煤矿工人的年龄、工龄与经验、工作岗位、婚姻状况、吸烟、饮酒、家庭经济压力等变量与不安全行为意向及不安全行为的关系；赵君等研究了武汉市员工的性别、年龄、教育程度、工作年限、单位类型和组织规模对组织导向和人际导向工作场所偏差行为的影响；张贵群和方卫华研究了北京市科技工作者的性别、年龄、收入、受教育程度及职称与工作满意度之间的关系。本文将主要以公路桥隧工程施工班组为研究对象，选择性别、年龄、受教育程度、从事本工种时间、人员流动性等变量进行研究，分析各变量对施工班组安全管理的影响程度。

2.2现场调研与调查问卷本文收集了在建项目的55个施工班组、530名桥梁施工人员、375名隧道施工人员的基本信息，得到桥隧工程施工班组人口统计学特征变量的相关数据。同时，通过问卷调查，收集到施工人员对班组建设的合理化建议。调研现场如图1所示。

2.3人口特征学变量如前所述，本文主要以施工班组成员为研究对象，选择性别、年龄、受教育程度及从事本工种的时间、人员流动性等变量展开研究。

2.3.1性别对收集的资料进行统计，结果显示：530名桥梁施工人员中，519人有性别信息，其中男性498人、女性21人；375名隧道施工人员均有性别信息，其中男性361人，女性14人。通过数据分析，可以得知：在所有桥梁施工人员中，男性人数约占96%，女性人数约占4%，男女性别比例约为24∶1；在所有隧道施工人员中，男性人数约占96.3%，女性人数约占3.7%，男女性别比例约为26∶1。另外，从调查收集的资料来看，桥梁施工班组中，女性施工人员的主要岗位为搬运工或后勤人员；隧道施工班组全部为男性，女性施工人员负责班组后勤工作，不从事隧道施工作业。由此可见，在桥隧工程施工班组中，以男性为主，男女性别比例相差很大。男性施工人员从事主要工作，是施工班组的主力；女性施工人员从事后勤或辅助工作，是施工班组的辅助力量。

2.3.2年龄通过对班组人员（其中桥梁施工人员458人，隧道施工人员375人）身份信息进行核实，得到施工人员的年龄分布信息，如表1所示。由表1可知，桥梁施工人员中，40～49岁的从业人员最多，共164人，占总数的35.8%；其次为50～59岁的从业人员，共113人，占24.7%；30岁以下人员共60人，占13.1%；60岁以上人员共37人，占8.1%。隧道施工人员中，40～49岁的从业人员同样最多，共137人，占总数的36.5%；30岁以下人员共计78人，占20.8%；60岁以上共5人，占1.3%。根据桥隧施工人员年龄调研情况，绘制施工人员年龄分布及趋势图，如图2和图3所示。由图2可知，桥梁施工人员中，60岁以上人数占比较大，达到8.1%，表明从事桥梁施工的作业人员年龄偏老龄化。由图3可知，隧道施工人员的年龄基本呈正态分布，表明该类施工人员年龄结构基本合理。

2.3.3受教育程度如前文所述，施工人员整体受教育程度低、文化水平不高，这是影响班组安全管理的重要因素。本文通过调查问卷的形式，收集了294名桥隧施工人员的学历信息，如表2所示。表2的调查结果表明，在桥隧工程施工班组中，高中及以上学历的施工人员占全部施工人员的11.5%；初中及以下学历的施工人员占全部施工人员的88.5%。高中及以上学历与初中及以下学历人数之比为1∶7.7。显然，受教育程度影响着施工人员对安全教育培训的接受程度和对安全教育内容的接受能力。从调查结果可以看出，受教育程度为初中及以下学历的施工人员是桥隧工程施工的主力军，因而是安全教育的重点对象。

2.3.4从事本工种的时间施工人员从业时间能在一定程度上反映出其技术水平与施工经验。本次调查问卷，共收集到294名桥隧施工人员的从业时间信息，如表3所示。表3的统计结果显示，从业5年以上的人数占总从业人数的72.4%。其中从业5～10年及10年以上的人数占比分别为45.9%和26.5%，说明现阶段桥隧施工人员的从业时间较长，施工经验丰富。从业1年及以下的施工人员占比较小，仅为4.1%，反映出现阶段桥隧施工人员相对稳定，流入人员较少。

2.3.5人员流动性工程建设行业施工人员流动性大，是施工安全管理的重点和难点。本次针对桥隧施工人员的调研中，通过项目人员进场、离场登记信息的方式，确定桥隧施工人员的项目流动性。对主体结构已完成的公路建设项目进行调研，共收集到336名桥梁施工人员和264名隧道施工人员进出场的信息记录，得到桥隧施工人员项目工作时间情况，如表4所示。由表4可以看出，桥隧施工人员的项目工作时间不超过1个月的人数为124，占总调研人数的20.7%；工作时间为1~3个月的人数为119，占比为19.8%；工作时间为3~6个月的人数为121，占比为20.2%；工作时间超过6个月的人数为236，占比为39.3%。按照工程经验推算，一般桥梁工程主体结构（按简支梁桥算）施工建设周期为6个月左右。从调研情况可以看出，桥隧施工人员流动人数占比约为60.7%，可见人员流动性很大。

3施工班组安全管理模式构建

基于施工班组人口统计学特征的调研，结合班组组织建设、制度建设和保障建设3方面需求，构建桥隧工程施工班组安全管理模式。

3.1管理模式框架（1）班组组织建设研究中，基于桥隧工程施工人员年龄（隧道施工人员年龄分布基本合理；桥梁施工人员年龄偏老龄化）、性别（以男性为主）、从事本工种的时间（施工经验丰富）进行班组组织建设，同时针对班组长及关键岗位提出重点要求，并考虑班组成员的合理搭配。（2）班组制度建设基于桥隧工程施工人员受教育程度（文化程度低）、从事本工种的时间（施工安全多为经验积累）、流动性（施工人员流动性大）开展班组制度建设，建立相对实用且有效的制度，并对以往适用于企业自有班组的管理制度进行精简，同时通过安全责任制、安全教育、安全奖惩和安全纪律等制度对班组进行安全管理。（3）班组保障建设在班组组织建设和制度建设完善的基础上，基于桥隧工程施工人员流动性（由于施工作业环境差、待遇偏低等因素造成人员流动性过大），提出相应的配套投入，如采取规范工作环境、改善住宿条件、提高收入及增强劳动保护等措施。（4）班组现场管控基于桥隧工程施工人员受教育程度（文化水平不高、接受新知识能力较差）、从事本工种时间（缺乏系统的安全技术，多以个人经验为主）、流动性（流动性大，缺乏系统的安全技能和知识培训），通过对班组进行风险源控制（告知）、安全检查和隐患排查等方式保障施工班组的施工安全。基于以上思路，结合施工人员安全能力的差异及施工班组管理的难点，从班组组织、内部管理、配套投入及现场控制等方面考虑，建立桥隧工程施工班组安全管理模式，如图4所示。

3.2班组组织建设施工班组组织是班组管理的前提，也是班组安全管理的根本。由于公路工程建设规模庞大，施工人员来自不同地域，存在生活习惯不同、文化差异大、语言沟通不畅等问题，在班组组织时应予以考虑。

3.2.1班组长选择公路桥隧工程施工具有难度较大、专业技术要求高、交叉作业多及安全管理难度大等特点，这使得施工作业班组长的选择尤为重要。班组长较强的领导力可以对员工安全行为产生积极的影响[14]。因此，班组长应具备过硬的专业技术能力、优秀的组织执行能力、较好的学习能力、沟通协调能力和总结表达能力。通过收集55个桥隧施工班组长的资料信息，了解到班组长年龄、性别（均为男性）、从业时间和受教育程度的情况，如表5~表7所示。通过现场与10位班组长进行交谈，并结合班组长调查情况，初步选择以下几条作为班组长选拔的基本能力，如表8所示。基于桥隧工程施工人员年龄、性别、受教育程度、工作时间等特征，桥隧施工班组长应选择年富力强的男性成员担任，年龄不宜超过55岁。桥隧施工人员受教育程度情况的统计分析表明，班组长宜具有高中及以上文化程度，以满足安全教育和班组安全管理的需求。桥隧施工属于技术性较强的工作，班组长应具有丰富的施工经验，以应对施工过程中的突况。

3.2.2班组成员配备施工班组成员是施工作业的最前线人员，保障班组成员的安全就是保障工程的安全。桥梁、隧道施工因其自身的特点，对施工班组成员的要求较高，具体如下。（1）基本原则施工班组成员应按照“新老结合、以老带新”的原则进行配备，即实行“师傅带徒弟”的方式组建班组。另外，对专业性特别强、需要持证上岗的岗位，应严格执行持证上岗，不得无证作业。班组人员配备还应坚持“熟悉”原则。来自同一地域的施工人员拥有共同的生活习惯，便于交流，故可安排在同一班组，以利于施工安全管理。（2）人员配置由于桥隧施工人员受教育程度低，结合班组安全管理及教育培训需求，建议实行“8人班组模式”：施工班组由班组长、副组长和班组成员组成；桥梁工程每个作业班组均应设置班组长；成员较多的班组可根据要求配备副组长；每名班组长或副组长管理6～7名班组成员；对于班组人数小于等于8人的，可仅设1名班组长；对于班组人数大于8人的，可设1名班组长、1名副组长；原则上，班组人数不宜超过16人，否则班组应按每名班组长管理6～7名班组成员的要求，增设副组长。（3）其他要求根据桥隧施工人员性别和年龄分布特征调研情况，施工班组成员应以男性为主，女性为辅；针对桥隧工程施工特点，桥隧施工人员年龄原则上不得超过60岁，桥梁工程中需要登高作业的施工人员不得超过55岁。另外，根据桥隧施工人员的性别比例，女性施工人员宜担任施工班组的后勤工作和辅助工作，同时可担任施工班组的安全协管员和安全宣传员，促进班组安全文化的建设。

3.3班组制度建设根据施工人员受教育程度分析，进行现场走访调研，发现桥隧工程施工班组内部管理普遍存在无管理制度、无岗位职责、无配套奖惩措施等问题，安全管理基本处于真空状态。施工企业仅与劳务分包商签订劳务分包合同，而对劳务分包商的内部管理基本不加干涉。施工班组内部管理是班组安全管理的内在要求。因此，施工班组内部管理应明确岗位职责、推行岗位（工种）责任制、制定相关安全制度（如安全教育培训制度、安全考核奖惩制度等），并严格落实相关制度，也即从制度建设、责任落实和兑现奖惩三方面加强班组内部管理。

3.3.1安全责任制基于现阶段班组安全管理现状，应完善班组安全管理体系。首先明确岗位职责，建立健全生产责任制，落实班组岗位安全职责，保证安全生产。施工单位应要求劳务分包单位制定班组岗位责任制，若劳务分包商无相关制度，则应严格执行施工企业制定的班组岗位责任制（施工班组长及班组成员），将施工现场班组管理真正纳入施工企业自身安全管理体系。

3.3.2安全管理制度施工班组安全管理制度主要包含班组安全教育培训制度和班组安全奖惩制度。施工班组人口统计学特征变量统计结果表明，桥隧工程施工班组成员从业时间较长、年龄存在老龄化趋势（桥梁施工人员）且文化程度普遍偏低，施工人员的安全意识主要源自以往的施工经验，缺乏系统性和科学性，甚至有些经验并不符合安全作业要求，这势必造成施工人员对安全行为和安全教育培训的抵触。因此，应建立适应性安全教育制度，编制适用于施工人员的安全教育培训教材。同时，应建立安全奖惩制度。通过安全奖惩，对符合施工安全的行为进行激励，对违反安全要求的行为进行惩戒，使施工人员的安全行为规范化和持续化，从而形成一种安全习惯。

3.4班组保障建设施工班组安全管理应包含相关配套及投入，包括施工作业环境、生活环境、施工人员收入及相应的劳动保护等方面。通过现场走访、问卷调查和座谈会的形式，得知施工人员对工资收入的关注最高。但当收入相差不大或收入水平下调5%而其他配套（如生活环境、作业环境等）得到改善时，90%以上的施工人员会选择到工作环境相对较好的施工项目工作。由此可见，施工人员个人安全意识在逐步增强，对安全配套设施的关注度有很大提高。因此，为提高班组安全管理，有必要保障相关配套投入，为施工班组成员提供较好的生活环境，营造安全的作业氛围，同时加强其劳动保护，尤其是在高粉尘、高噪音的隧道施工中，应配备有效的防噪音装置、防尘口罩等。

3.5班组现场控制施工现场是施工班组安全管理的重点。现场控制是施工班组安全管理中最重要的环节。现场控制包括安全防护、风险告知和安全检查。（1）安全防护。对重大风险区域进行安全防护，确保安全防护设施的有效性和可靠性。（2）风险告知。施工现场应严格落实风险源管控制度，实行风险预警和风险告知制度，使施工人员明白作业场所存在的重大风险，并引起重视。（3）安全检查。严格落实班组“三工”（工前、工中、工后）检查，以便及时发现隐患，确保安全防护设施有效、可靠，同时对施工班组成员的不安全行为进行纠正。总之，桥隧工程施工班组安全管理模式是基于施工班组人口统计学特征建立的，并将班组安全管理中现存主要问题作为该模式建立的重要方面。目前，该班组建设管理模式已在安徽在建项目桥隧工程施工班组进行试点应用。

4施工班组安全管理建议

为进一步加强桥隧工程施工班组安全管理，本文针对班组安全管理存在的问题，提出相应的对策与建议。

4.1建立班组安全管理制度施工单位应制定班组安全管理制度，并严格执行。将班组安全管理纳入施工企业安全管理体系，作为企业安全生产的重要方面，同时加强对分包单位班组的安全管理。

4.2开展班组适应性教育培训开展针对性、适应性安全教育。编制班组安全教育培训教材，采取现场教学、班前三分钟安全教育、漫画或动漫宣传、观看安全警示片、安全实操等培训方式，丰富班组安全教育形式，防止培训教育走过场，达到安全教育培训的目的。

4.3形成相对稳定的作业队伍将施工技术骨干纳入企业人力资源管理，对其进行重点培养。通过提高其社会福利、收入水平等，吸引技术力量加入企业。组建专业化作业班组，承担专业施工任务：当企业有施工任务的时候，首先完成本单位施工任务；当企业无施工任务时，可对外从事相应专业化施工，保证施工队伍相对稳定。

4.4开展班组级安全活动针对桥隧工程施工工作内容单一、施工人员与外界沟通少的现象，可不定期地组织班组级安全活动，丰富施工人员业余生活，增强施工人员的企业归属感，比如：开展心灵关怀活动，对优秀施工人员进行表彰；开展家庭关怀活动，为施工人员子女寄送贺卡等。

统计学的特征篇3

Key words： college students' mental health；UPI；characteristics differences

中图分类号：G44文献标识码：A文章编号：1006-4311（2010）35-0232-02

0引言

大学生心理健康问题日益严峻，不仅学校等教育部门为此绞尽脑汁，而且理论界也纷纷研讨防范与治理对策。戴梅竞等（1995）以医科大学生15年健康档案资料和1～4年级学生198名（男91人，女107人）为研究对象，调查分析了大学学习阶段各年级学生健康的变化规律，对其死亡、疾病、退学、休学、学习疲劳、视力、吸烟等生活习性和人格类型与特征，采用Bech-H、Scl90、EPQ个性问卷和RRT调查技术，评价大学生健康状况。发现二年级学生的身心健康最差，心理卫生问题最多，是高等学校预防保健工作的重点对象。Allen D. Kanner（1981），周生江等（2009），雒力静等（2009）的研究都表明个体的经济特征与社会特征对个体的心理影响很大。大学生特征差异的客观存在，势必会影响到其方方面面，特别是大学生心理健康方面。

1学生样本特征描述

本文问卷表是从湖南某高校随机抽选5个班级，然后由班级辅导员老师发放问卷，安排专门的时间由学生当场填写，辅导员老师对填表进行了简要的讲解，务必使学生理解。问卷表由三个部分构成：第一部分为学生基本情况调查表；第二部分为大学生健康测量表（UPI，共64个问题）；第三部分为症状自评量表（SCL－90，共90个问题）。共计发放问卷200份，全部收回，最后确认有效问卷162份，即为研究样本，其基本情况如表1所示：

样本涵盖了新生与老生、学生干部与非学生干部、城镇学生与农村学生、贫困学生与非贫困学生，具有较高的代表性。

2基于样本特征差异的大学生心理健康统计分析

首先，我们执行了样本中大学生的基本状况特征差异在UPI的得分上是否具有显著性进行了两独立样本t检验，结果发现UPI的得分在性别差异、入学时间差异、独生与非独生、是否学生干部、出生农村/城镇、贫困与非贫困方面不显著；然后，我们进行了具体问题上的两独立样本t检验，发现在某些问题上特征差异是具有显著性的。同时也采用了两独立样本非参数检验（Mann-Whitney秩和检验法），得到的结论与两独立样本t检验结果完全一致。

2.1 大学生性别差异对UPI影响的显著性检验采用两独立样本t检验方法（显著性水平为0.05）检验了性别在UPI的60个问题上是否具有显著性，结果发现在4、23、56等三个问题上男生与女生存在显著性差异，且满足方差齐性假设，如表2所示：

从表中可以看出：男生比女生更多的“关注心悸和脉搏”；男生比女生更容易“焦躁不安”；女生比男生更在乎“别人在自己背后说坏话”。雒力静等人（2009）的研究表明海南省本岛籍贯大学生与内地籍贯大学生心理健康水平没有显著性差异。男女生之间整体差异不显著,女生与男生相比在抑郁、焦虑、强迫症状、躯体化、精神病性5个因子方面存在显著性差异。这可能与女生人际交往是非多、多愁善感、易紧张、胆小有关与男生考虑问题好偏激、情绪好激动、争强好胜、易激怒有关。本文的研究结论与国内的同类研究基本一致。

2.2 新生与老生差异对UPI影响的显著性检验在UPI的60个问题上是否具有显著性，结果发现在3、15、23、53等四个问题上新生与老生存在显著性差异，且满足方差齐性假设，根据我们的统计结果得出：老生比新生更容易“拉肚子或便秘”；老生比新生“情绪起伏更大”；老生比新生更加“焦躁不安”；但新生比老生更加“对脏很在乎”。大学新生刚开始还很激动，觉得大学还挺漂亮。可是新鲜劲头一过，就觉得食堂太差，“学习上也与中学有很大的不同，老师讲课容量很大，很大知识都需要自己自学，而且学习完全靠自觉，很多大学新生难以适应。但大学老生又面临着学业、社交恋爱、毕业就业等各方面的压力，使老生更易焦躁不安等。

2.3 学生干部与非学生干部差异对UPI影响的显著性检验检验了担任学生干部在UPI的60个问题上是否具有显著性，结果发现在12、13、50、53、54等五个问题上学生干部与非学生干部存在显著性差异，且满足方差齐性假设，如表3所示：

从表中可以看出：学生干部比非学生干部更“热情和积极”；学生干部比非学生干部“人缘好受欢迎”；学生干部比非学生干部更加“对脏很在乎”；但学生干部比非学生干部更“悲观”；学生干部比非学生干部更“摆脱不了毫无意义的想法”。

2.4 城镇学生与农村学生差异对UPI影响的显著性检验检验了城市学生/农村学生在UPI的60个问题上是否具有显著性，结果发现在1、2、5、53等四个问题上存在显著性差异，且满足方差齐性假设，根据统计分析的结果可以得出如下结论：城镇学生比农村学生更“食欲不振”；城镇学生比农村学生更易“恶心、胃口难受、肚子疼”；城镇学生比农村学生更加“对脏很在乎”；但城镇学生比农村学生感觉“身体健康状况良好”。大学生无论是独生子女还是非独生子女的经济压力、生活压力、心理压力都较大，心理易产生焦虑不安等意向。多数农村大学生经济非常紧张，切实感到读书不容易，常常因为家庭经济困难，又不能为家里分忧，还要让家人负担自己上学的费用而负疚感重，易伴有自卑、多疑、焦虑等倾向。大多数农村大学生没什么社会背景，在求职择业上会比城镇大学生更难，对即将走上社会充满恐惧心理。高校对农村大学生应该充分关注。

2.5 贫困生与非贫困生差异对UPI影响的显著性检验检验了贫困生与非贫困生在UPI的60个问题上是否具有显著性，结果发现在24（容易动怒）、29（缺乏判断）等两个问题上存在显著性差异，且满足方差齐性假设，即非贫困生更容易动怒，贫困生更缺乏决断能力。与之相类似的是，周生江等人（2009）研究认为经济压力、学习压力、家庭变故是影响贫困大学生心理健康的三大主要压力。

2.6 大学生特征差异在“是否有过轻生念头”问题上的显著性检验特别需要注意的是，在此项量表的162名大学生测量中，有21人回答“有过轻生念头”，占参加测量学生总数的12.96%，比例较高，需要引起极大的关注。然后我们进行了相应的t值检验，发现了男生与女生、新生与老生在“有过轻生念头”上存在显著性差异，在是否担任学生干部、是否独生子女、是否为贫困生等方面不显著，且满足方差齐性假设。大学生正处在社会的大变革时期，面临的机遇和挑战很多，心理上要承受多方面的压力。文化基础差，学业不顺，学习受挫，失恋、爱情受挫是大学生常见的轻生原因。值得高校注意的是，近期许多大学生甚至硕士博士轻生。

3结论与建议

大学生心理健康状况令人堪忧，而大学生特征差异对大学生心理健康的影响研究具有重要的理论价值与现实意义。本文采用两独立样本t检验统计方法，对UPI心理问题在大学生特征差异上是否具有显著性进行了检验。结果发现一些有意思的结论：学生干部比非学生干部更“热情和积极”；学生干部比非学生干部“人缘好受欢迎”；非贫困生比贫困生更“容易动怒”；但贫困生比非贫困生更“缺乏决断能力”。表明了大学生的特征差异对于其心理健康有显著地影响，而且各个特征对心理健康影响的方面与程度有很显然的不同，这就为大学生心理健康问题研究提供了新的研究视角与有价值的参考建议。本文为此提出了相关的建议：①高校必须建立相应的心理健康预警干预系统；②要针对大学生的特征差异，进行心理预警及心理辅导工作，认识到每一位大学生的心理优势与心理劣势，从而使心理教育工作更具成效；③高校要建立健全大学生心理健康信息库，及时输入相应信息，及时跟踪分析，密切关注大学生心理健康问题，尽早识别心理健康高危群体，采取相应防范措施。本文的研究不足首先是限于财经院校，研究样本都来自经济管理类的文科大学生，缺乏对理工科大学生心理的分析，其次研究样本还不大，这些还有待于将来作进一步深入研究。

参考文献：

统计学的特征篇4

引言

学习理论和信息技术的不断发展，促成了协同学习理论和技术的出现。文献[1]针对计算机支持的协同学习（CSCL）与个体学习存在的问题,提出了个性化协同学习环境（ICLE）的概念。个性化实际上是针对协同学习过程中，往往存在为了满足协同目标的达成而牺牲个体目标的问题而提出的，个性化技术是目前信息检索和信息系统集成的研究热点。协同学习以系统协同思想和知识管理为基础，适应知识与技术的发展，对传统学习理论进行了拓展。[2]

一协同学习系统工作模式

协同学习技术是为了解决在异构分布式环境下存在大量重复开发的学习系统可移植性和可扩展性差的问题而产生的集成化技术，协同学习技术以知识可视化技术、计算机支持的协同学习技术、智能技术和模式识别技术为支撑。从单个系统的功能来看，不能满足学习者学习需求，更不能很好地体现协同学习的优势。显而易见，多个学习系统协同为学习者提供服务是解决目前系统健壮性和可移植性问题的首选方案。但是，多个系统协同工作带来的问题也很多，例如：来源于多个系统的学习者特征信息如何规约和抽取，并形成统一的学习者模型库；多个系统之间如何达成有效的通信机制；如何根据学习者行为的动态变化，维护和更新用户模式库并动态集成学习资源；如何建立统一的学习资源视图，使学习者通过学习资源门户轻松进入协同学习系统，并在系统智能导航下完成学习，以获得成就动机等等。面对诸多需要解决的理论和技术层面的问题，本文认为实现协同学习个性化的关键在于建立在学习者特征和行为的信息融合基础之上的学习者模型构建和重用。我们可以把协同学习系统理解为：在系统协同思想指导下的一种计算机支持的协作学习系统。该系统并不开发学习资源和功能化模块，而是在底层异构分布式学习系统的基础上，设计和开发一个统一资源视图为基础的学习门户，学习者或学习者群（群体学习者）进入学习门户后，通过统一资源视图调用分布式学习资源，其实质是多源学习系统协作工作为学习者学习提供服务，并在个性化技术支持下完成个体学习目标，下图表示独立学习者或群体学习者通过协同学习系统学习的过程。

1 协同学习门户：完成学习者注册、认知需求发送、学习资源表示和学习效果呈现等功能。

2 协同化中间件：包括分布式学习系统的集成、各系统学习资源调度和包装、学习资源统一视图等重要构件。其中，分布式系统的异构带来的通信障碍是解决学习系统集成的关键问题；如何将分布在各独立学习系统中的知识进行标识和重构则是学习资源调度层需要解决的关键问题；在统一资源视图层，学习者通过学习门户的交互式操作，即可选择不同的学习模块，完成学习目标。

如图1所示的学习过程克服了CSCL中个体学习目标和协同学习目标冲突的问题，同时降低了系统开发成本、使多个独立学习系统的资源和功能可重用，大大降低了学习系统开发的成本，提高了系统协同工作的能力。

二面向学习者特征――行为数据融合的协同学习系统个性化方法

1 数据融合（Data Fution）及其方法

（1）数据融合及其层次

数据融合是一个多级、多层面的数据处理过程,主要完成对来自多个信息源的数据进行自动监测、关联、相关、估计及组合等处理。[3]数据融合的研究起源于19世纪70年代声纳信息融合的研究，后来在军事领域得到广泛深入的研究，并在各发达国家的军事系统中起着很重要的作用。随着研究与应用的增加，其研究与应用早已扩展到各个领域之中，如交通管制、医疗诊断、机器人导航、安全控制等领域。[4]数据融合按信息抽象程度可分为3个从低到高的层次,主要有数据级融合、特征级融合和决策级融合。

（2）数据融合的方法

数据融合是一种数据综合和处理技术，是许多传统学科和新技术的继承和应用，如通信、模式识别、不确定性理论、信号处理、估计理论、最优化技术、计算机科学、人工智能和神经网络等。数据融合方法主要分为3大类。

直接对数据源操作。如加权平均、神经元网络等。

利用对像的统计特性和概率模型进行操作。如卡尔曼滤波、贝叶斯估计、多贝叶斯估计、统计决策理论等。

基于规则推理的方法。如模糊推理、证据推理、产生式规则等。

2 面向学习者特征-行为数据融合的协同学习系统个性化方法

协同学习技术的关键在于解决系统和模型的互操作问题，其中web服务技术很好地解决了异构系统的透明访问问题，模型互操作是目前的亟需解决的问题。大多数研究采取的方法是利用本体技术，对已有系统学习者模型进行规约和融合，形成学习者模型库并重用学习者模型，从而实现协同学习的个性化。[2，5]本文采用数据融合技术来解决模型互操作的问题，相对而言，数据融合技术的仿生特性更符合学习过程中学习者对信息进行内化和顺应的过程。本文中将学习者特征规定为学习者风格，这类数据可有学习者在进入系统时注册信息中抽取；学习者行为则是对学习者学习过程的跟踪和记录，在电子商务领域，已存在大量对用户行为的研究。[6-8]文献[9]采用C/S架构实现了课件学习过程的跟踪，用来实现对参加远程学习的用户进行过程性评价。其中客户端软件是一个能够播放光盘、网络课件, 能够对学员光盘、网络课件学习的过程进行记录跟踪并能将学习记录与服务器同步的IE内核浏览器，服务器端接收并存储客户端上传的有效的学习过程跟踪记录, 并将学习记录与客户端和LMS远程教育平台同步。服务器端采用了MIF（Education Management Information System Interoperability Framework，教育管理信息系统互操作框架）规范。本文在其基础上扩展了学习者特征信息的融合，并将其用来形成学习者模型库，从而实现多个学习系统用户模型的重用，学习行为与学习特征数据融合中间件框架如图2所示：

从现有分布式学习系统和个性化学习门户两个方向收集学习者特征数据和行为数据，通过学习者特征库和学习者行为库的数据融合形成用户模型库，用户模型库可更新和重用。

融合数据需同步到各分布式学习系统，用来向学习者提供个性化服务。

三面向学习者特征-行为信息融合的协同学习系统框架

学习者特征和行为数据融合的目的是形成能被重用的学习者模型，从而使分布式学习系统更好地为学习者提供协同化的个性化服务。本文提出的协同化中间件和数据融合中间件中各单元的数据接口和通信机制由于篇幅所限，将另文详述。本文最后提出一个面向学习者特征-行为信息融合的协同学习系统框架，该框架将协同化中间件和数据融合中间件结合起来，将分布式系统系统工作技术与个性化技术结合起来，用以完成协同学习个性化的教育理念。框架如图3所示。

从图3可以看出：

第一，学习者可以从个性化协同学习门户或者分布式学习系统完成学习；个性化协同学习门户类似一个联邦体的Agent；

第二，学习者若通过个性化学习门户完成学习，则首先向统一资源视图提出服务请求，然后由统一资源视图向学习系统包装层发送资源需求信息，学习系统包装层则向分布式学习系统搜索相关学习资源，并将其标记、地址等信息一并发送至学习资源调度层，学习资源调度曾则发送相关信息到统一资源视图层，学习者则通过门户访问到这些来自分布式学习系统的学习资源，并完成与这些学习资源的交互及其他学习者的交互。这里的统一资源视图与SOA架构中的服务注册中心的功能相似；

第三，学习者在注册、学习过程的各种信息通过数据融合中间件的抽取、处理、同步，使该系统能够更好地体现个性化学习，学习者模型的重用及其更新，是该系统开发的关键和难点；

第四，该系统的特点是将协同学习技术及个性化技术结合起来，同是系统本身并不参与学习资源的开发和学习内容的建设，这些资源和功能均在底层的分布式系统之中。

参考文献

[1] 祝智庭等.协同学习-面向知识时代的学习技术系统框架[J].中国电化教育,2006,(4):5-9.

[2] 刘均等.个性化协同学习环境本体的研究[J].西安交通大学学报,2003,(2):184-187.

[3] 熊凌,张凯.数据融合及其应用[J].浙江工业大学学报, 2005,(6):145-147.

[4] 刘云生,彭建平.信息融合的研究[J].计算机工程与应用, 2005,(3):181-183.

[5] 王真星等.基于本体的协同知识交流模型[J].计算机工程, 2007,(1):1-3.

[6] 傅关友,朱征宇.个性化服务中基于行为分析的用户兴趣建模[J].计算机工程与科学,2005,(12):76-78.

统计学的特征篇5

一、现代企业导入VI系统的必要性与重要意义

现代企业的竞争较为复杂，一般的来说有资源和信息竞争，另外还有一个比较重要的因素就是企业的视觉形象设计，企业形象设计在企业之间的竞争中非常重要，它对外可以树立企业综合形象，增强企业品牌意识，对内可以提升企业的动力和凝聚力，为企业的综合发展打下强有力地基础。

企业可以通过VI系统的开发实现提升企业品牌形象的目的，对内征得员工的认同感，归属感，加强企业凝聚力，对外树立企业的整体形象，资源整合，有控制的将企业的信息传达给受众，通过视觉符号，不断的感染受众的意识，在这个过程中获得广泛的认同感。

放眼目前世界上大多数一流的企业，都无一例外的建立了一整套完善的企业视觉形象系统，这些视觉形象设计的高度一致性，强大的视觉感染力增强了人们对企业的认同感，使这些企业能够在目前竞争激烈的商业战争中脱颖而出，无疑完善统一的视觉形象系统开发对企业的形象宣传更为有利。

我国珠三角很多民营企业由于国家政策的关系，能够在经济发展之初就很好的向国外优秀企业学习，借鉴国外优秀企业的发展之路，导入视觉形象设计系统，在企业的发展中起到了很好的作用，对现代化企业早日与国际接轨，做大做强起到了较好的作用。

二、珠三角本土校园视觉形象建设中VI系统导入的市场调研

珠三角作为我国经济较为发达的地区，毗邻港澳和特区城市，经济上发展迅速，这从某种程度上来讲为文化事业的繁荣打下了比较坚实的基础，珠三角随着产业升级，经济转型，大批民营私企为繁荣经济做出了比较大的贡献，民营私企发展到一定程度，产值和利润的上升空间就产生了瓶颈，投资方就必须从发展企业的文化入手，综合考虑开发和建设企业自己的CI 文化，从而使企业良性快速的发展。

私企VI系统开发建设作为企业文化建设中的重要环节必须引起相当的重视。企业在开发VI系统前要做足市场调研工作，市场调研要设置好相关问题，将需要解决的热点问题通过设置问卷，讨论调查等方式来讨论清楚，将企业的经营理念通过各种宣传的手段广而告之，让其深入人心，取得消费大众的内心共鸣和认可，进而结合调研的结果综合考虑设计开发出一整套符合自身企业文化特色的视觉形象系统。调研工作还要注意调研采样的广泛性和代表性，能够客观真实的反映出受众对该品牌的心理预期和诉求。

珠三角民办高校大多都是由民营企业投资兴建的，企业无形当中不可避免的会把自己的企业文化以及管理理念带入高校的教育管理模式之中来，这些学校校园视觉形象的设计及开发必然要考虑投资方企业的经营理念及综合形象，其次该地区校园VI系统的导入还要充分考虑该地区的地域文化现象，最好吸收该区域的本土文化，大胆设计出既有本土文化风格又不脱离时代气息的视觉形象，这样才会设计及开发出具有浓厚地方特色的校园视觉形象系统来。

三、本土化校园VI系统建设及导入的方法

（一）注重研究本土传统文化及经济发展现状

本土化的校园VI系统建设必须注重研究本土的传统文化以及经济发展的现状。首先本土的校园根植于本土的地域文化圈中，其发展受到地域经济的影响比较大，政府政策的影响、校园地域环境的影响、本土招生生源及就业企业的影响，这些综合因素都会影响到一个学校的发展，作为民办院校这种情况更为突出。校园文化的建设不可能脱离本土文化而存在。以珠三角民办高校为例，珠三角是岭南文化的发源地，人杰地灵，独特的环境滋生了岭南文化，该地区的民办高校视觉形象设计最好要深入研究本地的民俗民风，挖掘本地区岭南文化的精髓，结合自身的办学理念和企业文化来开发视觉形象系统。其次该地区经济发展迅速，艺术设计产业在全国较为发达，港、澳、台开放的多元文化对该地区设计思潮冲击较大，他们的兼容并蓄的设计思潮传统也应该为珠三角设计企业所学习和吸收，在开发本土企业视觉系统方面值得深入探索。从某种程度上来讲现代经济的发展和本土文化的开发可以一起发展繁荣，这两种情况互相促进并不存在矛盾。

（二）VI系统的开发注重传承企业文化理念

一个企业的文化理念是该企业赖以生存的重要条件，良好的企业文化理念可以让品牌意识深入人心，大众对该企业的认可度广泛提升，给企业带来丰厚的经济效益。企业视觉形象设计和企业文化理念它们之间是相互依存、相互促进的关系。珠三角民办高校的视觉形象系统开发更需要渗透投资企业的企业文化理念，投资方自然希望能够在办教育的过程中把自己的企业文化理念带入到高校教育中去，进而起到宣传企业树立品牌形象的目的，以更好的为地方经济发展服务，承担更多的社会责任。

（三）VI系统的开发要联系最新的科技手段和成果

传统的企业VI系统开发只注重丰富的企业内涵延伸，注重标志设计的高度辨识性，强调企业文化特色，其实这个做法比较片面，一个现代化的企业的发展和高科技的关系应该比较紧密才行，尤其作为以发展理工学科为主的民办高校更应该突出这一点，高校除了育人这个功能以外还兼有研发和传播高新科技成果这个功能，那么在其自身的视觉形象系统开发方面更要注意，寻求高端新颖的设计材料和一流的设计团队，注重视觉形象设计的多样化推广，要注重设计对象和其他产品的联系，让设计对象有较好的外延性和衍生性，在开发设计过程中注重学科的交叉性。

四、珠三角民办院校VI系统设计的美学形式特色（以广东科技学院为例）

珠三角众多民办高校大多都是由民营企业投资兴建的，它们承担着为该地区经济发展而培养各行各业人才的重要作用。这些高校大多数在开发现代化的VI系统方面做得还不够，很多只是拥有最基本的学校标志设计，在具体的应用设计部分做的拓展还很少，有的应用设计部分的使用非常的不规范，存在着多套不同风格的应用方案，或者各个部门各自为政，藉由各种集体活动由非专业设计师设计了很多五花八门乱七八糟的应用设计，使观众产生视觉认知的混乱，这其实对高校的品牌形象树立是一种严重的破坏，是一种设计倒退现象，目前还没有引起广泛的重视。

广东科技学院是珠三角一所民办应用型本科院校，该校2011年升格为普通本科院校，学院借助这个机会，从众多应征稿件中选出了能够体现自身办学理念特色的标志设计，该标志设计以蓝色圆形设计为主，体现出科技发展和展望未来两个理念，含义较为丰富，也较好的把投资方和学院的关系做了全方位的诠释。从构成上看，外圆和内部的弧形发射线设计使图形动静结合，延伸了视觉的空间感和想象力，蓝色和白色构成使观众视觉心理上联想到高科技，标志设计的可移植性和衍生性比较好，这些为整合学院资源进行应用部分拓展设计打下良好的基础。

参考文献：

[1]李泽厚.美的历程.天津社会科学院出版社，2001年版.

统计学的特征篇6

[基金项目] 浙江省自然科学基金项目（Y2110991）

[通信作者] *严云良，副教授，从事数理医药学研究，Tel：（0571）86633116，E-mail：

祖国医学治疗血瘀证的历史悠久，经验独到，其中不乏有许多经方、名方沿用至今。桃核承气汤为《伤寒杂病论》中辨治瘀证的重要基础代表方，具逐瘀泄热之功效，现代研究表明，该方及其加减方能降低血黏度、胆固醇、纤维蛋白原和血糖、降低血小板黏附机能而不影响血小板数量[1-2]，并能显著扩张血管、改善微循环[3]。在中医药理论指导下，项目组前期已对桃核承气加减方进行了剂型改良，根据现代制药工艺精制成了祛瘀清热颗粒剂。前期研究显示，祛瘀清热颗粒剂可有效改善血瘀家兔体内血液流变学和抗氧化作用。项目组拟在对其质量控制、制备工艺以及药效研究[4-6]的基础上，进一步开展药代动力学和药效物质的相关研究。

中药复方药代动力学研究常套用基础药代动力学的数学模型，多为房室、非线性以及统计矩模型，然而中药复方成分复杂，各有效成分的作用途径、对机体的影响各不相同，且它们之间也会相互影响[7]。因此，对于中药复方而言，仅以单一活性成分（效应）为指标并采用传统数学模型进行药代动力学研究，尚不能满足中药复方整体效应的体现，不利于进一步研究药物所发挥的整体作用、整体药效的作用机制及物质基础[8]。总量统计矩分析法的原理是根据统计矩学中的多维随机向量求数学期望及方差的思路来寻找药物中多个成分的代谢动力学中心，该法以统计矩分析法为基础，并以药-时曲线下面积为主要计算依据，其不受房室模型等数学模型的限制，适用面广[9-10]，能整合多成分的动力学参数，表达多成分体系的总量药动学行为，可弥补传统药动分析方法仅能实现单一成分分析的不足，在当前缺少中药复方药代动力学多成分信息处理方法的情况下，该方法不失为一种行之有效的分析方法。

大黄酸和大黄酚为祛瘀清热颗粒中君药大黄的主要活性成分，具抗肿瘤、抗炎、抗血栓形成、抑菌以及抗氧化等作用[11-14]，有关此2个成分的研究一直以来较受关注。本文拟以大黄酸和大黄酚为切入点，运用总量统计矩分析方法，对祛瘀清热颗粒中此2个成分在正常与血瘀2种不同机体状态下家兔体内的血药浓度-时间数据进行处理，并计算相应的总量统计矩药动学参数，拟获得相应的总量药动学参数，为进一步评价祛瘀清热颗粒的总量药动学特征提供依据。

1 原理

统计矩分析法属于非房室模型分析方法，其主要有以下几种参数[15]。

零阶矩（AUC）：为血药浓度时间下曲线面积（时间从零到无限大），公式为（1），式中t为时间，C为经时血药浓度，k为消除速率常数，i为采血点数。 AUC=∫∞0Cdt=∑n i=1（Ci+Ci-1）（ti-ti-1） 2（1）

一阶矩（MRT）：为平均滞留时间，可定义为公式（2）。

MRT=∫∞0tCdt/∫∞0Cdt=AUMC AUC（2）

（AUMC=∫∞0tCdt=∑n i=1（tiCi+ti-1Ci-1）（ti-ti-1） 2+tnCn k+Cn k2）

二阶矩（VRT）：为平均滞留时间的方差，其公式为（3）。

VRT=∫∞0t2Cdt/AUC-MRT2=S AUC-（AUMC AUC）2（3）

（S=∑n i=1（ti2Ci+ti-12Ci-1）（ti-ti-1） 2+tn2Cn k+2tnCn k2+2Cn k3）

总量统计矩分析法可根据统计矩学中的多维随机向量求数学期望及方差的思路来寻找药物中多个成分的代谢动力学中心。中药复方属多成分体系，其总量药代动力学可以根据统计矩原理，建立中药复方总量零阶矩、总量一阶矩、总量二阶矩，并由此推导出如总体表观半衰期、总体表观消除平衡常数、总体表观清除率以及总体表观分布容积等总量药代动力学表观参数[16]，整合各单个成分的各药动学参数，从而实现微观各成分药动学参数与宏观总量药动学参数的统一。

总量统计矩分析法可克服传统药代动力学研究受诸多数学模型的局限，可将复方各成分的动力学参数整合，寻找到多成分的动力学总量中心点及离中心点的方差，即为总量一、二阶统计矩。假设中药复方为一个由n个单体成分群构成的体系，其中m个成分服从线性药代动力学，i个成分分别服从一、二、三室模型，N个成分符合非线性药代动力学，S个成分为不规则药动学模型，按照统计矩计算原理，可将各单成分药代动力学研究模型整合起来构成统计矩复合函数模型参数[17]，即复方多成分总量药动学参数，总量零阶矩、总量一阶矩、总量二阶矩等参数公式（4）～（10）如下。

总量零阶矩：AUCt=∑n j=1AUCj（j代表各成分）（4）

总量一阶矩：MRTt=∑n j=1MRTj・AUCj ∑n j=1AUCj（5）

总量二阶矩：VRTt=∑n j=1（MRTj2+VRTj）・AUCj ∑n j=1AUCj-MRT2t（6）

总体表观半衰期：t1/2，t=-ln1 2MRTt（7）

总体表观消除平衡常数：kt=1/MRTt（8）

总量清除率：CLt=Xt ∑n j=1AUCj（Xt为总给药量）（9）

总体表观分布容积：Vt=CLt・MRTt（10）

2 材料

2.1 仪器 Waters-1525-2998高效液相色谱仪（美国沃特斯公司）；0412-1型高速离心机（上海手术器械厂）；BS110S电子分析天平（北京赛多利斯天平有限公司）；WH-861涡旋混合器（苏州欧倍科学仪器有限公司）；HH-S型恒温水浴锅（巩义市英峪予华仪器厂）；DHG-9035 热风循环烘箱（上海林频仪器设备有限公司）。

2.2 样品祛瘀清热颗粒（批号12050502）由浙江中医药大学药学院制剂室提供；大黄酸对照品（批号0757-200206）及大黄酚对照品（批号110796-200716）均购自中国食品药品检定研究院；高分子右旋糖酐（批号091125，相对分子质量20万）购于上海丽臣生物科技有限公司；肝素钠注射液（批号100501）购于上海第一生化药业有限公司；色谱纯甲醇（批号20100401）购于天津四友精细化学品有限公司；分析纯磷酸（批号10015418）购于国药集团化学试剂有限公司；分析纯高氯酸（批号20090702）购于上海金鹿化工有限公司；实验用水均为纯净水。

2.3 动物普通级正常家兔，（2.0±0.2） kg，由浙江中医药大学实验动物中心提供，动物使用许可证号SYXK（浙）2009-0042。购买后由浙江中医药大学实验动物中心严格按照实验动物的饲养要求管理饲养动物。适应环境饲养1周，饲喂营养颗粒饲料，自由饮水，室内温度（22±2） ℃，相对湿度50%～60%。实验前禁食12 h，期间自由饮水。

3 方法与结果

3.1 色谱条件 Hypersil BDS C18色谱柱（4.6 mm×250 mm，5 μm）；流动相为甲醇-0.1%磷酸（79∶21）；流速1.0 mL・min-1；柱温36 ℃；进样量10 μL。

3.2 血瘀家兔造模方法家兔适应性培养后，于耳缘静脉注射10%高分子右旋糖酐注射液（5 mL・kg-1），早晚各注射1次，连续2 d，并于第3日上午再次注射10%右旋糖酐注射液1次，每次注射平均3 min内注完。实验时筛选已成功造成血瘀模型的家兔5只，作为血瘀家兔给药。

3.3 药液的制备与给药称取祛瘀清热颗粒（含大黄酸417.18 μg・g -1，大黄酚823.35 μg・g-1）适量，以纯净水溶解，超声10 min，配制成含浓度0.4 g・mL-1的混悬药液。实验时，家兔预先禁食12 h，以5.00 mL・kg-1的剂量单次灌胃给药。

3.4 家兔全血采集分别于给药后5，10，15，20，30，45，60，75，90，120，240，360，480 min从正常和血瘀家兔的耳中动脉取血3.0 mL，置于肝素化离心管中，摇匀，抗凝后，4 ℃ 4 000 r・min-1离心15 min，取上层血浆，-20 ℃保存。

3.5 血浆样品前处理于5 mL 具塞离心管中加入给药后血浆1 000 μL，再加入3 mol・L-1高氯酸溶液500 μL除蛋白，涡旋30 s后，70 ℃水浴加热水解30 min，冷却，加入乙醚2 mL，涡旋混合3 min，4 000 r・min-1离心15 min，精取乙醚层（最上层）于空离心管，挥干，残渣用50 μL 色谱甲醇溶解，涡旋10 s，4 000 r・min-1离心5 min后取上清液进样。

3.6 药-时曲线采用已建立的HPLC[4-5]测定正常与血瘀模型2组家兔血浆中大黄酸与大黄酚的经时血药浓度，每组家兔各5只。分别以大黄酸和大黄酚的质量浓度X（mg・L-1）为横坐标，以相应峰面积Y为纵坐标绘制标准曲线，得回归方程如下。大黄酸：Y =11 887X-2 355.5 （r=0.999 9）。大黄酚：Y =10 874X +337.53 （r=0.999 1），则血浆中大黄酸在1.313～105.0 mg・L-1，定量下限为1.313 mg・L-1；大黄酚在2.125 4～ 2.5 mg・L-1呈良好线性关系，定量下限为2.125 mg・L-1。两有效成分的平均药-时曲线见图1，HPLC色谱图见图2。

3.7 精密度试验精密吸取适量对照品溶液于5 mL具塞离心管中，挥干甲醇后加入空白血浆500

A.正常家兔；B.血瘀家兔。

图1 灌胃祛瘀清热颗粒后家兔体内大黄酸与大黄酚药-时曲线

Fig.1 Mean concentration versus time profiles of rhein and chrysophanol in rabbits after oral administration of QYQRG

A.空白血浆；B.加大黄酸和大黄酚对照品后的空白血浆；C.灌胃QUQRG后的血浆样品；1.大黄酸；2.大黄酚。

图2 大黄酸，大黄酚HPLC图

Fig.2 HPLC chromatograms of rhein and chrysophanol

μL，按照3.5项方法制备高、中、低3个浓度的质控样品，每个浓度各6份。分别测定高、中、低3个浓度样品中大黄酸与大黄酚的峰面积，并分别计算其日内、日间精密度。结果大黄酸与大黄酚的日内和日间精密度均小于15%，其中大黄酸3个质量浓度（94.50，52.50，2.625 mg・L-1）的日内精密度分别为2.3%，6.7%，9.5%，日间精密度分别为4.6%，6.7%，5.8%；大黄酚3个质量浓度（27.40，25.50，4.250 mg・L-1）的日内精密度分别为4.7%，4.7%，6.6%，日间精密度分别为5.3%，6.6%，6.0%，结果均符合《化学药物非临床药代动力学研究技术指导原则》要求。

3.8 提取回收率试验精密吸取适量对照品溶液于5 mL具塞离心管中，挥干甲醇后加入空白血浆500 μL，按照3.5项方法制备高、中、低3个浓度的质控样品，每个浓度各6份。分别测定高、中、低3个浓度样品中大黄酸与大黄酚的峰面积，并计算其提取回收率（以处理后样品浓度值与处理前样品浓度值的比作为提取回收率）。结果显示大黄酸3个质量浓度（94.54，52.50，2.625 mg・L-1）的提取回收率分别为95.01%，100.3%，104.0%，其RSD分别为2.2%，8.0%，8.5%；大黄酚3个质量浓度（37.40，25.50，4.250 mg・L-1）的提取回收率分别为100.6%，101.2%，110.0%，其RSD分别为8.8%，4.4%，8.7%，结果均符合《化学药物非临床药代动力学研究技术指导原则》要求。

3.9 总量统计矩分析结果根据统计矩的药动学参数（零阶矩AUC、一阶矩MRT、二阶矩VRT）以及总量统计矩的定义，计算祛瘀清热颗粒2个有效成分的总量统计矩药动学参数。具体计算方法为：分别将家兔的各采血点两有效成分的血药浓度代入公式（1）～（3），算得各家兔两成分的零、一及二阶矩参数值后，再将所得零、一及二阶矩参数值分别代入相应公式（4）～（10），即得各总量统计矩的药动学参数值，结果见表1。

如表1所示，血瘀组的VRTt与正常组相比具有显著性差异（P

家兔相比，大黄酸和大黄酚在血瘀家兔体内的入血量高于正常家兔，在体内停留的时间相对变长，吸收相对更好，释放更快。此外，血瘀家兔kt，CLt小于正常组，t1/2t大于正常组，提示两有效成分在血瘀家兔体内的消除速度相对较慢。

4 分析与讨论

建立中药复方成分总量的药代动力学参数体系可将中药复方各成分的药代动力学参数整合起来，寻找到多成分的药动学总量中心点及离中心点的方差，总量统计矩数学模型及其参数，能较客观地描述中药复方整体的量变行为[18-21]，为最终阐明中药复方作用的量-时-效关系，正确指导中药复方临床个性化用药提供理论依据。

根据统计矩的加合性原理可对单成分药代动力学的统计矩参数进行加合计算，获得一系列总量统计矩药动学参数：总量零阶矩AUCt是一个反映量的函数，也是一个常被用于评价药物吸收程度的重要指标；总量一阶矩MRTt为平均滞留时间，是一反映速度的函数，能够反映各药物分子在体内停留的平均时间；总量二阶矩VRTt为平均滞留时间的方差，属于较高阶的矩，可反映各药物分子在体内平均滞留时间的差异；总体表观半衰期t1/2t与总体表观消除平衡常数kt均是反映药物分子在体内消除速度的常数；总体表观分布容积Vt显示药物分子在体内分布的广窄程度；而总体表观清除率CLt则表示药物分子从血中被清除的效率。本文总量统计矩分析结果提示，与正常家兔相比，灌胃祛瘀清热颗粒后大黄酸与大黄酚在血瘀家兔体内的总入血量量更大，吸收和释放的时间变短，体内滞留时间变长，消除相对减慢。

本文运用总量统计矩分析法对祛瘀清热颗粒中大黄酸与大黄酚在正常与血瘀2种不同机体状态下家兔体内的总量药代动力学特征进行了评价，获得了相应的总量药动学参数，表明总量统计矩可整合2个有效成分的药代动力学参数，能表达祛瘀清热颗粒中这2个有效成分整体的药代动力学行为，所得参数能作为该颗粒剂后续开发利用的参考依据。本研究可为进一步研究祛瘀清热颗粒的体内代谢过程及其与药效的相关性提供参考资料，同时也为相关中药复方的药代动力学研究提供参考。

[参考文献]

[1] 唐凯. 抵当汤等对血液流变性异常大鼠模型的影响[J]. 浙江中医杂志，1988，23（7）： 319.

[2] 龚传美，管喜文，周东沈，等. 桃仁承气汤对动物血液系统的影响[J]. 中成药，1997，19（11）： 29.

[3] 李桂芝，龚传美，管喜文. 桃仁承气汤对小白鼠耳廓肠系膜微循环的影响[J]. 医学高等专科学校学报， 1998， 26（4）： 60.

[4] 吴巧凤，戴晓燕，文欣欣. HPLC 法测定祛瘀清热颗粒剂中蒽醌类成分[J]. 中成药，2012，34（5）：857.

[5] 严云良，何昱，余陈欢，等. 基于总量统计矩分析法的祛瘀清热颗粒剂HPLC指纹图谱研究[J]. 中华中医药杂志，2011，26（6）： 1419.

[6] 严云良，张东亮，文欣欣. 祛瘀清热颗粒的吸湿性研究及数据分析[J]. 数理医药学杂志，2011，24（4）： 445.

[7] 周丽娟，许利平，陈慧娟，等. 中药复方药代动力学常用研究方法评价[J]. 中华中医药学刊，2007，25（5）：1041.

[8] 郑世瑞，李俊，宋珏. 中药复方药动学研究的新思路[J]. 安徽医药，2010，14（11）：1243.

[9] 贺福元，邓凯文，刘文龙，等. 中药复方多成分体系群体药物动力学：总量统计矩数学模型及参数计算研究[J]. 中国中药杂志，2011，36（20）：2866.

[10] 黄胜，贺福元，刘文龙. 总量统计矩相似度法对左金缓释片多成分释放相似度的评价研究[J]. 中成药，2009，31（1）：35.

[11] Lee M S， Cha E Y， Sul J Y， et al. Chrysophanic acid blocks proliferation of colon cancer cells by inhibiting EGFR/mTOR pathway[J]. Phytother Res， 2011， 25：833.

[12] Legendre F， Bogdanowicz P， Martin G， et al. Rhein， a diacerhein-derived metabolite， modulates the expression of matrix degrading enzymes and the cell proliferation of articular chondrocytes by inhibiting ERK and JNK-AP-1 dependent pathways[J]. Clin Exp Rheumatol，2007， 25， 546.

[13] Kim S J， Kim M C， Lee B J， et al. Anti-inflammatory activity of chrysophanol through the suppression of NF-κB/caspase-1 activation in vitro and in vivo[J]. Molecules， 2010， 15：6436.

[14] 应卫星，陈华，李荣洲.大黄酸联合吡格列酮对大鼠非酒精性脂肪性肝炎治疗作用机制的探讨[J].中国现代应用药学，2012，29（7）：578.

[15] 王广基. 药物代谢动力学[M]. 北京：化学工业出版社，2005：97.

[16] 贺福元，罗杰英. 中药复方动力学数学模型――总量统计矩法的研究[J]. 世界科学技术――中医药现代化，2006，8（6）：13.

[17] 贺福元. 中药复方药物动力学数学模型的建立及对补阳还五汤的研究[D]. 成都：成都中医药大学，2006.

[18] 贺福元，罗杰英，邓凯文，等. 中药（复方）药动学研究现状及研究方法探讨[J]. 中草药，2005，36（10）： 1582.

[19] 贺福元，邓凯文，石继连，等. 中药多成分体系宏观质量表征的数学模型建立及实验研究[J]. 中国中药杂志，2011，36（22）：3096.

[20] 周晋，邓凯文，段晓鹏，等. 指纹图谱总量统计矩分析法参数的计算及积分条件的确定[J]. 中华中医药学刊，2012，30（3）：505.

[21] 贺福元，邓凯文，刘文龙，等.中药复方药物动力学总量统计矩法的实验验证研究[J].中国中药杂志，2013，38（2）：253.

Total quantity statistical moment analysis on pharmacokinetics of rhein and

chrysophanol after oral administration of Quyu Qingre granules in

normal and acute blood stasis rabbits

YAN Yun-liang， DAI Xiao-yan

（Zhejiang Chinese Medical University， Hangzhou 310053， China）

统计学的特征篇7

1 搜索系统的实现思路

开发一套系统实现语义搜索功能，包括中文分词、语义解析和搜索、以及机器自学习等。系统采用算法将用户上行短信与上千种业务分类或其他数据进行关联，并将用户上行短信归入某一类或几类业务。通过对特征词的选取，以及每个特征词对业务搜索分类的贡献值进行筛选，将高于阀值的特征值作为联合概率计算的因子，业务匹配成功与否是通过一组特征词的关联度计算得到的，从而避免了关键字的嵌套交叉问题。同时随着用户的不断使用，有更多的上行数据提取特征，通过对特征指示性概率的反复迭代计算和训练测试，实现机器自学习成长的过程，从而实现对业务指令的同义词、近义词、错别字、生僻字等语义智能识别和业务搜索匹配。

朴素贝叶斯算法实现业务搜索：

贝叶斯分类算法是一种广泛应用的分类算法，应用于文本分类时，通过计算文本属于每个类别的概率P(cj|dx)，将该文本归为概率最大的一类，计算P(cj|dx)时利用贝叶斯公式。朴素贝叶斯分类算法即Naive Bayesian，它建立在“贝叶斯假设”的基础之上：假设所有的特征之间互相独立。实际上，在生活中这种独立性很难存在，但从目前的实验结果看来，基于这个假设的简单贝叶斯分类算法的效果较好，而且计算简单。

针对每一个业务指令，建立一个对应的目标短信和非目标短信关键词的贝叶斯概率模型。其大体思想是，在已知的可以匹配到业务清单中服务指令的分类的短信（我们称为目标分类短信）中，通过一些关键词出现的频率来取得一个特征，可运用贝叶斯公式，生成一个“目标服务指令指示性概率”。

根据客户上行短信中所包含的一组词，可以用另一个简单的数学公式来确定文本短信的“整体目标概率”(combined probability)，也称短信的特征联合概率。

算法说明：

选择贝叶斯算法的原因是由于该算法的优点在于：①实现简单；②贝叶斯模型能够自我纠正。

①特征指示概率的计算公式为：pi（w）=

式中，pi（w）是第i个分类业务征词w的特征指示概率；bi（w）是第i个分类业务征词w的目标概率；gi（w）是第i个分类业务征词w的非目标概率。

②目标概率计算公式为：bi（w）=

式中，DFi（w）为第i个分类业务中含有特征w的目标分类文本数量；Ni为第i个分类业务中总的目标分类文本数量。

③非目标概率计算公式为：gi（w）=

式中，DFj（w）为第j个分类业务中含有特征w的文本数量；Nj为第j个分类业务中总的目标分类文本数量；n为总的分类业务数量。

④特征概率计算公式为：fι（w）=

式中，m为含特征w的文本数量；s、x为预先设置的常量。

⑤联合概率的计算公式为：

pK（Mi）=

式中，pk（）为文本的联合概率；Mi为第i个文本；f（wij）为第i个文本中的第j个特征词的特征概率；K为第i个文本包含的特征词数量。

通过以上算法，获取用户发送短信中包含的特征词，并通过特征词找到各业务对应的特征概率，计算短信对应业务的联合概率，找出超过设置阀值的对应业务，输出给短信营业厅执行相应业务受理流程，从而完成业务搜索。

2 短信营业厅搜索系统的开发与实现

2.1 系统功能架构说明

系统功能体系结构图：

短信营业厅搜索系统的实现基础是一种基于文本的搜索方法。根据用户的功能需求，将基于文本的搜索方法设计为基础的服务引擎。该服务引擎的用途是从一段(自然语言)文本中寻找出满足要求的与之相匹配的若干关键字。关键字代表了序列的应用，如短信营业厅的业务关键字、知识库中的知识点关键字、营销活动中的活动关键字等。文本智能搜索服务引擎定位为基础、通用、便于扩展的核心服务引擎。

文本智能搜索服务引擎的应用图示：

如右图所示，短信营业厅智能搜索服务引擎为扩展引擎，用于实现短信营业厅相关业务的处理。采用文本智能搜索服务引擎实现搜索服务的独立性、可扩展性。便于开展其他业务应用的处理和分析。

2.2 系统分布式运行技术系统采用分布式的体系结构来实现系统的各项维护功能，系统是三层或多层的B/S应用系统，把能够执行特定企业功能的企业应用逻辑代码封装成应用企业对象并到应用服务器中，以供WEB服务器和浏览器调用。

2.3 系统数据单元

2.3.1 系统特征库系统特征库是系统保存的特征词组组合，其中保存的特征词组是已经与系统业务数据库进行了关联的特征词组组合，用来提供与自然语句所生成的关键词组进行对比的依据，系统特征库是可以进行扩充的，可以通过手工加入的方式进行加入，也可以通过词组迭代库中出现次数达到一定数量后自动提示用户关联后加入。

2.3.2 系统业务数据库系统业务数据库保存系统中所有开办的业务。系统业务数据库中业务与系统特征库中的特征词组组合进行直接关联，系统业务数据库完全由用户进行维护，当某一业务删除后对应系统特征库中的关联特征词组将被删除。

2.3.3 词组迭代库词组迭代库将保存系统中所有未能成功匹配的特征词组。当某词组在词组迭代库出现次数达到一定数量后将提示用户将该语句关联后加入系统特征库中。当某词组由词组迭代库中关联进入系统特征库后，系统自动删除词组迭代库中类似词组，如果用户认为该词组无法进行有效匹配即该词组为无效数据系统也将自动删除词组迭代库中类似词组。

2.4 系统功能说明及技术参考

语义智能分析引擎结构：

2.4.1 应用接口提供系统与短信营业厅的数据交互接口。输入接口将通过web service接口获取待分析文字内容，输出接口将通过web service接口将分析结果传递给指定系统接口。

2.4.2 自动分词功能将自然语句进入智能分析系统后，系统先通过中英文分词插件将自然语句分割为多个词组，此时的词组中应该有多个对于进行特征分析毫无作用的词组。如自然语句‘我有点想开通彩信功能’分割后应为“我”、“有点”、“想”、“开通”、“彩”、“信”、“功能”。其中“我”、“有点”对于特征分析毫无作用。系统通过辨别词语类型的方式将动词和名词以外的词组剔除掉，留下“想”、“开通”、“彩”、“信”、“功能”，是该自然语句的关键特征词组。

2.4.3 倾向性特征标准库根据用户的不同身份，判读词组特征的权值也会有所不同，如全球通用户在长途业务的权值会较高，而动感地带的用户的判读权值会倾向于彩铃和彩信。倾向性特征标准库中的匹配标准会根据用户的身份给予一定的加权值。倾向性特征标准库中的特征加权值需要由系统用户进行管理，系统将提供维护界面以及数据导入功能。

2.4.4 特征库构建短信提取：对短信的解码提取短信信息，包括对测试集短信的提取和训练集短信的提取。

去停用词：实际应用时，文本中的很多词与内容无关，例如“可是”、“那么”等。这些与内容无关的词，称作功能词，在进行分类前，需要将其去除。另外，一些出现频率过高的词，例如“我们”、“人家”等，对于分类也没有太大的贡献。将功能词和出现频率过高的词统称为停用词，它们只在文本中起辅助作用，因此，为减小短信特征向量的维数，提高过滤的性能，可以将它们删除掉。为了后面的特征选取工作，本文将与分类关系不大的停用词也事先作了依次剔除。

特征提取：将由训练集或者测试集中的短信进行分词，进行特征提取。特征提取是利用分词技术对短信或者投诉内容进行词汇拆分后，使用信息增益选取文本中的特征词，把从文本中提取的特征串，计算其匹配某个业务分类的概率，再用放入特征库中来进行储存；在测试集中，提取文本的特征，交给下个环节处理。

2.4.5 概率计算计算联合概率是用来辨别两个词组之间的相似程度，相似程度越高则概率越高，概率达到一定标准后即认为的同义词组。进行计算概率将首先从系统特征库中提取特征词组1例如“开通彩信”，然后与前一步生成的关键特征词组进行概率计算。

①当概率计算到达匹配标准，则认为找到了有效的匹配结果，通过特征词组1找到在系统业务数据库中的对应业务，将该业务信息输出给应用层程序接口。

②当概率计算未能到达匹配标准，查找下一条特征词组然后重复1操作。

③当已经完成对特征库中所有特征词组的概率计算依然未能找到任何的有效匹配结果，则认为该关键特征词组没有对应业务。系统返回未找到匹配结果，并将该关键特征词组加入至词组迭代库中。

④模式匹配

接受特征提取中的信息，根据规则数据库中的规则，按照某种相似度计算算法计算信息与实际需求的相关性，在达到一定的阀值后，输出过滤的结果。

信息表示：提供对过滤后的短信的浏览，以及对过滤效果的评价。

以上过程主要应用于训练器训练各个分类及特征的对应关系建立过程，即特征库的建立过程。

模式匹配阶段分为两个阶段：训练和测试。

训练阶段主要是训练规则库，提取目标短信(文本)和其他分类短信(文本)的特征；主要步骤如下：

测试阶段是利用已训练完成的规则库，对短信进行判断。并向用户提交结果。

对于新的短信，先进行分词，提取短信的特征，通常是最能代表短信内容的若干个特征，通过计算这条新短信的联合概率。如果短信的联合概率超过某个阀值，就判此短信为目标分类的短信，其他的为其他分类，然后再进入下一个目标分类的判断。在建立分类和文本训练的过程中，建立了短信与业务的联系，通过对后验概率的不断求解和反复迭代，使得系统具备近义词和同义词匹配功能，同时也具备了一定的纠错能力。

根据贝叶斯公式，按照短信营业厅具体不同业务进行分类，目的是将用户上行短信归到具体某一项或某几项分类中。此处假设Bi(i=1…N)，此处A代表用户上行的短信进行中文分词后得到的特征值，Bi代表某一项业务，其业务指令有，我们的目的就是求出短信A归入某一分类Bi的概率P(Bi|A)，根据以下贝叶斯公式：

P（Bi|A）=■=■=■■P（■），其中P（ABi）可以求出，故P(Bi|A)是可知的。同时选定P（Bi|A）值最大的或超过设定阀值的作为有效匹配项，将其在Bi分类中未出现的特征值加入预处理库中，再由系统管理员决定是否需要将特征值作为业务的指令项。

2.4.6 智能学习系统特征库是匹配成功率的依据，越完善的系统特征库将具有越高的匹配成功率，所以系统特征库的自动维护是系统具有学习功能的根据。当某词组在词组迭代库出现次数达到一定数量后将提示用户将该语句关联后加入系统特征库中。当某词组由词组迭代库中关联进入系统特征库后，系统自动删除词组迭代库中类似词组，如果用户认为该词组无法进行有效匹配即该词组为无效数据系统也将自动删除词组迭代库中类似词组。

3 结束语

本文采用方式，经过实践证明不失为当前一种切实可行的用户交互语义解析及业务搜索办理的解决方案。本系统采用基于多重迭代贝叶斯算法对输入短信文本进行分类过滤的新型算法，其适用范围相比关键字匹配或其他同类算法更广，同时也实现了系统自学习提高的训练迭代过程，从而随着系统不断使用和反复训练，其对用户与系统交互过程中的自然语言理解能力将逐渐提高，业务搜索范围将不断扩大，业务搜索命中率也会得到改善，从而达到事半功倍的效果。

参考文献：

[1]李宝敏，张娜.基于领域本体的语义智能检索研究，西安工业大学计算机学院2007.12.

[2]顾德访.语义Web环境下基于ontology的语义检索应用研究，2005.

[3]曹志松，曹文君.基于语义Web实理有效Web信息检索的研究，复旦大学学报，2004.06.

[4]李健康.专业化的语义智能搜索引擎GoPubMed，南方医科大学图书馆，2009.12.

[5]刘永丹，曾海泉，李荣陆，胡运发.基于语义分析的倾向性文本过滤，计算机与信息技术系，2004.7.

[6]宋雯斐，王洋.自然语言检索中的概念语义控制，黑龙江科技学院计算机与信息工程学院，2011.2.

[7]徐琳宏，林鸿飞，杨志豪.基于语义理解的文本倾向性识别机制，大连理工大学，2007.1.

[8]程显毅，杨天明，朱倩，蔡月红.基于语义倾向性的文本过滤研究，江苏大学，2009.12.

统计学的特征篇8

一、统计学的定义

人们的印象里，统计学就是对数据进行简单的运算，然后通过图表、表格把它们表示出来，这是长久以来人们对统计学的一些片面认识。统计学的定义有很多种，每种定义对统计学阐述的侧重点不同。其中维基百科是这样定义统计学的：“统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据，以便给出正确认识的方法论科学，被广泛的应用在各门学科之上，从自然科学和社会科学到人文科学，甚至被用来工商业及政府的情报决策之上”。简单来说，统计学就是数据的科学，是一门收集、整理、分析、解释数据并从数据中得出结论的科学。

二、统计学的研究对象及其特点

统计学研究必须要求明确统计学研究的客体是什么，即统计学的研究对象。统计学中某种性质相同的个体所组成的集合叫总体。统计学就是研究客观总体的数量特征、数量关系和变动规律，或者说统计学是研究统计过程的规律和方法以及客观现象统计规律的科学，它的研究对象既涉及到自然科学领域，又涉及到社会科学领域。统计学研究对象的特点有以下几点：

（1）依赖性。依赖性即统计学研究对象的寄生性，依赖性是统计学独有的特点，统计学研究的数据是来自各领域的，是依靠解决其他领域的问题而存在和发展的。统计学现在已经发展成为一门媒介科学，它研究的对象是其他学科的逻辑和方法论。

（2）数量性。数量性即统计学研究对象是通过数量特征和数量关系表示的。数量性是统计学研究对象的基本特征，因为数字是统计的语言，统计是通过数量方面来认识事物的，对统计数据进行分析，归纳统计规律性，就可以达到统计分析研究的目的。

（3）总体性。总体性即统计学以研究对象总体的数量为研究对象。每一个个体都有自身的随机性，而这些研究对象的总体又具有共同的特征和共同趋势，所以统计学研究是通过对大量的个体特征进行研究，从而过渡到对总体普遍存在的事实进行观察和综合分析，进而得出研究对象总体的数量特征和统计规律。只有掌握研究对象的总水平、总规模、总体特征和共同趋势才能体现统计学规律的作用。

（4）变异性。变异性即构成统计学研究对象总体中的各个个体，除了在某一方面必须是同质的以外，在其他方面又要表现出一定的差异和变异。如果各个个体之间没有区别和差异，统计研究就是没有意义的。统计学的这种变异既可以表现为数量上的，也可以表现为非数量上的，但是因为统计学具有数量性，所以表现为数量上的变异才是统计学所要研究的对象。

（5）具体性。具体性即统计学研究对象是具体的数量方面。统计学所研究的数量是具体、现实的，而不是抽象的，并且统计学研究的数量是有现实意义的。比如，要研究城乡居民收入差距，必须确定具体年份的具体范围内的城镇和农村居民收入数量、收入构成、收入变化以及计算方法，才能对研究对象进行统计分析。

（6）广泛性。广泛性即统计学研究数量方面的范围的很广泛。其广泛性包括政治、经济、文化、军事、教育等各类社会现象的数量方面。统计学研究对象的广泛性是统计学成为媒介学科的必要特征。

三、统计学的研究方法

每个学科都有自己独特的研究方法，统计学也不例外，统计学在长期实践中总结、归纳出了一系列专门的研究方法，如实验法、大量观察法、统计分组法、综合指标法、统计描述法等。

（1）实验法。统计学的实验法包括假设检验和实验设计。假设检验就是在对在总体参数提出假设的基础上，利用样本信息来判断假设是否成立的统计方法。实验设计就是设计合理的实验程序，使得收集得到的数据符合统计分析方法的要求，以便得出有效的客观的结论，其中最常用的实验设计是正交设计法。

（2）大量观察法。大量观察法就是对全部或者足够数量的研究现象进行观察和研究，推理归纳出客观现象的本质特征和发展变化规律。通过对大量的研究对象进行观察和研究，才能排除偶然因素造成的影响，揭示研究对象的统计规律和本质特征。

（3）统计分组法。由于所研究现象具有差异性、复杂性及多样性，需要我们对研究现象进行分组研究，进而来区别研究现象的类型，研究不同组别之间的区别和联系。统计分组法包括传统分组法、聚类分析法和判别分析法等。

（4）综合指标法。综合指标法是利用总量指标、平均指标、相对指标、标志变异指标等对研究现象的数量关系和数量特征进行分析，来反映统计学研究现象的数量方面特征。综合指标法在统计学的经济应用中具有重要的作用。

（5）统计描述和统计推断。统计描述指对调查或实验得到的统计数据进行整理、分类、计算出各种能反映总体数量特征的综合指标，并加以分析研究，从而得出有价值的信息，用表格和图形表示出来。统计推断指以一定的置信水平，根据样本数据资料来判断总体数量特征的归纳推理方法。统计描述和统计推断在统计学研究中应用非常广泛。

四、统计学的发展趋势

（1）统计学实际应用的范围扩大。在大数据时代的背景下，统计学开始被各行各业运用起来。统计学逐渐应用到企业管理、保险金融、政府决策、国家经济安全等方面。统计学在企业管理方面可以提高企业的管理能力和效率。在保险金融方面可以监控分析金融风险和保险问题来保证金融保险市场的正常运行。在政府决策方面可以帮助政府宏观调控，从而减少决策失误。在国家经济安全方面可以监控经济安全问题，预防经济危机。

（2）统计学与其他学科交叉融合。统计学的性质决定了统计学是一门媒介学科，统计学的发展是建立在各类学科的基础上的，其涉及领域非常广泛。因此，统计学与其他学科交叉融合更能发挥它的作用，例如，统计学与经济学、管理学等学科进行融合等，在融合中能不断完善统计学体系，创新统计学研究方法。

（3）统计学与网络、计算机的结合。大数据时代的到来，使得以网络、计算机为代表的信息科技在统计理论、统计分析方法、统计处理过程等方面都为统计学发展提供了新的支持。统计与网络和计算机的结合，能更好发挥统计的作用，使统计学的应用更加广泛。

统计学的特征篇9

原发性肝癌是肝细胞或者肝内胆管上皮细胞的恶性肿瘤，在致死性恶性肿瘤中位于第5位。CT是各种影像学检查中能够比较准确反映肝脏病理形态的一种检测方法[1]。弥散性和非弥散性肝脏疾病主要的诊断学区分特征是正常组织是否被破坏，在CT图像上主要体现为图像纹理的变化，而根据不同CT图像纹理特征差异，能够通过计算机进行原发性肝癌和正常肝组织的识别与分析，对于我国肝癌患者数量众多，诊断工作繁重的现状来说，实现计算机诊断是有着重要意义的。本次研究以我院在2008年3月-2013年3月间收治的40例确诊为原发性肝癌患者的CT图像和40例确诊正常肝CT图像为研究对象，对原发性肝癌CT图像纹理进行了研究。

1 资料与方法

1.1 一般资料

选择我院在2008年3月-2013年3月间收治得30例确诊为原发性肝癌患者的CT图像和30例确诊正常肝CT图像为研究样本，全部样本在年龄、受教育程度等方面差异无统计学意义（P>0.05）。

1.2 方法

将选择的80个样本图像采集并存储在计算机上，选择图像兴趣区。由经验丰富的医师指导，选取80个20*20的兴趣区，40个为正常肝，40个属于原发性肝癌。

1.2.1 纹理特征提取

选用一阶统计特征、灰度共生矩阵、灰度行程矩阵三种提取策略提取纹理特征[2]。

1.2.2 特征选择

不是每个特征都能够用于样本图样区分，对于某个特定特征，两个样本差异显著才可记为有效特征，否则为冗余特征。

采用t检验时，首先选择两类类性特征样本值，此时两类特征值方差不等并且未知，建立基本假设：

H0：：μ=μ1-μ2≠0

H1：μ=μ1-μ2≠0

进行t检验，H0成立时可获得统计量。

1.2.3 神经网络识别

采用BP神经网络进行正常肝和原发性肝癌分类，输入层、隐含层和输出层组成分类器，输入层中包含和有效特征数目相等的输入神经元，隐含层有十个，输出层有一个。设置收敛判断值为0.0001，训练步数最大200，如果训练数据和网络输出误差平方低于这两个限度，可认为网络收敛[3]。

1.3统计学处理

在本次研究中采用统计学软件SPSS20.0 对统计的数据进行处理，计量资料采用t检验，计数的资料采用χ2检验，以（P

2 结果

2.1 统计特征

采用上述图像问题采样算法，每个兴趣区都采集28个特征问题，通过t检验选择有效特征，显著性差异水平取0.05，一阶统计特征有15个特征差异显著，其余为冗余特征。特征数目量较大，不便直接列取，为了校验t检验特征值是否准确，在有效特征中选择一阶矩、和困之和冗余特征熵，观察不同特征在不同性质图像上统计分布差异，如表2-1：

一阶矩、和均质在正常肝和原发性肝癌中的差异有统计学意义（P

2.2 神经网络识别

在神经网络分类器中输入经过t检验选择的特征向量，使用MATLAB神经网络工具箱进行分析计算和函数仿真模拟。不同特征量物理意义不同，有着各自的动态范围，这种特征有着明显的不可比性，分类前需要对特征值进行归一化处理，特征值取上限，μ取下限做归一化处理，调整到[0，1]之间：

方案A的识别率达到了100%，但是方案A的全部样本即是训练集又是测试集，样本识别结果失去了客观性，方案B对原发性肝癌的识别率达到了93.45±5.33%，说明应用方案B的神经网络分析方法对肝脏CT图像有着很高识别率，这是符合模式辨识理论规律的，对于未学习过的样本需要根据已学习样本训练结果进行推理，识别率虽然有所下降，但是结果有着较好客观性。

3 讨论

原发性肝癌是世界范围内致死率第五的恶性肿瘤，我国的发病率也很高，严重威胁了患者的生命健康，我国肝癌患者众多，给诊断和普查工作带来了很大困难，长期以来，使用计算机进行肝癌CT图像纹理分析还缺乏高效准确的算法，成为实现原发性肝癌CT图像的计算机辅助诊断的主要技术难题[4]。本次研究选择了一阶统计、灰度共生矩阵和灰度差分矩阵图像纹理取样算法，提高了样本采集的代表性：

①一阶统计特征

是图像灰度的一阶概率分布，是一种比较基本的纹理特征描述。

P（I）=灰度级为1的像素数/区域内总像素数（1-1）

②灰度共生矩阵

通过估计图像二阶组合条件概率密度函数提取特征。描述四个方向上距离为d的一对象元具有灰度i和j的概率，每个元素都有距离、角度、灰度值和概率4个特征值，通过灰度共生矩阵能够计取对比度、相关系数、和方差等共13个特征量，从每个兴趣区中都能够提取13个特征值。

③灰度行程矩阵

是连续、共线，灰度级相同的像素点，通过某个既定图像能够计算获得灰度游程矩阵，表示四个方向上灰度g，长度d灰度串出现的总次数，能够提取短行程优势、长形成优势、灰度不均匀度度量以及行程总数百分率等参数量。

同时应用了神经网络进行原发性肝癌识别，经过两种方案分析准确率的比较，证明1/3样本作为测试样本，2/3作为训练样本的分析方式对原发性肝癌的检出率为93.45±5.33%，说明基于神经网络的原发性肝癌CT图像计算机辅助诊断有着理想的识别能力，有着很高的临床推广价值。

参考文献

[1] 郭堑，农村立，等.图像纹理分析技术在肝纤维化CT图像分析中的应用研究进展[J].实用肝脏病杂质，2009，12（3）：229-230.

统计学的特征篇10

(一)县级统计分析含义

县级统计分析是指根据统计研究的目的，利用统计调查整理所掌握的大量数据及相关资料，运用统计所特有的方法，对客观存在的经济现象及关联现象进行分析研究，透过客观现象的数量表现认识事物的本质及其发展变化规律性，从而揭示矛盾，分析原因，提出解决问题措施的一种对现象的研究过程及对现象深入的认识过程。统计分析是统计实践活动过程的一个重要阶段，是统计设计、统计数据收集和统计数据整理的延续和深化，是完成课题研究的必经阶段。

(二)县级统计分析的特征

根据上述县级统计分析含义可以看出，县级统计分析具有如下特征：

1.数量性。县级统计分析首要特点就在于它是对事物的数量方面进行研究。它的分析对象就是在信息搜集过程中获得的大量数据资料。统计分析的过程和结果都是通过数字、符号、公式和图表等数学语言表达的。统计分析的目的就是要反映这些数量的现状和发展变化趋势。

2.工具性。县级统计分析只是一种调查研究的方法和工具，它本身既不是调查的目的，也不能代替调查研究本身。它受到调查研究的对象、目的和任务的严格制约。调查研究的具体课题决定了统计分析的具体目的和任务，决定了它所要采取的具体方法、程序和指向。

3.客观性。县级统计分析只能如实地反映繁杂的数量资料所体现的内在特征和规律。县级统计分析的基础是客观存在的原始信息，研究者不能根据自身的好恶进行取合。统计分析的客观性使得分析结论具有广泛的应用价值。

4.综合性。县级统计分析的对象是事物的总体数量特征，其构成是多层面、多角度的，而且影响总体数量特征变化和发展是多因素的。它们之间既相互联系、相互影响，又相互制约。统计分析可以综合、全面、系统地分析所获得数据的所有变量，所有因素，全面描述、推断事物现象的总体数量特征。

5.科学性。县级统计分析是建立在数学科学基础之上的，它所采用的方法、程序都有科学依据作保障。统计分析的运算结果、推论是可靠的，在预测时，既能计算出指标值的范围，又能指出其可靠程度。

二　县级统计分析的方法与步骤

(一)县级统计分析的方法

1.大量观察法。大量观察法是指对现象总体足够多的单位进行调查与分析，以认识事物的总体特征与规律性的方法。县级统计分析运用大量观察法是由于分析研究对象的大量性、复杂性与分析研究的目的所决定的。大量的复杂的社会经济现象是在诸多因素的错综作用下形成的，各单位特征及其数量表现有很大的差别，县级统计分析的目的是认识所研究现象总体特征与规律性。因此，不能利用对个别单位、少数单位的数量特征的观察分析来判断总体特征与规律性。

2.统计分组法。统计分组法是指根据现象的内在性质和县级统计分析研究的任务要求，将总体各单位按照某种标志划分为若干组成部分的方法。统计分组法是分析总体内部差异的重要方法，通过分组可以分析总体中不同类型的性质以及它们的分布情况以及内部的构成和比例关系。通过分组还可以分析现象间的依存关系与量变界限。统计分组法在县级统计分析中有着非常广泛的应用，正确使用统计分组法进行县级统计分析的关键是科学选择分组标志。

3.综合计算分析法。综合计算分析法是指运用各种综合计算的统计指标数据，反映、分析现象总体的一般数量特征和数量关系的方法。对大量的原始数据经过整理汇总，计算各种综合指标，可以显示出现象在具体时间、地点条件下的总量规模、相对水平、集中趋势、离中程度，具体包括对比分析法、集中趋势分析法和离中程度分析法；描述现象的动态发展过程以及现象间的数量依存关系，预测未来的发展趋势，包括动态趋势分析法，指数分析法和相关与回归分析法；还可以根据部分单位的计算分析数据科学推断总体数量特征，包括抽样推断法，等等。

(二)县级统计分析的步骤

1.确定县级统计分析的目的和任务。确定县级统计分析的目的和任务是进行县级统计分析首先要解决的问题。县级统计分析是为调查研究服务的一种统计工具，必须根据调查研究的目的和任务确定县级统计分析对象，进行县级统计分析设计，合理选择统计分组标志、数量界限以及综合计算分析的方法。必须使县级统计分析围绕调查研究的课题展开。

2.统计资料整理。在进行统计分析之前，必须对原始资料进行审核、整理和加工，使之系统化和条理化。统计资料整理的核心工作是统计分组，统计分组的关键是正确选择分组标志。统计资料整理是统计分析的基础工作。

3.根据变量值特点选择计算分析方法。统计调查中所得到的数据有不同的分布特点和类型，要针对具体情况选择相应的计算分析方法，将现象的数据特点、类型与计算分析方法的适用条件相匹配。否则统计分析出的结果可能会歪曲事实，不能客观、公正地描述现象的存在状态和准确预测、推断未来。

4.计算统计分析数据。计算统计分析数据是统计分析的中心任务。根据统计资料整理的结果与选择的计算分析方法，围绕调查研究的目的和任务，计算分析反映现象对比关系、集中趋势、离中程度、相关程度、动态变化等的指标值，以此使原始数据中所包含的信息特征显示出来，概括描述出总体的静态数量特征和动态趋势性等。

5.提出统计分析报告。统计分析报告是统计研究分析过程的概括总结，是统计分析结果与结论的重要表达方式，是统计研究分析的工作成果。统计分析报告的写作以统计研究的任务、目的为出发点，从分析现象基本的数量关系人手，对统计调查整理的资料、数据进行科学的归纳、综合、推断和论证，科学描述所研究课题的现状或预测未来，推断总体，阐述观点，提出建议。

统计学的特征篇11

Research and Implementation of Intelligent Design System Based on Artificial Neural Network

WU Zheng

(The CAD Research Center of Tongji University, Shanghai 200092)

Abstract：Axisymmetric part of the design for the introduction of the concept of the feature encoded file, its characteristic features in a coded form to be expressed. In order to achieve intelligent process state model output, the use of artificial neural networks for automatic reasoning capabilities. Through the intelligent reasoning system to remove the experience of design continued exploration and improvement, will be part of the feature modeling input, the system can automatically determine the parts of the process, then automate production. The intelligent system can help developers and designers to quickly produce design example, so developers can focus more on product innovation activities of enterprises to improve product design and R & D has important practical significance.

Key words: neural network; intelligent design; feature coding; intelligent reasoning; KBE

产品工艺设计是产品开发的首要环节，也是关系到产品设计成功与否的核心问题。提高工艺设计集成化、系统化和智能化程度，实现经验设计向科学设计的飞跃是研究人员多年追求的目标。而智能设计作为现阶段的热点技术，吸引了越来越多的专家和学者的目光。[1]伴随着计算机软硬件的成熟，以及图形图像学、CAD、人工智能设计技术和工艺模式理论的发展，显著的提高了设计的质量和效率，大大缩短了设计周期和工时，形成了工艺设计的的新领域，对我国智能设计和计算机辅助设计的发展起到了极其重要的推动作用。[2]

1 人工神经网络智能设计系统模型的表达

1.1 智能设计系统的体系结构

该智能设计系统主要的结构模块如图1所示。本文将该智能设计系统主要划分为以下几个模块，特征造型器主要将零件的特征进行录入，数据会同用户的输入数据共同进入特征编码器；特征编码器相当于一个接口，将形式数据转化为模式映射器能够识别的规范化数据（即特征编码文件），在模式映射器内部，通过神经网络对数据的处理，同时结合已有的经验知识库、材料库、规则设计库、工艺特征库、映射规则和标准库的数据交互，将数据输出到数值公式计算模块。数值公式计算模块主要是在具体的场景中将约束条件进行量化，结合具体的设计要求将工艺设计顺序进行调整。最后将结果反馈到用户界面，实现智能设计。

1.2 KBE思想和本系统的有机结合

在工程实践中，人们发现专家知识一般来源于该领域内专家的经验和积累，具有很大程度的不确定性和模糊性，这对于知识的交流和继承带来了很大的困难。欧洲面向KBE应用的方法和软件工具研究联盟提出了KBE的概念，KBE是计算机辅助工程领域的一个进步，它是一种将面向对象方法(Object Oriented Methods)、AI和CAD技术三者集成的工程方法，能够提供设计过程客户化、变量化和自动化的解决方案[3-4]。，我们认为：KBE是通过知识驱动和繁衍，对工程问题和任务提供最佳解决方案的计算机集成处理技术，是AI和CAx技术的有机融合。[5-6]

KBE系统的要点主要是知识的表示、知识建模、知识推理和知识的繁衍。本系统主要通过特征造型器进行知识的表示，进而在特征编码器中对所得知识建模，形成了特征编码文件。模式映射器利用人工神经网络对于特征编码文件进行不断的映射，实现了知识推理；同时模式映射器将学习所得的知识存储在相应的知识库中，进行知识繁衍。将经验知识和隐形知识转化为显式知识，实现了智能系统的关键一步。我们将KBE的思想结合到本文所开发的系统中来。

2 零件的工艺特征及特征的编码

2.1 特征的确定和数字化表达

首先我们需要确定零件的特征，进而将零件的特征数字化。本文根据以下原则确立零件的特征：

1）现实性。零件的特征是客观存在的，不因人的主观意志的转移而改变该特征。2）可测量性。相比于传统的经验化设计模式，能够准确的测量和量化零件特征是智能设计的重要要求。3）唯一性。作为零件信息的重要载体，特征的无歧义性是需要重点考虑的原则，不能同时将一个特征收录到两个属性中，进而造成建模中零件属性的混乱。

本文主要针对轴对称的零件工艺模式，我们将主要研究零件的以下特征：冲孔、翻边、正向拉深、反向拉深、带孔小阶梯成形法等。

考虑到神经网络我们采用的是S型参数，所以我们将特征编码确定为0到1之间的数，本文共确定了10种特征形状。如表1所示。

通过确定特征参数，进而可以构建特征造型器，特征造型器以零件的实体特征为基础，结合零件的几何信息和拓扑信息，将参数化设计思想和特征编码思想统一，用尺寸驱动的方法来定义特征，便于计算机对于零件特征的识别和处理。

2.2 面向对象的特征建模语言

由于在实际设计征的复杂性和多样性，而面向对象的语言具有数据的封装性、数据与操作的集成性、对象重载、现实世界对象的数据和行为的全面抽象、对象数据的继承性等等许多的优点，目前已成为设计领域广泛采用的设计手段，应用在特征设计领域，可将特征的对象数据类型抽象出来。

特征对象首先具有本身的特征尺寸和属性，考虑到具体的应用，这些尺寸要能够实现参数化，除此之外，还具有公差、材料、技术设计要求等信息；特征的操作类型主要分为两种：一种是成型过程，即所谓的造型映射，另一种操作是特征在零件上的形成位置即有关位置的变动操作。在这两种操作中，造型映射与工艺设计的过程联系紧密，而特征位置操作则与产品的设计过程相关。下面主要是该特征对象的基类型的原型定义。

class Feature

{Stringfeature ;//零件对象的三维实体名。

StringName;//零件特征名。

Stringmaterial;//特征的材料。

intfeature_parametre; //特征尺寸的参数。

intfeature_num.;// 特征类型的编号。

intfeature_code;// 特征的编码。

intpt1,pt2,pt3;//特征基点的坐标。

int angle1,angle2,angle3;//特征在三维空间中与X, Y, Z轴的夹角。

Public:

virtualvoidmodel();//构造三维实体特征。

virtualvoidlocate();//确定特征的空间位置。

voidmove (ap_solid *sol, ap_real tx, ap_real ty, ap_real tz);//将特征移动{tx,ty,tz}。

voidrotate (ap_solid *sol, ap_real rx, ap_real ry, ap_real rz);//将特征旋转。

void chang_feature_para (int class_name, ap_solid *sol, ads_point pt, ap_direc ang, feature_parametre, void model); //该特征的几何尺寸的参数化修改操作。

voidcal_area(); // 特征面积的计算。

voidcal_circl();//特征周长的计算。

}

通过实例化语言，我们能够对零件的特征进行描述，进而便于计算机识别和处理。特征编码的构造加入到零件基类中，具体零件的定义将继承特征编码的操作，并能够进行适当的重载。

3 特征编码器和特征编码文件

将特征数字化表示后，本系统主要通过特征编码器将特征组成特征编码文件，使后续的人工神经网络能够对文件进行处理。有了特征编码，我们能够让机器识别特征；但是为了保存特征的其他信息，如冲孔工艺中孔的直径，翻边的高度等等，我们引入了特征参数的概念。特征参数即为了更明确的定义特征的几何、物理属性，跟随在特征编码后面的一系列数值。图3表示了部分特征编码所对应的特征参数。

我们将特征编码和特征参数组成特征编码文件，输入到模式映射器中。特征编码文件的格式为：每一行表示切仅表示一个特征，其中第一个数字为特征编码，特征参数在特征编码之后给出。图4显示了一个特征编码文件的实例。

4 智能设计系统中工艺模式的生成、映射以及神经网络的构造

4.1 工艺模式映射的过程

我们将零件的特征编码文件输入人工神经网络后，人工神经网络进行反向推理，将零件的成型信息反向输出，同时结合知识库、材料库等已有的信息，输出结果。

工艺模式用于指导工艺计算模块的工作，而经过特征造型之后的零件信息只有特征编码文件。因此，人工神经网络的任务就是根据零件的特征编码组信息，推导出生成零件的各个中间成形形状的特征编码组，以及各个中间形状在零件成形过程中的排列顺序。

因为对于神经网络来讲，得到的是设计者输入的零件模式信息，输出是零件成形的各个中间状态（特征编码表示），这就决定了工艺模式在神经网络中的映射过程是一个“逆顺序”的过程，这一过程又可以描述为“反推导”过程，即：将零件的特征编码组（零件模式）输入到经过训练的神经网络中，由其输出该零件成形的各个过程的中间形状的特征编码（中间形状模式）。我们以计算机的视角来看待零件的分解，即：零件->特征->特征编码文件->人工神经网络。在人工神经网络中，特征编码文件被反编译，特征结构后得出特征形成的顺序，进而输出，即：人工神经网络->特征反编译->特征工艺序列->特征编码组->特征->零件。由此可见，人工神经网络是用于处理工艺模式的主要工具，在前面的特征造型器、特征编码器中生成的零件的工艺模式，以及特征编码组等概念，都是为了便于神经网络的处理而建立的。

最后，由这些“中间形状模式”、“零件模式”等特征编码组信息及其排列顺序，组成该零件成形的“工艺模式”信息文件。这一过程，就是以零件模式作为输入、以经过训练。

4.2 神经网络的比较及选择

人工神经网络用于工艺模式映射的工作主要是以下几个：1）是针对输入的零件模式经过映射后输出该零件成形的中间形状；2）生成按照工艺成形的过程而排列的零件成形中间形状的排列顺序；3）进行反向学习，从输入的特征编码文件中提取零件成型顺序，存储到知识库中。[7]

神经网络主要由以下几类：1）分解映射结构；2）集中映射结构；3）前向网络；4）集中反馈式网络。[8]

我们选择的是集中反馈式的神经网络，相比于其他类型的网络，反馈式结构的优点是：统一的网络便于训练模式的组织和映射工作的开展；输入单元和输出单元的数目相同，可以形成对称的网络结构，使得网络的稳定性和收敛性有了保障；工艺模式的成形顺序性问题不占用网络的实际结构形式，顺序性问题转化为反馈映射的顺序问题，映射的顺序代表成形的顺序；网络在结构上将保证各个单步成形映射的准确性，从而提高网络的训练质量。[9]

表2给出了神经网络训练的相关内容，由于神经网络中节点和隐层数目的不同会极大的影响神经网络的性能，本文主要对各个不同的网络进行了比较，得出了一个最优的网络（即网络7）。

5 实例模型

本文在研究的基础上开发了一个应用实例，该实例主要是设计者将零件的特征编码和特征参数输入系统后，经过神经网络的智能推理，将输出反馈到设计平台上。

系统首先进行特征编码的输入，以确定零件的特征造型；然后输入每一个特征编码对应的特征参数，图5显示了拉深工序对应的特征参数的录入。特征参数录入完成后可以选择继续添加特征或者生成特征编码文件。图6为一个以记事本方式打开的特征编码文件。将特征编码文件输入人工神经网络，对应的输出为特征造型顺序文件（Y.SFM），数值公式计算模块处理该文件，最后给出智能设计工艺流程（图7）。

图5特征参数录入图6特征编码文件图7 智能设计系统给出的零件成型顺序及计算结果

6 结论

本文提出了轴对称零件成型工艺的产品建模方法，然后给出了面向对象的建模语言，能够量化表示零件的特征，在将零件的特征编码文件通过神经网络映射和输出的同时，运用KBE系统的自学习理念，将习得的知识存储。实践表明，通过人工神经网络和工艺智能设计系统的应用，能够解决实际的零件设计成型问题。

参考文献：

[1] 高伟.工艺设计信息系统中的知识发现技术研究[D].成都:四川大学,2005:22-23.

[2] 罗小宾.机械产品图像识别技术及其在反求设计中的应用研究[D].成都:四川大学,2004:15-16.

[3] The Knowledge Engineering and Management Centre at Coventry University,UK,[EB/OL].kbe.cov.ar.uk.

[4] MOKA-Methodology & soft-ware tools-- Knowledge based engineering Applications[M].ESPRIT proposal EP25418,1997.

[5] Peng Ying-hong,Zhao Zhen,Ruen Xue-yu.Application of KBE technology in Die & Mold Design[J].International Conference on Die end Mold Technology, Beijing,2000,90-86.

[6] Peng Ying-hong,Zhao Zhen,Ruen Xue.KBE technology in Engineering Design[J].International Conference on Engineering end Technological Sciences 2000, Beijing,2000:94-100

[7] 刘振凯.智能CAD人工神经网络专家系统的模型和结构[J].中国机械工程,1997(2).

统计学的特征篇12

1 大型Oracle数据库迁移优化方法研究

1.1 数据特征绑定技术设计

针对传统大型Oracle数据库迁移方法存在的数据丢失问题，采用提出的数据特征绑定技术进行解决。数据特征绑定技术基于大型Oracle数据库中数据贮存交互规则与数据交互池之间的排列关系而优化改进设计。数据特征绑定技术可在Oracle数据库迁移过程中在数据库底部植入一串临时特征代码，根据数据库等的信息类别，性质属性新型特征赋予，被赋予的数据将得到临时只读权限，任何外界指令、操作都无法修改或删除数据，大大减小数据迁移过程中数据丢失概率。

1.2 逻辑组格化算法

设计方法中针对传统方法存在的迁移算法逻辑问题，采用逻辑组格化算法进行解决。逻辑组格化算法设计思想来源于传统数据库迁移方法中将数据库内容分为若干数据组块的思想。逻辑组格化算法延续了数据组块的分序方式，不同于传统方法在于逻辑组格化算法将组序内数据重新按照赋予的特征进行重组排列，极大地提升了数据特征代码执行权限。同时，有降低了因迁移逻辑错误造成的数据断裂问题。逻辑组格化算法表达式如下所示。

（1）

1.3 特征检索对接法

大型Oracle数据库迁移中最关键的一步就是迁移后的数据对接。传统数据库迁移后数据对接方法存在对接形式繁杂、数据乱序的问题。针对这一问题，设计采用特征检索对接法，对经过特征赋予处理的数据库内数据进行组序化检索，根据自身底层配套特征检索代码分析，快速多统一特征的数据进行底层数据链拼接。同时，对拼接完成的数据库组块底层临时特征代码执行失效时限激活，回复数据原有权限，完成大型Oracle数据库迁移。

2 实验与结论

针对大型Oracle数据库迁移优化方法的设计进行仿真实验测试。测试采用对比方式，对传统大型Oracle数据库迁移方法与提出的大型Oracle数据库迁移优化方法进行对比测试，并对结果数据进行分析，得出结论。

测试环境配置为：CPU i3 4230 主频3.0Hz，内存 2G，windows 7专业版操作系统。具体测试参数如表1所示。

上述表1对比数据充分证明提出的大型Oracle数据库迁移优化方法的设计优于传统方法。

3 结束语

针对传统大型Oracle数据库迁移方法存在的问题进行深入分析，并对问题存在根源提出了大型Oracle数据库迁移优化方法的设计。通过仿真实验测试证明，提出的大型Oracle数据库迁移优化方法的设计各项测试数据都优于传统大型Oracle数据库迁移方法，满足设计改进要求。为大型Oracle数据库迁移应用领域未来发展提供新的思路。

参考文献

[1]孙钟安.大型数据库ORACLE数据库的优化设计思考[J].电脑知识与技术，2014，2（20）：4644-4645.

[2]洪健.大型ORACLE数据库系统的优化设计研究[J].电子技术与软件工程，2014，32（11）：209-210.

[3]李璐璐.Oracle数据库优化方法分析[J].硅谷，2014，25（24）：31-32.

[4]张建业，董俊伶.Oracle数据库优化设计[J].电子世界，2014，21（16）：186-187.

[5]刘德松.大型ORACLE数据库系统的优化设计方案[J].电子技术与软件工程，2016，2（13）：198-198.

[6]贺鹏程.基于Oracle的数据库性能优化研究[J].电子设计工程，2016，24（9）：256-263.

[7]赖海铭.Linux上超大型Oracle9i数据库优化探索[J].福建电脑，2014，30（03）：81-84.

[8]宋慧艳.Oracle数据库统计应用的结构设计与维护技巧[J].科技传播，2014，25（03）：108-109.

[9]徐洪丽，王志军.教学中java连接大型数据库Oracle几个关键问题研究[J].教育教学论坛，2016，2（20）：189-190.

[10]万娟.Oracle数据库应用中出现的问题及其对策[J].现代经济信息，2015，15（18）：256-263.

[11]冷鹏.自动跟踪技术在ORACLE数据库维护中的应用分析[J].电子技术与软件工程，2015，3（24）：174-175.

作者简介

统计学的特征篇13

Design and implementation of feature data classification system in

network big data platform

ZHANG Kexing

（Taiyuan University， Taiyuan 030012， China）

Abstract： Effective classification of the characteristics data of the network big data platform is to improve the Internet query experience of netizens， and an effective way to develop new applications. Therefore， a characteristic data classification system with good stability and low resource utilization was designed for the network large data platform. The system′s display terminal is the direct application client of netizens， which is used to acquire the network big data， and display the data acquisition result and feature classification result. The server utilizes SOA architecture to provide the classification service of the characteristics data for network big data platform. The classification standard of characteristic data is brought into network large data， and passed to the logic layer processing side， which extracts the characteristics of network big data set according to the characteristic data classification standard， cloud computing and strategy design. The feature extraction algorithm is given in the third paragraph of this paper. Feature data classification end classifies the characteristics data automatically by using the feature vector machine （SVM） according to the big data characteristics extracted by logic layer processing side. The experimental results show that the designed system has high stability， low resource utilization.

Keywords： network big data platform； characteristic data classification system； classification service； cloud computing

0 引言

S着科技的不断进步，网络大数据时代悄然来临，为了各国网民提供了更为高效、便捷的服务。网络大数据平台中的特征数据的有效分类，是提高网民查询体验、开发新型应用的有效途径[1?3]。以往设计出的网络大数据平台特征数据分类系统，未能合理分析大数据的固有特征趋势，稳定性不高并造成了系统运行资源的浪费。故能否设计出一种稳定性好、资源占用率低的网络大数据平台特征数据分类系统，是特征分类领域关注的重点内容[4?6]。

曾设计出的网络大数据平台特征数据分类系统都或多或少地存在一些问题。如文献[7]设计基于信息互动的网络大数据平台特征数据分类系统，此系统以信息互动这一学习方式，对网络大数据平台中的特征数据进行对比互动分析，并利用软件设计出迭代算法，对特征数据进行“再教育”，进而将其准确分类。此系统的准确性高、资源占用率低，但稳定性欠佳。文献[8]设计基于语义的网络大数据平台特征数据分类系统，此系统根据语义方式对网络大数据进行相似搜索，并在网络大数据平台的资源库中构建语义特征向量，通过计算特征向量的角度对特征数据进行分类。整个系统利用分布式设计，拥有较高的稳定性，但其资源占用率较高。文献[9]设计基于地图缩放模型的网络大数据平台特征数据分类系统，此系统将AVM算法引入网络大数据平台中，并构建地图缩放模型，将特征数据准确提取并分类。但此系统只能用于数据量较少的网络大数据平台中，数据量过多时，系统的稳定性较低。

为了解决以上问题，设计稳定性好、资源占用率低的网络大数据平台特征数据分类系统。实验结果证明，所设计的系统能够较好地实现设计初衷，为特征分类领域指引了新的方向。

1 W络大数据平台中的特征数据分类系统设计

所设计的网络大数据平台特征数据分类系统是基于SOA体系结构和云计算设计的。SOA体系结构能够根据网民需求，将网络大数据进行分布式配置，其应用价值是无法估量的。将云计算凌驾于SOA体系结构基础上进行系统设计，则大大增强了云计算的兼容性和稳定性，使稳定性好、资源占用率低的特征数据分类工作得以实现。

1.1 显示端设计

显示端是网民的直接应用端，其主要进行网络大数据的获取、大数据获取结果的显示和特征分类结果的显示。对于不同的网络大数据平台，显示端所进行的工作流程并不相同，这需要根据实际情况进行分析。

显示端为网民提供了非常简单易懂的交互页面，便于网民的操作以及系统的自管理。网络大数据平台特征数据分类系统对网络大数据的特征数据分类结果，是按照一定的分类标准进行统计并显示的，显示方法主要是文字、图形和视频。网络大数据的获取工作一部分是根据网民个性化定制的，但大部分的网络大数据还是基于网络大数据平台特征数据分类系统的预设参数进行的。显示端所获取到大数据将传输到服务端。

1.2 服务端设计

服务端是网络大数据平台特征数据分类系统的基础，其能够接受软件的直接调用，为特征数据的准确分类提供技术支持。服务端利用SOA体系结构为网络大数据平台提供特征数据的分类服务，并将特征数据的分类标准纳入到网络大数据中。图1是SOA对外接口示意图。由图1可知，SOA的接口是中立的，并与网络大数据平台特征数据分类系统的硬件设施和编程软件独立开来，使进入服务端的网络大数据均通过相同的流程进行交互，以缩减系统资源利用率、增强系统稳定性。基于SOA的服务端的大数据传输接口分为两种，一种是同显示端的输入接口，另一种是同逻辑层处理端的输出接口，如图2所示。

图2中，服务端上部是其与显示端的输入接口，下部是与逻辑层处理端的输出接口。输入接口的输入数据主要作为服务端设定标准的借鉴参数，包括接口参数和后台分类参数。服务端根据以上两种参数设定自身的处理参数，包括软件调用参数和后台运行参数，这两种参数主要进行大数据目标层后台操作和网民返还的标准制定。同时，显示端获取到的网络大数据将以集合形式无差别地传输到服务端处理并存储。

输出接口能够将服务端所制定的特征数据分类标准传输到逻辑层处理端，包括网民的个性化分类标准和系统的后台操作标准，网络大数据仍将以集合的形式无差别传输。

1.3 逻辑层处理端设计

逻辑层处理端能够实现服务端所制定的特征数据分类标准，并利用云计算对网络大数据集合进行特征提取。逻辑层处理端根据特征数据分类标准，首先对网络大数据集合开始定性分析，并对分析结果进行管理。

为了提高网络大数据平台特征数据分类系统的稳定性，逻辑层处理端的定性分析工作主要通过云计算和策略设计进行，云计算先将网络大数据集合从传输接口中调出，再经由大数据坐标系构建、大数据更正和限制等计算操作，给出网络大数据特征类型，为策略设计的特征提取工作打下坚实的基础。图3是策略设计原理图。

由图3可知，策略设计由网络环境、策略和策略实施三步骤组成，这三个步骤虽然是相互封装进行的，但也存在一定的关联性。策略设计首先检测网络环境，再给出特征数据的提取策略。特征数据提取策略的实施是双向进行的，通常给出A，B两种通道同时开始实施工作。逻辑层处理端将网络大数据的特征提取出来后，网络大数据平台特征数据分类系统将进入最终处理流程，这项工作是经由特征数据分类端完成的。

1.4 特征数据分类端设计

特征数据分类端能够实现人工操作的完全解放，其根据逻辑层处理端所提取出的大数据特征，利用分类器进行特征数据的自动分类工作。图4是特征数据分类端给出的特征数据最优分类原理图。

由图4可知，特征数据分类端所设计的特征数据最优分类原理，是基于特征向量机这一分类器实现的。特征向量机是一种将统计学应用于特征数据分类工作的设备，其运算精准，有很高的工作效率，且对网络大数据类型的分类限制较少，有效简化了网络大数据平台特征数据分类系统的工作流程，缩减了系统的资源占用率。

特征向量机根据逻辑层处理端提取出的网络大数据特征，将网络大数据分解成向量形式，其中的支持向量将被分配到两端，一端用于接收与特征数据无关的向量，另一端则经由最优超平面进行分类。特征向量机的分类间隔由特征数据分类端根据网络的实际情况进行设置。

2 特征数据分类系统软件设计

所设计的网络大数据平台特征数据分类系统需要对网络大数据的特征提取，才能进行特征数据的分类工作。由于网络大数据类型过多，无法一一列出，故以其中的多媒体大数据为例，给出特征提取算法。多媒体大数据的时域特征虽在特征分类中很少应用，但对于特定的多媒体大数据来讲却是不可缺少的；频域则应用较多。因此，系统对多媒体大数据的时域和频域分别进行了特征提取。

2.1 时域特征提取算法

时域特征主要包括瞬时能量及其均方值、过零率以及高过零帧比。

瞬时能量的单位通常是帧，对网络大数据中的多媒体大数据来讲，一般是将每帧的参照点幅值的平方和作为时间同多媒体大数据增减的参照能量值，其表达式如下：

多媒体大数据中语音信号的不同音色往往交替出现，这将造成过零率波动趋势的增大，高过零帧比较大；而视频信号的音色波动却不明显，高过零帧比较小。根据以上原理能够准确进行多媒体大数据的特征分类。

2.2 频域特征提取算法

时域特征主要进行多媒体大数据中梅尔频率倒谱系数和线性预测系数的特征提取，其对频谱以及子带能量等的特征提取均为辅助提取。

梅尔频率倒谱系数是一种对梅尔尺度等距划分频带的特征，其拥有较高的抵抗噪音能力，且与频率具有线性关系。因此，常将梅尔频率倒谱系数作为多媒体大数据频率特征的替代特征。若想获取梅尔频率倒谱系数，软件需对多媒体大数据进行语音加重、帧分类、添窗等处理，此时将获取到帧的时域信号用表示。对帧的时域信号进行傅里叶变换后将获取到离散频谱，用表示，则离散频谱的表达式为：

3 实验验证

实验对本文所设计的网络大数据平台特征数据分类系统的稳定性和资源占用率进行了验证。实验选取两种类型不同的网络大数据平台（分别编号为平台1和平台2），验证本文系统的稳定性和资源占用率。实验结果如表1～表3所示。

由表1和表2可知，召回率和F1值代表着本文系统对特征数据分类水平的预测值。本文系统在平台1和平台2中，均具有较高的分类准确率，且平台的分类准确率、召回率和F1值结果相差不大，验证了本文的稳定性较好。由表3可知，本文系统的CPU占用率实验结果范围为[48%，58%]，内存占用率实验结果范围为[20%，33%]。而以往研究出的网络大数据平台特征数据分类系统的CPU占用率和内存占用率大致在70%和40%，验证了本文系统资源占用率低。

4 结论

本文设计稳定性好、资源占用率低的网络大数据平台特征数据分类系统。系y的显示端是网民的直接应用端，其主要进行网络大数据的获取、大数据获取结果的显示和特征分类结果的显示工作。服务端利用SOA体系结构为网络大数据平台提供特征数据的分类服务，其将特征数据的分类标准纳入到网络大数据中，并传递给逻辑层处理端。逻辑层处理端利用云计算对网络大数据集合进行特征提取，其特征提取算法于软件中给出。特征数据分类端根据逻辑层处理端所提取出的大数据特征，利用特征向量机进行特征数据的自动分类工作。实验结果表明，所设计的系统稳定性好、资源占用率低。

参考文献

[1] 尹晓华，胡楠，刘为，等.OpenFlow在电力大数据平台中的应用[J].电力建设，2015，36（3）：43?48.

[2] 李维乾，李莉，张晓滨，等.Hadoop平台下突发水污染应急预案并行化处置[J].西安工程大学学报，2015，29（6）：733?739.

[3] 朴雪，张立，俞啸，等.面向医疗大数据平台的异构网络网关的设计[J].自动化仪表，2015，36（9）：42?44.

[4] 王昌辉.云计算设备中的大数据特征高效分类挖掘方法研究[J].现代电子技术，2015，38（22）：55?58.

[5] 林海.基于SO平台的4G网络大数据优化分析手段研究[J].新媒体研究，2015，1（9）：18?19.

[6] 关培源，陈志刚，王云华，等.基于移动医疗大数据平台下降低能量消耗机会网络的研究与应用[J].计算机应用研究，2015，32（12）：3790?3793.