神经网络基本原理实用13篇

神经网络基本原理
神经网络基本原理篇1

在对实际问题进行描述和处理中,为了能够获得更加全面的信息,我们经常需要统计多个变量的数据。但是这些多个变量之间经常存在一定的相关性,并不是每个变量都是我们所需要的,或者说它们携带的信息可能是重复的。因此我们希望用少数几个变量来代替原有的多个变量。主成份分析法的基本思想就是通过对原始数据的降维,将多个相互关联的变量转化为少数几个互不相干的变量的统计方法。

由于期货价格的变化是一个非线性的时间序列,利用传统的统计方法对期货的价格直接进行预测,所得到的结果不是很理想。而神经网络在非线性模式中具有优势,因而它不需要建立复杂的数学模型就可以完成期货价格预测。基于BP网络和RBF网络的预测都有较好的结果,但是相对BP网络而言,利用RBF神经网络不仅解决了常用BP网络易陷入局部最小的问题,而且训练时间更短,预测的精度也比BP网络高得多。本文提出使用基于主成分分析法的RBF神经网络方法对期货价格进行预测。通过主成分分析法对原始数据降维,然后,再用这些个数较少的新输入变量作为RBF神经网络的输入进行模拟预测。由于主成分之间是相互独立的,所以由各主成分组成的输入空间不存在自相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度。

2主成分分析法简介及RBF神经网络算法概述

2.1主成分分析法

主成分分析法的步骤如下:

(1)原始数据的标准化处理。

主成分分析法的目的就是使用较少的变量代替并综合反映原来较多的信息,综合后的变量就是原来多变量的主要成分,利用这些综合后的主要成分去代替原来的变量去解决实际问题。这里首先利用以下公式对原始变量进行标准化处理。其中原变量为xij,其含义为第j个变量的第i个值,则处理后的变量值为yij,

(3)计算矩阵R的特征根和特征向量。

利用R的特征方程|R-λi|=0求出其特征根,其对应的特征向量利用|R-λi|A=0和AA''''=1求得。然后对所求得的特征根按照大小顺序进行排列。

(4)计算方差贡献率与累计方差贡献率。

利用公式Ki=λi/∑ni=1代入所求的特征根λi,求出各个主成分的贡献率Ki,其贡献率就代表了原数据信息量的百分比。

(5)确定主成分计算其得分值。

主成分的确定方法主要有两种:(1)当前K个主成分的累计贡献率达到某一特定值的时,则保留前K个主成分。一般采用超过85%以上。(2)选取特征值大于1的主成分。这两种可视情况进行选取,一般前者取得主成分要多,后者要少,通常情况下是将两者结合一起来进行使用。

2.2RBF神经网络算法概述

径向基(RBF)网络是以函数逼近理论为基础构造的一类向前网络。其网络结构为三层,隐含层采用高斯函数为激励函数,理论上,只要隐含层中有足够的径向基神经元,径向基函数网络就可以逼近任何非线性函数。输出层为简单的线性加权函数,其网络结构如图所示。

其中W1i为每个隐含层神经元与输入层相连的权值向量,Xq为输入矢量,b1i为阈值。则隐含层的第i个神经元的输入为:

kqi=j(w1ji-xqj)2×b1i

输出为:

rqi=exp((-kqi)2)=exp(-(||w1ji-Xq||×b1i)2)

输出层的输入则为各隐含层神经元的加权求和。由于激励函数为线性函数,因此输出为:

yq=∑ni=1ri×w22

RBF网络首先通过无教师学习确定训练输入层与隐含层间的权值w2。再通过有教师学习,确定训练隐含层与输出层间的权值w1i。在RBF网络训练中,隐含神经元的数量确定是一个关键的问题。其基本原理是从0个神经元开始训练,通过检查输出误差使网络自动增加神经元。每次循环使用,使网络产生的最大误差所对应的输入向量作为权值向量w1i,产生一个新的隐含层神经元,然后检查新网络的误差,重复此过程直到达到误差要求或最大隐含层神经元为止。由此可见,径向基函数网络具有结构自适应确定、输出与初始权值无关等特点。

3改进的RBF神经网络对期货价格的实例预测

3.1主成分分析

期货的价格是受很多因素影响,如国家政策、季节气候、供求关系、战争等,所以其价格会上下波动,呈现出一个非线性时间序列。其交易价格本文选取2007年6月7日至8月29日燃油0801每个交易日的开盘价、最高价、最低价、收盘价、交易量、持仓量、前5日均价、前10日均价为初始变量,每个变量60个数据,前59个为训练样本,最后一个为检测样本。考虑到期货交易与股票交易的不同,其交易方式是双向交易,从投资者获利的角度考虑,其并不像股票市场一样单纯的考虑股票价格增长,加上每个星期正常的期货交易日仅为5天,所以在这里我们考虑选取后5日均价作为预测目标,这样的选择更有实际意义。在这里本文直接利用SPSS软件包,选择数据降维,再选用主成分分析,可以直接得到各个主成分的方差累计贡献率,如表1所示:

从表中我们可以看出,第一个主成分主要包含了开盘价、最高价、最低价、收盘价、以及前5日均价共五个变量的信息,第二个主成分主要包含了成交量和持仓量两个变量的信息,而第三个主成分则主要包含了前十日均价一个变量的信息。由此可以看出,通过数据降维,将原来的8个变量,转化为现在的3个变量了。

3.2神经网络的设计及训练

现设计一个三层的神经网络,输入层有3个神经元,输出层神经元为1个。利用下式对输入、输出值进行标准化,可使得输入、输出值其均落在[-1,1]区间。

xn=2*(x-minx)/(maxx-minx)-1

在matlab的神经网络工具箱中用newrb函数设计这个径向基函数网络,用其作函数逼近时,可自动增加隐含层神经元,直到达到均方误差为止,利用语句:net=newrb(P,T,GOAL,SPREAD)进行网络设计,其中GOAL为均方误差,这里取值为0.0001,SPREAD为径向基函数的扩展速度,其值越大,函数的拟合就越平滑。经过试验,当其取0.058时,其预测效果最好。把2007年6月7日至8月28日的燃油0801选定的主成分作为输入的训练样本,标准化的后5日均价的值作为输出的训练样本,8月29日的数据作为测试样本,计算结果如下:

4结语

由此可看出基于主成分分析法的径向基神经网络较一般的径向基网络有更简洁的网络结构,对于相对比较复杂的期货价格预测,基于主成分分析法的径向基神经网络得到的结果也更加精确。不过径向基神经网络本身对扩展速度的选择没有一个固定的标准,不同的值得到的结果有较大的偏差,这是该网络的一个缺陷,也是今后研究的一个方向。

参考文献

[1]黄颖,白玫,李自珍.基于主成分-BP神经网络的期货市场预测[J].数学的实践与认识.2007,(7):23-26.

神经网络基本原理篇2

许多金融学家和计量学家对发达国家成熟市场的波动性进行了广泛的研究,但是在对股市的预测上,由于人们在知识、能力、经验上存在着较大的差异,加之问题本身又具有很大的随机性和高度的非线性,即使是一些金融专家、炒股高手对出现的同一复杂行情进行分析,往往也会得出不同的结论。此外,传统方法还要事先知道各种参数,以及这些参数在什么情况下应作怎样的修正。这都给预测股市带来一定的困难。

基于以上股市预测的困难性,本文提出了人工神经网络的预测方法。随着计算机、人工智能尤其是专家系统的发展,人工神经网络技术逐渐成熟并开始应用于各个领域。人工神经网络(ANN,简称神经网络)作为一种由大量简单神经元广泛相互联接而成的非线性映射或自适应动力系统,恰好能有效解决股市预测处理中常见的困难,因此它很快在股市预测分析与处理领域得到了广泛的应用。

2.BP神经网络介绍

2.1 BP 网络算法的基本原理

2.1.1 标准的BP 网络算法的基本原理

BP(Back Propagation)网络是反向传播的多层前馈式网络,是目前使用最为广泛的一种人工神经网络。它的核心是BP算法,一种对于多基本子系统构成的大系统进行微商计算的严格而有效的方法,采用最小均方差学习方式。BP 神经网络的原理说到底就是给它一些输入变量,然后就有一个输出,输出值的情况与实际的情况进行比较,差多少,然后再进行网络的内部调整,属于有导师的学习规则,使得网络输出与实际逼近。

神经网络能学习和存贮大量的输入―输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。人工神经网络由非线性函数组成,而由一系列不同权重的线性过滤器组合而成:

2.1.2 BP网络算法的优化

由于常用的BP算法主要缺点为收敛速度慢,局部极值,难以确定隐含层和隐含层的个数,使得在实际应用中BP算法很难应用,因此,出现了许多改进算法。BP算法的改进主要有两种途径,一种是采用启发式学习方法;另一种则是采用更有效的优化算法,本文采用了动量法和学习率自适应调整的策略,从而提高了学习速度并增加了算法的可靠性。动量法降低了网络对于误差曲面局部极值的敏感性,有效地抑制了网络陷于局部极小。

2.2 BP神经网络的模型识别及步骤

模式通常指对事物的一种定量描述或结构描述,“识别”是指对客观事物按其物理特征进行分类。模式识别的基本原理就是从待识别对象和理想标本之间若干特征的相似性推断它们之间总体的相似性。BP神经网络模式识别过程分为训练阶段和模式分类阶段,分为初始化、数据与处理、网络训练以及模式分类四个步骤。以下利用实证分析来进行着四个步骤。

3.实例分析

下面以上证的某股600个交易日的股票价格收盘指数作为原始样本数据,对上述神经网络模型进行求解,预测20天的收盘价,与实际收盘价进行比较,并求出其误差:

式中,表示第日的实际收盘指数,表示第日的预测值,表示误差。主要按照如下几部分来处理:(1)准备600个数据的时间序列,进行归一化。BP神经网络中每个神经元的输出值由传递函数Sigmoid函数来计算,其输出值的范围是(0,1);(2)留出最后20个数据,作为预测检验使用;(3)绘制图像,包括实际值和预测值,能量函数;(4)分析实际和预测两曲线的趋势。

采用I-J-K学习模型,该模型是输入层I个神经元,隐层J 个神经元,输出层K个神经元。利用BP神经网络模型训练500次、800次、1000次的输出值和期望值以及能量函数(或者叫误差函数)E,结果见图1到图3。

通过上面的图示,可以看到用BP神经网络预测的效果比较明显,这说明该模型适用于短期预测吗,股市的波动在很多地区都是非常剧烈的,各种因素的综合作用也使得长期股指的变动具有极大的不确定性,使得预测变得很困难。而BP网络的算法原理和自学习的特点使其能够充分挖掘出隐含在样本数据中的规律性,实现从输入空间到输出空间的非线性映射,对样本数据进行精确的拟合。从而BP神经网络的方法对于股市上的一些很难看出规律的数据列的预测而言,无疑是一个比较精确的预测方法。

4.结论

本文介绍了股市的特点以及股市预测的困难性,提出了利用BP神经网络的方法来解决股市预测问题。文章介绍了BP神经网络算法的基本原理,BP神经网络算法的优化,BP神经网络模型识别及步骤,最后后以上海证券交易所每日股票价格收盘指数为分析对象,把原理应用于实际,利用BP神经网络对股票价格收盘指数进行了短期预测,并计算出预测值和实际值的误差。通过实验发现该模型收敛速度快,预测精度非常高,对预测短周期内股指波动具有较强的适用性。

参考文献

[1]高琴.人工神经网络在股市预测模型中的应用[J].微电子学与计算机,2007年第24卷第11期.

[2]周翠红,路迈西.线性回归与人工神经网络预测煤炭发热量[J].煤炭科学技术,第37卷第12期.

[3]尹庆双,奉莹.人工神经网络在第三产业就业分析中的应用[J].人口与经济,2009年第6期.

[4]邹文安,刘宝,姜波,杨春生.基于Excel 技术平台人工神经网络BP模型及应用[J].水文,第30卷第1期.

[5]康进,刘敬伟.非参数回归估计与人工神经网络方法的预测效果比较[J].统计与决策,2009年第23 期.

神经网络基本原理篇3

本文根据某大型炼油化工有限公司的主要生产工段提供的安全状态原始指标数据,在对整个企业进行安全评价的数据整理和分析基础之上,进行安全评价网络结构、相应参数以及网络训练过程参数的设计,对网络性能进行综合测试,以达到适应石化企业安全评价的目的。根据对某大型炼油化工有限公司提供的原油脱盆脱水工段、减压蒸馏工段、催化裂化_T一段、催化重整工段、加氢裂化工段、延迟焦化工段、炼厂气加工工段的生产装备因素指标安全原始数据进行分析和整理,得出20个实例样本,其中15个样本用来完成对神经网络的训练,5个样本用来结果验证。原始数据的训练结果期望目标值与评价结果的输出如下表(安全评价输出结果等级划分对照表):

一,安全评价系统神经网络结构的确定

人工神经网络的拓扑结构是由网络的层数、各层的节点数以及节点之间的连接方式组成的。本研究拟采用小波神经网络对化工企业安全生产进行建模评价。如前所述,小波神经网络只有相邻层上的节点相互连接,所以,在设计网络的结构时,关键的参数只涉及到网络的层数和各层的神经元个数。

网络的层数对网络的性能具有重要的影响,确定网络层数的方法是通过大量对实际问题的求解来寻求最合适的网络层数。在确定了网络的层数之后,各层的神经元个数同样也是需要确定的关键参数,神经元的个数对网络的训练及网络收敛速度存在很显著的影响,如果隐含层的节点数太少,网络不能建立复杂的判断界,从而无法识别以前没有的样本,且容错性差;而节点数过多,则学习时间长,使网络的泛化能力降低。在函待解决的评价问题上,对应于各评价指标体系,网络的输入层和输出层的神经元个数是确定的,可以调整的参数是隐含层及隐含层神经元的个数。

在前面分析的基础上,综合考虑整个评价问题,决定采用三层神经网络结构模型。由于化工企业安全评价指标体系中各个单元的评价指标数目不同,在对网络进行训练时隐含层的神经元个数根据各评价单元的收敛情况进行适当的调整。

二、网络样本输入数据的初始化

1,数据初始化的方法

在神经网络的训练过程中,传递激活函数是网络训练的关键环节。传递函数的特征要求输入的信息数据必须在区间[0,1]之内,因此必须对网络训练所需要的原始数据进行初始化处理,使它们转化为分布在[0,1]区间范围内的数据。初始化的具体方法取决于原始数据的数量级,根据每组输入数据中的最大值来确定初始化的数量级,并根据下式确定用于网络输入的数据。

2,网络训练样本数据的准备

根据相关的评价指标体系各单元指标以及对人工神经网络进行理论分析的结果,准备基于神经网络的安全评价模型的训练样本数据。根据对某大型炼油化工有限公司提供的原油脱盐脱水工段、减压蒸馏工段、催化裂化工段、催化重整工段、加氢裂化工段、延迟焦化工段、炼厂气加工工段的安全原始数据进行分析和整理,得出20个实例样本,应用这些实例样本完成对小波神经网络的训练。

在神经网络的训练过程中,传递激活函数是网络训练的关键环节。传递函数的特征要求输入的信息数据必须在区间[O,1]之内,因此必须对网络训练所需要的原始数据进行初始化处理,使它们转化为分布在[O,1]区间范围内的数据表。

3,网络训练过程及结果

根据上面的训练样本数据使用MATLAB6.5软件对网络进行训练,使误差落在要求的范围之内并确定网络内部结构参数权值。网络结构参数表示为(L一M一N),其中,L为网络输入矢量的个数,M为隐含层神经元的个数,N为输出层神经元的个数,在本训练中均为5。网络结构参数确定之后,将获得的原始数据输入,对各因素的网络进行训练,由此可以实现从因素到结果之间映射知识的获取,即分别获得网络单元之间的连接权值向量及各隐含层的阈值向量。

生产装备因素。网络结构参数为(4-11-5),网络迭代次数n=3824.

生产人员素质因素。网络结构参数为(10-12-5),网络迭代次数n=2348.

管理因素。网络结构参数为(3-10-5),网络迭代次数n=3407.

环境条件因素。网络结构参数为(3-7-5),网络迭代次数n=2986.

通过训练获得的神经网络模型即可用于对新的输入进行结果的预测评价。由此可知,蕴藏于神经网络中的知识的获取可以通过计算机软件的学习来实现,参与安全评价的专家只需要提供一定数量的实例以及它们所对应的解,并且只需要知道实例与解之间存在着某种特定关系,而对于究竟具体是何种关系,可以由计算机学习来获得,只要所使用的实例样本空间足够大,就可以比较准确地模拟人的思维判断。

参考文献:

神经网络基本原理篇4

网络给我们带来巨大机会和发展的同时也给我们带来了恶意入侵的危险。就现在的整体情况来看,经常使用的网络安全技术还局限于防火墙等一些静态的安全保护方式,要是没有积极主动的一些安全防护方式相配合,他的安全性能就是有残缺的。开发一种主动防御、及时控制的技术就很有必要。入侵检测技术恰恰就是这样的一种技术。入侵检测在国内有很多文献进行研究,目前入侵检测存在的最大问题是检测中误报率较高。所以我们要提高入侵检测的智能型。神经网络顾名思义模仿人的大脑,具有很好的并行计算,自适应计算,抗干扰和智能判断的特征,可以准确处理失真信号。这些特征能优化现有的入侵检测方法,是发展的必然趋势。

1网络攻击的分类

从攻击的技术手段方面看,网络攻击分为两大类。第一类分析攻击行为,并在数据包的载荷部分把其特征隐藏。有字符串结合而成的,服务于系统的一些常用命令,没有被显示出来。但是一旦点击包含此字符串的对象,入侵行为就被激活。这种利用计算机本身系统结构特点和应用层协议的一些漏洞产生的攻击称为高层网络攻击。第二类攻击称为低层网络攻击。主要攻击发生在网络连接的时间和数据流量上,这类攻击主要是针对TCP/IP协议栈中的基础协议的漏洞进行攻击。

2入侵检测原型总体结构

图1描述了原型的总体结构模型。对主要模块的总体功能进行如下介绍。

1)数据捕获模块,捕获在系统中运行的数据包,预处理模块处理这些数据包。在实现时,将网络接口设成混杂模式,方便数据流通,并同时监听经过设备的数据[1]。

2)数据预处理模块分析网络上获得的信息,对数据包根据协议类型一层一层解析。记录和计算TCP连接信息,半开连接信息,保护网络主机不同端口连接信息和半开连接信息,并对SYN报文和FIN报文的链表状态和链表结点进行维护。IP协议处理函数中进行碎片信息的处理和记录,目的是把基于碎片的拒绝服务攻击提供给神经网络模块。总结信息并把信息转化,进行归一化处理,结合TCP数据报的标志位送入神经网络检测模块,检测攻击的存在。最后把得到的特征用于ICMP协议的扫描或攻击检测。

3)数据预处理模块把得到的特征传给神经网络检测模块,神经网络检测模块负责计算输出层的输出结果,并根据结果判断攻击。神经网络检测模块有三大模块构成。能检测网络漏洞扫描和TCP协议中拒绝服务攻击的TCP神经网络检测模块;能通过检测到拒绝服务攻击和ICMP的IP神经网络检测模块;基于ICMP的主机活性扫描和拒绝服务攻击的检测被神经网络检测模块实现。

4)神经网络训练模块对己知的网络攻击离线训练,以矩阵形式将训练好的神经网络的各层连接权存入磁盘文件中,在系统开始运行时神经网络检测模块读入磁盘中的权值到神经网络结构中。神经网络训练模块也可分为TCP神经网络训练模块、m神经网络训练模块和ICMP神经网络训练模块[1]。

5)响应报警模块报告当前的被检测数据对象是否存在攻击的迹象,判断依据是神经网络的输出。

3基于神经网络入侵检测原型详细设计

详细设计分为数据捕获模块、数据预处理模块、神经网络训练模块、神经网络测试模块、响应报警模块五个模块。

数据捕获模块。网络数据的捕获通过Libpcap编程接口实现。这种接口是网络数据包的标准捕获接口,它效率高、独立性和移植性强。使用具有快速的网络数据包过滤功能的BPF数据包捕获机制。数据捕获过程中通过Libpcap截获网络数据包。

数据预处理模块。数据预处理模块接收网络数据包,这些数据包由数据捕获模块送过来。接收后先处理这些数据包,并将处理的结果转化为向量送入神经网络检测模块检测。数据预处理模块处理的数据包分别针对三种协议:IP、TCP、ICMP。IP协议的预处理主要提取针对基于m碎片的攻击特征;TCP协议的预处理针对基于TCP协议网络扫描并对拒绝服务攻击特征提取。

神经网络训练模块。采用双隐层BP神经网络作为神经网络训练模块的网络结构。离线状态下运行神经网络训练模块。网络攻击和正常网络流通的一些知识,让检测模块在对网络攻击事件进行检查入侵之前学会。提供给神经网络训练模块已知攻击的输入特征向量和与之对应的期望输出向量由系统管理员负责。本原型输入特征向量是预处理模块得到的可描述攻击行为的特征向量;期望输出数据一般为一串二进制0、1串指示了是何种具体的攻击。本原型对基于IP、ICMP、TCP协议的网络扫描和拒绝服务攻击进行检测,相应定义了三种(IP、ICMP、TCP)神经网络[2]。

神经网络检测模块。神经网络检测模块接受的特征向量是由预处理模块送来,这些特征向量做为神经网络的输入向量,是由神经网络的各层计算出结果,然后把结果在输出层输出。输出结果可能显示的是正常的数据流,可能指示某一种网络攻击,也可能是未知的结果即这个结果在神经网络训练时没有定义。针对这种情况,对于前两种情况,系统管理员应记录下这时神经网络的输入向量和输出向量,在神经网络进行训练时,加入这两种情况。对于后一种情况,需要在进行分析。

响应报警模块。响应报警模块对接受神经网络输出向量,根据编码的对应关系,判断攻击行为。发现对应的攻击。就会有相应的消息打印在屏幕上,并会有指示这种攻击的全局变量在系统中设置;若没有找到对应攻击,则不打印消息。理论上讲训练神经网络时,对输出向量的编码是0、1串。但真正的输出不会严格的是0、1串,所以约定,数值大于0.7的按1对待,小于0.3的按0对待。

改进后BP神经网络的训练

4神经网络训练流程

P代表样本总数。

F代表不合格样本数。

M代表正确率,设在1%-100%之间。

E为网络训练后要达到的精度,设为小数。

5神经网络检测

对参数和变量进行初始化;

从记事本文件中读取检测样本、期望值、权值、阈值;

for(n=1;n

{放入矩阵第一行;

{for(n=1;n

根据阈值和权值的到线性输出,放入矩阵第二行;

}

if(小于正确率) 不合格样本数++;

}

输出该组数据的检测结果;

end

正确率输出结果越接近l,表明可能受到攻击。

6 结束语

本文调研了常见的网络攻击手段,探讨了入侵检测技术的研究方法、入侵检测的发展方向。根据神经网络的特点,将神经网络与入侵检测结合。设计了一个简化的基于神经网络的网络入侵检测原型。原型通过统计底层网络协议的数据流量信息数据包协议头的信息,将这些信息预处理后送入已训练过的神经网络模块,以此判断当前网络数据流量存在的攻击或扫描行为。此原型提出了具有更高检测率并且能检测变种攻击的模块设计。

参考文献:

神经网络基本原理篇5

1 概述

数字识别在车辆牌照识别、银行支票识别和邮政储蓄票据识别等领域有着广泛的应用,因而成为研究人员近年来研究的一个焦点[1]。而人脑神经系统模型的建立为人工神经网络的产生提供了理论模型依据, 使其具有模拟人脑部分形象思维的能力[2],因而使其成为人工智能技术的重要组成部分和常用方法。人工神经网络由简单信息处理单元相互连接组成,通过简单处理单元间的相互作用来实现对其所接收信息的处理。而随着人工神经网络技术的快速发展,其为解决模式识别邻域的相关问题提供了新的解决思路和方法,其突出的优点在于它具有对接收信息可进行并行分布式处理能力和自我学习反馈能力,因而吸引了众多研究人员对其进行广泛和深入的研究。而误差反向传播网络(Back-Propagation),即BP神经网络,是一种典型的人工神经网络,它具有人工神经网络的所有优点,因而在众多技术邻域有着广泛的应用[3]。该文首先对BP神经网络的基本原理进行了详细介绍,在分析了其基本原理的基础上,针对数字识别问题,设计了一种利用BP神经网络技术进行数字识别的方法。经实验表明,该方法合理可行,且其识别效果正确有效。

2 相关原理与知识

由于本文针对数字识别问题,利用BP神经网络技术对其进行方法设计和实现,首先必须了解BP神经网络的基本原理,即了解其具体构成形式、模型分类和其功能特点。其次,在了解了BP神经网络基本原理的基础上,进一步了解其所处理数据的特点和组成形式,并根据处理数据的特点和其数据结构设计相应的数字识别方法。下面分别对它们进行详细的介绍。

2.1 BP神经网络基本原理

BP神经网络算法由数据信息流的前向计算,即正向信息流的正向传递,误差信息的反向回馈两个部分组成。当信息流进行正向传递时,其传递方向为从输入层到隐层再到输出层的顺序,器每层神经元所处的状态只会影响下一层神经元的状态。若在最后的输出层没有得到理想的输出信息,则应立即进入误差信息的反向回馈过程[6]。最终经过这两个过程的相互交替运行,同时在权向量空间使用误差函数梯度下降策略,动态迭代搜索得到一组权向量,使得该BP神经网络的误差函数值达到最小,从而完成对信息提取和记忆过程[7]。

2.2 BMP二值图像文件数据结构

由于本文处理的数据源为BMP二值图像,则必须了解其数据结构,才能对其进行进一步的识别方法设计。由数字图像处理基础知识可知,常见BMP二值图像文件的数据结构由以下三部分组成:(1)位图文件头,其包含了BMP二值图像的文件类型、文件大小和位图数据起始位置等信息;(2)位图信息头,它包含了BMP二值图像的位图宽度和高度、像素位数、压缩类型、位图分辨率和颜色定义等信息;(3)位图数据体,其记录了位图数据每一个像素点的像素值,记录顺序在扫描行内是从左到右,扫描行之间是从下到上。因此,根据BMP二值图像数据结构信息,读出所需要的图像数据,并对这些图像数据做进一步的处理。在本文给定的训练图像中,图像数据大小为80个字节,而图像数据体距离其文件头的偏移量为62个字节。但为了减少数据处理数量,该文在进行实验时直接使用位图数据体中的数据,没有通过读出位图文件头来得到位图数据体中的数据。

3 数字识别具体设计方法

由上文可知,该文使用数据源为图像大小为20*20的BMP二值图像,由于是对位图数据体的数据直接进行操作,因此省去了对图像其他数据结构数据的繁杂处理过程,将问题的核心转向BP神经网络的设计方法步骤。

4 实验结果

图4所示为BP神经网络训练及测试结果图。该文选择10个训练样本,通过实验结果可以看出,由这10个训练样本训练出来的BP神经网络对于训练样本中的图像数值识别率达100%,训练时间也比较短,其迭代次数大概为700次左右。对于一些含有噪声的图片,只要噪声系数小于0.85个字符,其数字识别率可达96%。

5 结束语

针对二值图像数字识别问题,该文在对BP神经网络的基础理论进行分析后,设计了一种基于BP神经网络的数字识别方法,并通过实验验证了该BP神经网络用于数字识别的可行性和有效性。而对于BP神经网络存在的收敛速度慢、易陷入局部最优和学习、记忆具有不稳定性等问题,还有待于对其进行一步研究。

参考文献:

[1] 韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.

[2] 吕俊,张兴华.几种快速BP算法的比较研究[J].现代电子技术,2003,24(167):96-99.

[3] 陆琼瑜,童学锋.BP算法改进的研究[J].计算机工程与设计,2007(10):96-97.

[4] Sven Behnke,Marcus Pfister.A Study on the Combination of Classifiers for Handwritten Digit Recognition,2004.

[5] 马耀名,黄敏.基于BP神经网络的数字识别研究[J].信息技术,2007(4):87-88.

[6] Hasan soltanzadeh.Mohammad Rahmati.Recogniton of Persian Handwritten Digits Using Image Profiles of Multiple Orientations[J].Pattern Recognition Leaers,2004(15).

神经网络基本原理篇6

近年来,随着国家高速公路迅猛发展,隧道建设数量也越来越多,规模也越来越大。在隧道施工过程中,由于围岩地质条件的多样性和复杂性,其施工事故发生率比其他岩土工程高且严重,给隧道工程施工人员身心带来严重的危害,社会影响恶劣,有悖于国家建设和谐社会的宗旨。这就要求用科学的方法对隧道施工生产系统进行安全分析与评估,预测事故发生的可能性[1]。

在传统的公路隧道施工生产系统安全评价中,经常使用的安全评价方法主要以定性安全评价方法为主,如专家论证法、安全检查表法及作业条件危险性评价法等[2,3]。近年来,在公路隧道施工生产系统安全评价中,引人了模糊综合评价的方法,取得了较好的决策效果[4]。但是,该方法缺乏对环境变化的自学习能力,对权值不能进行动态调整[5],而神经网络具有非线性逼近能力,具有自学习、自适应和并行分布处理能力,但其对不确定性知识的表达能力较差,因此,模糊控制与神经网络结合就可以优势互补,各取所长[6],在这方面已经出现了一些研究成果[7~11]。为此,本文把人工神经网络理论与模糊综合评价理论相融合,研究建立了一种模糊神经网络评价模型,对公路隧道施工的安全管理水平进行评价。

1模糊神经网络

1.1基本结构原理

模糊神经网络是由与人脑神经细胞相似的基本计算单元即神经元通过大规模并行、相互连接而成的网络系统,训练完的网络系统具有处理评估不确定性的能力,也具有记忆联想的能力,可以成为解决评估问题的有效工具,对未知对象作出较为客观正确的评估。

根据评估问题的要求,本文采用具有多输人单元和五输出单元的三层前馈神经网络,其中包括神经网络和模糊集合两方面的内容。

1.2神经网络

为了模拟人脑结构和功能的基本特性,前馈神经网络由许多非线性神经元组成,并行分布,多层连接。Robert Hecht一Nielson于1989年证明了对于任何在闭区间内的一个连续函数都可以用一个隐层的BP网络来逼近[12],因而一个三层的BP网络完全可以完成任意的输人层到输出层的变换。因此,本文研究的公路隧道施工系统安全评价模糊神经网络采用三层BP神经网络结构。输人层有 个神经元,输人向量 , ,输人层神经元 的输出是输人向量的各分分量 。隐层有个神经元 , ,若输人层神经元 与隐层神经元 之间的连接权值为 ,且隐层神经元 的阈值为 ,则隐层神经元 的输出为

(l)

式中 是神经元的激励函数,一般选取单调递增的有界非线性函数,这里选用Sigmoid函数:

(2)

由此,隐层神经元的输出为:

(3)

同理可得输出层神经元的输出为:

(4)

1.3学习算法

本网络采用BP学习算法,它是一种有教师的学习算法,其学习过程由信号的正向传播和误差的反向传播组成。基本原理是:设输人学习样本为 个,即输人矢量 ,已知其对应的期望输出矢量(教师信号)为 ,正向传播过程将学习样本输人模式 从输人层经隐含单元层逐层处理,并传向输出层,得到实际的输出矢量 ,如果在输出层不能得到期望输出 ,则转人反向传播,将 与 的误差信号通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而调整各神经元之间的连接权值,这种信号正向传播与误差反向传播得各层权值调整过程是周而复始地进行的,直到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。

网络的具体学习算法的计算模型如下:

对某一学习样本 ,误差函数为

(5)

式中: 、 分别为该样本的输出期望值和实际值。

对于所有学习样本 ,网络的总误差为

(6)

网络学习算法实际上就是求误差函数的极小值。利用非线性规划中的梯度下降法(最速下降法),使权值沿着误差函数的负梯度方向改变。

隐层与输出层之间的权值(及阈值) 的更新量 可表示为

(7)

式中: 为学习率,可取 。

将式(6)和(4)代入式(7),并利用复合函数求导的连锁规则,得

(8)

式中: 为迭代次数, 为误差信号

(9)

类似的,输入层与隐层之间的权值(及阈值)修正为

(10)

同理可得

式中 为误差信号

(11)

为了改善收敛性,提高网络的训练速度,避免训练过程发生振荡,对BP算法进行改进,在权值调整公式中增加一动量项,即从前一次权值调整量中取出一部分迭加到本次权值调整量中,即:

(12)

(13)

式中 为动量因子,一般有 。

1.4模糊集合

评估指标集由表征一类评估决策问题的若干性能指标组成。由于指标的量化含有不确定性,故用模糊方法加以处理[13]。评估指标的模糊集合 可表示为

(14)

式中: 是评估指标, 是相应指标的评价满意度, 。

评估指标集用其满意度表示,取值在[0,1]之间,作为模糊神经网络系统中神经网络的输人向量,这正好符合神经网络对输人向量特征化的要求。实践表明,经过对输人向量的特征化处理,可大大减少网络的学习时间,加速网络训练的收敛。

2隧道施工系统安全评价模糊神经网络

2.1指标体系与神经网络划分

实践证明,一个好的隧道施工系统安全评价方法应满足以下要求:评价指标能全面准确地反映出隧道施工系统的状况与技术质量特征;评价模式简单明了,可操作性强,易掌握;评价结论能反映隧道施工系统的合理性、经济性及安全可靠性;评价中所采用的数据易于获取,数据处理工作量小;顶层输出即为系统的专家评估,而每层各评估项目的子系统都可以用子结构表示。

每个子结构具有输人输出关系可表达为

(15)

其中 是子系统的输出, 是子系统的输人矢量, 为相应的专家(加权)知识。

评估专家系统中各子系统的评估由各自的模糊神经网络来完成。

这种对评估系统的结构分解和组合具有如下特点:

(1)每个子系统可以采用较少的神经元来实现神经网络的自学习和知识推理,这样既减少了学习样本数、提高了样本训练速度,又能够独立完成某一推理任务。

(2)分解的各子系统具有相对独立性,便于系统的修改、扩展和子系统的删除,从而具有良好的维护性。

(3)子系统的评估项目即为节点,在系统进行评估推理时产生的评估表示式可以很好地解释评估系统的推理过程,避免了神经网络权值难以理解所致的推理过程难以理解的弱点。

2.2网络的设计

评估问题是前向处理问题,所以选用如前所述的前向型模糊神经网络来实现。

(1)输人层

输人层是对模糊信息进行预处理的网层,主要用于对来自输人单元的输人值进行规范化处理,输出由系统模糊变量基本状态的隶属函数所确定的标准化的值,以便使其适应后面的处理。根据评价指标体系,对应20个指标构建BP网络的输入层为20个节点,将指标转换为相应指数后作为样本进入网络进行计算。

(2)隐层(模糊推理层)

该层是前向型模糊神经网络的核心,用以执行模糊关系的映射,将指标状态输入与评估结果输出联系起来。采用试探法选取模型的隐含层神经元数,即首先给定一个较小的隐含层神经元数,代入模型观察其收敛情况,然后逐渐增大,直至网络稳定收敛。通过计算该模型的隐含层神经元数为28个。

(3)输出层

输出层是求解模糊神经网络的结果,也是最后的评估结果。我们把评价因素论域中的每一因素分成5个评价等级,即

={安全( ),较安全( ),安全性一般( ),较不安全( ),不安全( )}

对应这5个等级,确定输出层为5个节点。这样就构建了一个“20―28―5”的3层BP网络作为评价体系的网络模型。

2.3模糊神经网络训练

网络设计好后,须对其进行训练,使网络具有再现专家评估的知识和经验的能力。样本数据来自我省已经建成的高速公路隧道施工的现场数据库,从中选取30组,其中20组数据作为训练样本,余下的10组作为测试样本。实际网络训练表明,当训练步数为12875时,达到了目标要求的允差,获得模糊神经网络各节点的权值和阈值,网络训练学习成功。根据最大隶属度原则进行比较,与期望结果相符,其准确率为100%。这说明所建立的隧道施工系统安全评价模糊神经网络模型及训练结果可靠。

3 工程应用实例

利用所训练好的模糊神经网络模型,对江西省正在施工的某高速公路A3合同段3座隧道(北晨亭隧道、洪家坂隧道和窑坑隧道)施工系统进行安全评价测定,评价出系统的安全状况与3座隧道施工实际情况完全相符。同时,实际系统的评价结果又可作为新的学习样本输入网络模型,实现历史经验和新知识相结合,在发展过程中动态地评价系统的安全状态。

4 结论

(1)本文对模糊理论与神经网络融合技术进行了研究,建立了一种公路隧道施工系统安全模糊神经网络评价模型,利用历史样本数据进行学习训练和测试,并对工程实例进行了评价。结果显示,该评价方法可行,评价精度满足工程应用要求,为公路隧道施工安全评价探索了一种新的评价方法。

(2)运用模糊神经网络知识存储和自适应性特征,通过适当补充学习样本,可以实现历史经验与新知识完美结合,在发展过程中动态地评价公路隧道施工系统的安全状态,可及时评估出施工系统的安全状况,尽早发现安全隐患。

参考文献:

[1]徐德蜀.安全科学与工程导论[M].北京:化学工业出版社,2005.

[2]刘铁民,张兴凯,刘功智.安全评价方法应用指南[M].北京:化学工业出版社,2005.

[3]田建,李志强,张斌.交通建设工程安全评价技术现状及趋势研究[J].中国安全科学学报,2008,18(6):171-176.

[4]张鸿,刘优平,黎剑华等.基于模糊理论的隧道施工安全预警模型研究及应用[J].中国安全科学学报,2009.19(4):5-10.

[5]刘辉,王海宁,吕志飞.模糊神经网络技术在矿山安全评价中的适应性研究[J].中国安全生产科学技术,2005,1(3):54-59.

[6]张吉礼.模糊-神经网络控制原理与工程应用[M].哈尔滨:哈尔滨工业大学出版社,2004.

[7]葛淑杰,李彦峰,姜天文等.基于模糊神经网络的煤矿安全评价综合评判[J].黑龙江科技学院学报,2007,17(4):321-325.

[8]郑恒,汪佩兰.模糊神经网络在火工品生产系统安全评价中的应用[J].安全与环境学报,2004,4:159-162.

[9田军.基于模糊神经网络的隧道围岩分级系统[J].湖南交通科技,2007,34(4):104-107.

[10]郭宇航,王保国.两类新型神经网络及其在安全评价中的应用[J].中国安全科学学报,2008,18(7):28-33.

[11]宋瑞,邓宝.神经元网络在安全评价中的应用[J].中国安全科学学报,2005,15(3):78-81.

[12]韩力群.人工神经网络理论、设计及应用[M].北京:化学工业出版社,2007.

神经网络基本原理篇7

随着计算机、通信以及互联网技术的飞速发展及应用,网络作为一种重要的工具,在军事、政治、经济和科研等诸多领域起着越来越重要的作用,已经成为社会生产和生活必不可少的一部分。与此同时,网络的规模和复杂性不断增大,一旦网络发生故障,如果不能在有效时间内对网络故障进行诊断与修复,将会造成巨大的损失,甚至严重威胁社会的安全与稳定,因此对网络故障诊断技术进行研究具有越来越重要的应用价值和现实意义。

1 网络故障诊断一般过程

通常来说,网络故障诊断是以网络原理、网络配置和网络运行的知识为基础,根据网络出现的故障现象,并使用专门的网管理和检测工具以获取告警信息进而对网络中出现的故障进行诊断、恢复以及预测的过程,一般可分为以下五个部分[1]:

(1)故障检测,即网络故障告警信息的获取。网络发生故障时,通过主动轮询或异步收集方式,对网络中的相关设备或服务的相关告警信息、设置和性能参数,状态信息等进行收集和分析,及时发现网络出现的故障及问题。

(2)故障定位,即定位故障源。对故障检测阶段收集的海量告警数据进行分析和处理,在网络中找出故障,为下一步的故障原因的诊断提供依据。

(3)故障原因的诊断,即查找故障产生的根源。根据故障定位的结果综合运用各种规则进行系统的推理,快速的找到故障产生的原因或者最可能的原因。

(4)故障修复。根据网络故障诊断结果修复网络故障,恢复网络的正常运行。

(5)故障预测,即根据先验知识和监测数据预测网络可能发生的故障。

其中故障检测,故障定位,故障原因诊断是必不可少的三个步骤,下面将重点对上述三个步骤进行详细的介绍。

2 网络故障检测

通常计算机网络通过以下两种方式收集信息,通过分析收集到的信息来检测故障[2]。

(1)Trap机制。在网络中每一个被管设备中都要运行一个程序以便和管理站中的管理程序进行通信。

(2)主动轮询。网络中发生故障的被管设备或服务主动向网络管理系统发出告警信息,能够及时发现网络中的故障,网络管理系统还需通过主动轮询这种方式了解与网络性能密切相关的信息,并对这些影响网络性能信息设置阈值,来判断网络性能,超过设定阈值也会触发事件。

3 网络故障定位

网络系统中,一般通过监测被管设备或服务等各种方法获取大量原始告警数据或历史积累信息,这些数据往往由于通信系统的复杂性、网络结构异构性、噪声、外界因素、因果关系等原因而具有相当大的不确定性和不精确性,导致故障症状和故障原因都存在非线性映射关系,需要利用关联技术对数据进行处理和分析才有效的进行故障定位[3],目前常用的故障定位技术主要有下面几种:

3.1 基于人工智能的故障定位技术

3.1.1 基于规则的推理技术

基于规则的推理(Rule-based Reason,RBR)是最简单的关联技术,已被用于多种构架。一般而言,基于规则的系统由三个组成部分组成,如图1所示。

(1)推理引擎,主要提供解决问题所需要的策略。

(2)知识库,提供和定义与问题相关的规则和专家知识。

(3)工作内存,主要提供解决问题所需要的数据。

在基于规则的推理的网络故障定位系统中,知识库充当一个专家的角色,利用从人类专家获取专家积累的经验和知识,这些知识主要包括对网络问题的定义以及当某一特定问题发生时,网络故障定位系统需要执行的操作。工作内存主要是利用具体的网络协议对网络中的被管设备或服务进行监测,得到有关被管设备或服务的各种信息。在对网络故障进行定位时,推理引擎与知识库共同合作,将监测得到的网络中被管设备或服务的状态信息与知识库中定义好的条件部分进行比对,根据条件满足与否,来进行网络故障的定位。

基于规则的网络故障定位系统,由于无需对专家系统的具体结构和操作细节进行深入了解,从而具有结构简单等诸多优点,并且实现起来比较简单,非常适用于小型系统。但是基于规则的网络故障定位系统在匹配规则时,需要网络状态与知识库中的规则条件精确匹配,否则将推出整个推理过程,无法定位故障,并且规则存在不易维护性和指数增长性,所有这些缺点决定了基于规则的网络故障定位系统不适用大型系统。

3.1.2 基于模型的推理技术

基于模型的推理(Model-based Reason,MBR)是建立在面向对象上的基础之上,利用现有的专家经验和知识,将具体的目标系统中的实体都模型化诊断对象,并且明确地表现出现实目标系统中对象之间存在的各种关联关系,再根据系统模型对具体的目标系统的行为进行推测。由于通常情况下,具体的目标系统与理想的系统模型之间存在差异性,因此基于模型的推理的专家系统需要对推测的行为和目标系统的实际行为进行不一致诊断,以确定具体目标系统中的故障根源。

为了更好地说明基于模型的推理专家系统的工作流程,文献[4]使用一个物理模型和对应的对等模型分别如图2、3所示的网络系统。网络系统按一定的周期,有规律的向图2中的被管设备发送ping命令以监测网络系统中的被管设备是否运行正常。管理系统和被管设备之间通过一个模型对象实现彼此之间的相互通信,具体来说,如图2所示,系统中的集线器模型向被管设备集线器发送ping命令,路由器模型则向被管设备路由器发送ping命令。当目标网络发生故障时,如果故障发生在集线器1,则集线器1模型可以将其发现并且识别出来,如果集线器1模型连续3次向被管设备集线器1发送ping命令,在3次响应超时以后,集线器模型1根据现有的网络现象推测被管设备集线器1有可能发生故障,或者说目标系统中的故障位于集线器1。集线器1模型则会在确定故障并正式发送告警信息之前,集线器1模型将分析自身与图2中其他被管设备的模型之间的关系以此来确定其是否应该询问网络中路由器模型,如网络中的路由器模型返回的是相应的被管路由器设备工作处于正常状态,则集线器1触发警报。

3.1.3 基于范例的推理技术

基于范例的推理(Case-based Reason,CBR)故障定位技术与前面的基于规则推理技术和基于模型推理技术相比具有很大的差异性,主要因为基于范例的推理技术的思想源于人类现实生活,主要根据过去积累的实际经验或经历,利用类比的推理方法对现有的新问题做出相似的解答,然后根据新问题与旧问题之间的差异对解答进行修改从而得到新问题的完全解答。基于范例推理的网络故障定位技术主要由四个部分组成,检索 (Retrieve)、复用(Reuse)、修正(Revise)、保存(Retain),简称4R过程。

基于范例推理的故障定位技术与基于规则推理的故障定位技术相比,由于在基于范例推理的故障定位技术中检索只是基于对案例的部分匹配,而基于规则推理的故障定位技术则是完全匹配,因此基于范例推理的故障定位技术对网络配置变化的适应度更好,更适用于问题的总体解决方案。

3.2 模型遍历技术

模型遍历技术(Model traversing techniques)是一种构建网络故障传播模型的方法,该方法在构建故障传播模型时,主要根据网络在运行时各种被管对象之间的相互关系,并且按照从引起事件的被管对象开始的顺序进行构建。该方法主要适用于网络中被管对象之间的相互关系类似于图形,并且一般情况下较容易获取的情况,并且在系统配置变化较频繁时该方法的鲁棒性很好。模型遍历技术主要具有两大特点,事件驱动和事件关联,所谓事件驱动是指在一个故障症状报告到来之前,系统一直处于等待故障症状状态;事件关联则是确定两个故障症状是否来源同一个事件源。

一般情况下,模型遍历技术需要在其事件报告中明确标识网络系统中故障的征兆类型、征兆目标等相关信息,如果网络系统中出现故障征兆,且不妨用si来表示该故障征兆,当si的目标和si来源相同,则说明si是一个次要征兆也就说明某些告警信息可以被忽略。模型遍历技术的整个处理可分为以下3步:

(1)首先,对网络中的每个事件,依据网络在运行时各种被管对象之间的相互关系对其构建一个和事件源相关的对象图。

(2)当给定的两个事件的对象图相交时,此时说明两个图至少包含同一个对象,则认为这两个对象图的事件源是关联的。

(3)当给定三个故障症状si,sj,sk,其中si,sj相互关联,sj,sk相互关联,则根据故障症状的传递性可知si是一个次要的故障症状。

4 网络故障原因诊断

(1)基于信号处理方法。该方法主要是依据信号模型,直接对网络系统中的可测信号进行分析与处理,并通过提取可测信号的频率等特征值,对网络中存在的故障原因进行诊断。

(2)基于解析模型的方法。基于解析模型的方法主要依据数学模型和数学方法来进行故障原因的诊断,在诊断时需要建立对象的精确数学模型。

(3)基于知识检测的方法。与基于解析模型方法相比,此方法最大的特点在于其并不需要对象的精确数学模型就可以对网络中的故障原因进行诊断。

下面主要介绍几种目前国内外研究学者研究比较多的基于知识检测的方法,基于专家系统故障原因诊断方法和基于模糊理论故障原因诊断方法以及基于BP神经网络故障原因检测方法。

4.1 基于专家系统故障原因诊断方法

基于专家系统故障原因诊断系统主要是利用人类专家的经验和历史积累诊断数据,使用一定的方法将其转化为系统能够识别的规则存在专家系统的知识库中。当网络中出现故障时,诊断系统利用专家系统知识库中的规则,对发生故障网络中的被管对象的各项性能参数进行处理与分析以正确的确定网络故障发生的具体原因[5]。组成由人机接口、推理机、知识库等六部分组成:

目前,国内外学者公认的专家系统瓶颈是知识获取问题,因为专家系统在诊断过程中主要依赖于从人类专家领域内获取的知识、经验和以往诊断数据,而这些获取起来途径有限,操作起来具有一定的局限性和复杂性。另外,专家系统在实时性和学习能力等方面也存在一定的局限性,因此目前通常将专家系统同其他方法相结合以提高专家系统在这些方面存在的局限性和不足。

4.2 模糊故障诊断方法

很多时候,网络中的故障与系统得到的网络现象之间存在非线性的映射关系,这种非线性的映射关系很难用确定的数学公式或者模型来刻画,相应的在故障原因诊断时,很难给出故障的精确原因。相反,只能给出故障发生的可能原因。对于这种存在一定模糊性的问题,可以使用模糊逻辑来解决。

目前使用的比较多的是向量识别法,其诊断过程可分为以下3步:

首先,需要根据网络中的故障与表征网络故障的数据,建立二者之间的关系,通常用关系矩阵R来表示。

其次,对需要诊断的目标网络系统(对象)进行状态检测,提取相关的特征参数以构建特征向量矩阵X。

最后,根据模糊理论和矩阵理论,求解前面两步构建的关系矩阵方程Y=X・R,得到关系矩阵方程的解Y,再根据隶属度等原则,对目标网络系统的故障向量Y进行处理,得到故障的原因。

从上述诊断过程可知,在模糊故障诊断中,正确的进行故障原因诊断的前提是建立关系矩阵R、隶属函数、特征值向量X,而这些矩阵、函数、向量的建立是人为构造而成,难免具有一定的主观性,并且由于该模糊诊断方法对特征元素的选取也有一定的要求,所以两者若处理不当,会导致该方法的诊断结果精度严重下降甚至完全错误。

4.3 BP神经网络诊断方法

由于人工神经网络的这些特性以及网络中故障与征兆之间有可能存在的非线性映射关系,使得人工神经网络在网络故障诊断中大有用武之地。目前,人工神经网络已经大量应用在网络故障诊断领域。BP神经网络是常用的人工神经网络模型[6]。

BP神经网络故障诊断分为训练和诊断两个阶段:

(1)训练阶段。BP神经网络对样本进行训练,以选定网络结构和规模,确定网络总层数、各层神经元数。借助BP学习算法,将原始网络收集到的故障样本的特征参数作为BP神经网络输入样本集,以与之对应的网络故障原因编码为BP神经网络的输出,以此对BP神经网络进行训练。

(2)故障诊断阶段。主要对待检测对象的故障样本进行特征提取和归一化处理,然后输入到BP神经网络进行诊断输出诊断结果,整个过程分为以下4个步骤:1)故障样本集预处理。2)BP网络结构设计。3)训练BP神经网络。4)故障诊断。

5 结束语

本文对网络故障的概念以及基本过程进行了概述,重点对当前网络故障中的故障检测、故障定位、故障诊断的关键技术及方法进行了研究和总结归纳,对开展网络故障诊断技术研究具有一定的指导意义。

参考文献:

[1]王成等.网络故障诊断技术研究[J].科技信息,2011(11).

[2]陈琳.一种网络环境中的故障诊断模型[J].北京航空航天大学学报,2004(11).

[3]张燕.网络故障诊断关键技术[J].电脑知识与技术,2009(31).

[4]李千目.战略互联网智能诊断技术研究[D].南京理工大学,2005.

[5]吴晓知,李兴明.网络故障管理专家系统中知识库的构造[J].微计算机信息,2008(06).

神经网络基本原理篇8

金融时间序列的预测对于投资决策以及规避风险有重要的意义,其中股票市场走势预测始终更是金融领域分析的热点和难点。对于金融时间序列的预测是否足够准确影响着预测方法的有效性,较低的准确率使得预测失去了实际应用的意义。目前的金融时间序列预测方法有很大一部分是通过使用神经网络进行预测,神经网络本身具有良好的拟合非线性的特性,克服了类似于AR模型、MA模型和AMRA模型难于拟合非平稳序列的缺点[1]。在理论上,神经网络可以拟合任何函数,具有很好的自适应性和学习性。同时,由于神经网络计算的高效性,被广泛应用于预测时间序列领域。目前常用的用于预测时间序列的神经网络有BP神经网络、径向基神经网络以及小波神经网络。本文将对这三种神经网络在预测上证指数中的准确率进行比较分析。

2.神经网络概述及原理

2.1.BP神经网络

BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向传播[2]。向前传递是由输入层接收到外界信号后将信息传入到隐含层进行处理运算,之后传入到输出层。如果输出层得出的结果与预期不一致则产生预测误差,接下来就开始反向传递,根据预测误差调整网络权值和阀值,从而使BP神经网络预测输出不断逼近期望输出。

2.1.1 BP神经网络结构

BP神经网络模型如图1所示,包括输入层、输出层和隐含层。输入层负责将输入信号传递给隐含层,输入结点本身没有计算功能。

2.1.2 BP神经网络模型的建立

BP神经网络模型通过Matlab软件进行编程建模,数据的选取是利用大智慧软件选取1990-2012的5302个收盘价作为样本,其中,前5150个样本为训练样本训练神经网络,后152个样本为测试样本。为了提高神经网络的预测效率,加快训练速度,所以在训练神经网络之前将原始数据归一化。归一化公式为:(x-xmin)/(xmax-xmin),其中xmax代表最大值,xmin表示最小值;根据上证指数的特性,将BP网络的结构设计为三层,即输入层,隐含层和输出层;输入层有6个结点,即式(1)中的输入变量xi(i=1,2,…,n),表示预测时间结点的前6日收盘价;隐含层是该模型的运算核心,共有8个结点,其执行式(1)的运算,隐含层的输出结果为中间变量Oj(j=1,2…,l),变量Oj将被传入到输出节点进行运算;输出层有一个结点,执行式(3)的运算;选取第7日的收盘价为预期输出。

2.2.径向基神经网络

径向基神经网络即径向基函数神经网络。该型神经网络从输入层到隐含层通过径向基函数完成非线性变换;而隐单元到输出是线性映射的,因此输出层权值的调整可通过线性规划方程直接算出[3]。径向基神经网络一般有三层即输入层、隐含层和输出层。输人层由输入结点组成;隐含层中神经元采用的是径向基函数,该函数是局部响应函数;第三层为输出层。径向基神经网络的节点激活函数采用径向基函数。

2.2.1径向基神经网络结构

输入层只负责信号输入,输入层与隐含层的连接权值都为1,即输入层与隐含层的权值不用调整改变。隐含层结点的输出为:

3.实验结果

3.1三种神经网络模型的预测结果比较

4 结语:

上证指数的走势可以视为经济的运转状况的反映,而经济的运行状况受到社会中的各种因素和因素间的交互效应的影响,从而上证指数的走势具有很强的非平稳性以及非规律性,很难预测准确。本文比较了BP神经网络、径向基神经网络、小波神经网络对预测上证指数的准确性,发现BP神经网络的预测效果是三种神经网络最好的,表明BP型神经网络相比之下更加适用于对上证指数的预测。(作者单位:北京信息科技大学经济管理学院)

参考文献:

[1]徐超,魏连鑫,王卫新.基于小波网络的上证指数预测实证分析[J].时代金融,2011.(24):146.

[2]史峰,王小川,郁磊,李洋.Matlab神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.

神经网络基本原理篇9

叶螨是农业生产中的重要害虫之一,各类经济作物大都有叶螨为害。严重时常致使作物干枯落叶,生长停滞,严重影响产量和质量,在经济上造成很大的损失[1]。柑橘始叶螨(Eotetranychus kankitus)是叶螨的一种,中文别名为四斑黄蜘蛛,分布区域为中国大部分柑橘产区。

昆虫识别的方法有人工识别、声音识别、图像识别等。其中图像识别法是目前昆虫识别研究中的热点,具有准确度高、劳动量小和可视化等优点。赵汗青等[2]对农田害虫进行了成功的分类识别;张洪涛等[3]采用蚁群算法对储粮害虫图像识别进行了深入的研究。人工神经网络方法实现模式识别,可处理一些环境信息复杂、背景知识不清楚、推理规则不明确的问题,运行速度快,自适应性能好,具有较高的分辨率[4]。为此,在对柑橘始叶螨害虫形体特征提取的基础上,应用BP神经网络对其进行识别。

1 柑橘始叶螨图像获取及预处理

在江西农业大学百喜草生态园中种植的柑橘树上,通过数码相机在光线均匀的环境下采集带柑橘始叶螨的叶片图像,作为识别研究处理的样本图像。对获取的原始图像(图1)运用对比度扩展和中值滤波进行增强;利用模糊集熵自动提取阈值,并进行分割以形成二值化图像(图2);最后运用数学形态学算子滤除空洞、孤立点等噪声。经过预处理后的图像基本满足了后续特征提取和自动识别的要求。

2 基于BP神经网络的柑橘始叶螨的识别方法

吴沧海等[5]深入分析了柑橘始叶螨各种边缘特征检测算子的优劣,并指出采用形态学方法的检测结果比其他算子有明显的改善。数学形态学是数字图像处理技术的一个重要分支,利用数学形态学可以除去图像中不相关的结构特征,同时又可以保持图像的基本形状特征,用具有一定形态的结构元素去度量和提取图像中的形状,达到分析、识别图像的目的。数学形态学的基本运算是腐蚀和膨胀,利用一种针对植物虫害二值图像膨胀和腐蚀的快速算法[6],对柑橘始叶螨进行骨架特征提取,提取结果见图3。

目标的骨架特征是一个赖以分辨和识别的重要特征。在提取了柑橘始叶螨害虫的骨架特征后,就可让计算机系统识别这些特征。

考察的骨架特征因子有4个。①骨架点的分支数(B)。运用骨架树将柑橘始叶螨的骨架映射到一个二维的树结构中,再对树做广度优先遍历,计算每个骨架节点的分支数。②横轴纵轴比(R)。横轴长和纵轴长指图像中识别对象的最大体宽XL和最大体长YL,对应骨架图像分析中常用的边界的短轴和长轴,R=XL/YL。③孔洞数(H)。在昆虫分类中,背板上的斑点是重要的鉴别特征。柑橘始叶螨经过预处理后,这些斑点会呈现不同大小的孔洞,孔洞数在一定程度上能够反映目标的复杂度。④整体形状参数(F)。F=P2/(4π×A),其中P为目标整体周长,A为填充孔洞后的目标面积。形状参数可在一定程度上描述目标的紧凑性,具有尺度、旋转不变性。

此文以VC++ 6.0为开发工具,开发了基于BP神经网络的柑橘始叶螨的识别系统原型,主要对柑橘始叶螨、柑橘全爪螨[Panonychus citri (Me Gregor)]和柑橘瘤瘿螨(Aceria sheldoni)3类叶螨进行识别。BP神经网络是一种多层前向网络,由输入层、隐含层(可以是多层)和输出层组成,一种经典的3层BP神经网络模型如图4所示。BP神经网络的学习过程包括正向传播和反向传播,并在来回传播过程中不断进行误差修正。输入信号经由输入层在神经元核的函数作用后,逐层向隐含层、输出层传播。传播过程中有两类重要的参数,一类是神经元的权值,一类是核函数中阈值。这两类参数开始时需确定一组初值,然后在学习的过程中不断调节权值,使得输出误差信号最小或达到预设的目标。另外在神经网络的构建中,神经网络的层数及每层神经元的个数也对整个神经网络有重要的影响。除此外还包括学习步长、反向计算时的局部梯度、目标误差和指定训练次数等。

3 试验结果

将基于骨架的形态特征骨架点的分支数(B)、横轴纵轴比(R)、孔洞数(H)、整体形状参数(F)作为神经网络的输入,3种叶螨的归一化数据作为该神经网络的训练样本。试验结果见表1。

另外,同时采用基于图像像素灰度的神经网络识别方法来识别相同的样本数据,识别结果见表2。这种方法采用经过简单处理的原始图像灰度数据作为神经网络训练数据,省去了复杂的叶螨数字图像的骨架特征抽取部分,将原始图像灰度值直接作为神经网络的输入。这种方式下,由于输入模式维数的增加导致了神经网络规模的庞大,占用系统更多的内存资源,导致识别时间较本研究的基于数学形态学预处理的BP神经网络识别方法更长,一般用户难以接受。但基于图像像素灰度的神经网络识别方法既采用了全局信息又没有忽略细节信息,网络的抗干扰性能好,识别率较本研究稍高一些。试验数据表明,基于数学形态学和神经网络的叶螨识别方法识别快、适应性强、精度较高。

4 小结

针对柑橘始叶螨自动识别问题,采用基于骨架的形态特征提取方法,自动提取柑橘始叶螨的骨架数学形态特征,并将其作为BP神经网络的输入因子。通过多次试验,确定合适的BP神经网络相关参数。然后,使用VC++ 6.0设计了识别柑橘始叶螨、柑橘全爪螨和柑橘瘤瘿螨3类叶螨的原型系统,识别率均大于90%,每张图像样本平均识别时间小于1 s,较传统的采用图像像素灰度的神经网络识别方法识别时间有明显的下降。图像识别客观上受图像质量、图像种类影响较大,本研究仅针对叶螨家族中的3种螨虫做了探索性的识别研究,以后将扩大螨类识别研究的范围,针对不同螨类特征,设计识别能力更强的原型系统。

参考文献:

[1] 高德三,杨瑞生.害虫防治学[M].北京:中国农业大学出版社,2008.

[2] 赵汗青,沈佐锐,于新文. 数学形态特征应用于昆虫自动鉴别的研究[J].中国农业大学学报,2002,7(3):38-42.

[3] 张洪涛,毛罕平,邱道尹.储粮害虫图像识别中的特征提取[J].农业工程学报,2009,25(2):126-130.

神经网络基本原理篇10

神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期(自适应期,或设计期),此时各计算单元状态不变,各连接权值可修改(通过学习样本或其他方法),前一阶段较快,各单元的状态亦称短期记忆(STM),后一阶段慢的多,权及连接方式亦称长期记忆(LTM)〔1〕。

根据网络的拓扑结构和学习规则可将人工神经网络分为多种类型,如不含反馈的前向神经网络、层内有相互结合的前向网络、反馈网络、相互结合型网络等〔2〕。本文的人工神经网络模型是采用BP算法的多层前馈网络。

该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,连接权用Wij表示。各神经元的作用函数为Sigmoid函数,设神经网络输入层的p个节点,输出层有q个节点,k-1层的任意节点用l表示,k层的任意节点用j表示,k+1层的任意节点用l表示。Wij为k-1层的第i个神经元与k层的第j个神经元相连接的权值。k-1层的节点i输出为O(k-1)i,k层节点j的输出为:

k层节点j的输出为:

Okj=f(netkj)

设训练样本为(X,Ye),X为p维向量,加到输入层;Ye为q维向量,对应于期望输出;网络的实际输出Y也是q维向量。网络在接受样本对的训练过程中,采用BP算法,其权值调整量为:

ΔWij=-ηδkjO(k-1)i

其中,对于输出层为:

δkj=yj(1-yj)(yej-yj)

对于非输出层为:

η为训练步长,取0<η<1。

用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束〔3〕。

上述人工神经网络可以完成多种信息处理任务,如从二进制数据中提取相关知识,完成最近邻模式分类,实现数据聚集等。而本文要用的是其极强的数学逼近映射能力,即开发合适的函数f:ARnBRn,以自组织的方式响应以下的样本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。这里描述的是一般的数学抽象,像识别与分类这些计算都可以抽象为这样的一种近似数学映射。

所谓诊断,实质上是一个分类问题。即根据候诊者的症状,医学检查结果(如体温、心跳等)等一些情况,它们可以用一向量(e1,e2,…,em)来表示,将其归类为病人或非病人。这也可以转化为寻找一差别函数f使得:

(1)f(e1,e2,…,em)>ε, (e1,e2,…,em)∈T

(2)f(e1,e2,…,em)>ε, (e1,e2,…,em)T

其中集合T表示患病。

因此,病情诊断最终也可作为一类函数的逼近问题。

而许多研究已表明,前向神经网络可作为非线性逼近的标准型。对于实数空间的任一函数,只要它满足一定的条件,一定存在唯一的具有单一隐层的前向网络作为它的最优最佳逼近。而含有两个隐含层的前向网络可在任意的平方误差内逼近某一实函数〔3〕。

诊断步骤

肺癌病例数据选自1981~1994年在某医院住院的病人,共计551例。其中486例(88%)经病理学、细胞学诊断证实为肺癌。每一病例都包括多项数据,其中用于诊断的数据项有:病人的一般情况(如年龄、性别等),家族史、既往史、吸烟史、术后病理、X射线检查、CT检查、纤维支气管镜检查、PAT痰检等多达58项。因此,原则上 58项数据应作为神经网络的输入项,而神经网络的输出值就是病人是否患肺癌的结果。

1.网络训练集的确定:在最原始的551例病人数据中存在着各种各样的差别,如性别差异(419例男性,132例女性),诊断结果的差异(486例经证实为肺癌),所患肺癌种类的差异(鳞癌、小细胞癌、大细胞癌等),患病程度上的差异(早、中晚期的不同)等等。显然,训练数据集应最大限度地保证兼顾各种病例情况。经过仔细筛选,选择了含有460个病例的集合作为肺癌诊断用的网络的训练集。

2.神经网络输入和输出数据的预处理

按照人工神经网络的理论,神经网络的输入输出数据都应该属于(0,1)区间的实数,为此我们需对原始数据进行如下的规一化处理:

其中xi为原始数据项,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。这里X为原始数据集。经过(7)式变换后,yi将在(0,1)区间。因此,可作为神经网络的输入输出。

3.应用神经网络进行肺癌诊断

将描述病人各种情况的数据作为前向网络的输入数据加到其输入端,并按(1)~(6)式计算各神经元的输入和输出,同时调整神经元之间的连接权值以使网络的输出和实际的病例情况相符。即当病人确实患肺癌时网络的输出结果也恰好指示为肺癌,反之亦然。如果对所有的训练样本集网络的输出基本上(95%或更高)能保证与实际结果一致,则训练过程结束。我们认为神经网络已建立起病人的各种因素与他是否是肺癌患者之间的函数映射关系。对于一个新的候诊病人来说,只要将他的情况输入到训练好的神经网络中去,根据网络的输出结果就可以知道他是否已患肺癌。

表1 基于不同发病因素的诊断网络模型

型 训练集精度 测试集精度

基于遗传因素的诊断网 53.8% 46.3%

基于个人生活习惯的诊断网 57.1% 44.9%

基于病症的诊断网 89.4% 83.3%

基于医学检查结果的诊断网 98.5% 92.6%

上述结果表明不同类型的因素应分开来考虑。于是我们将58项输入数据分成四类,这四类有各自的BP诊断网,依次称为诊断一、诊断二、诊断三、诊断四。它们先单独测定,然后再将它们各自的结果综合起来得出最后的判断。

上述四种诊断网络所得结果的可靠性各不相同。其中,根据医学检查结果所作的诊断准确性最高,因此在最后的综合分析中要重点考虑它的诊断结果,我们给它设一个相对最高的权值。其次,根据病人的症状所作的诊断往往也具有较高的准确性,因此给它的权值也较高,但比医学检查结果的稍低。其他两类因素在有关肺癌的诊断中仅具参考作用,因而所设的权值相对较小。

最后的结果O为:

O=a1.O1+a2.O2+a3.O3+a4.O4

a1+a2+a3+a4=1

其中Oi,ai,i=1,2,3,4分别为各诊断网的输出及其对应的权值。

当O>0.5时最后的诊断结果为患肺癌,反之则正常。对所有的病例数据经上述方法的诊断结果见表2。

表2 神经网络对肺癌诊断结果分析

神经网络

诊断结果 训练数据 测试数据

肺癌患者 非肺癌患者 肺癌患者 非肺癌患者

+ 460 2 25 3

- 0 38 1 22

其中对于训练集,肺癌病人的正确检出率为100%,非肺癌病人误诊率为5%。对于测试集,肺癌病人的正确检出率为96.2%;非肺癌患者正确检出率为88%,误诊率为12%。

讨 论

1.本研究所采用的人工神经网络的肺癌诊断方法的结果较好地符合了已知数据,具有较高的准确性,特别是对于肺癌患者一般都能准确地做出诊断,有利于肺癌的早期发现和治疗。

2.要想进一步提高该方法的准确性,应该注意收集更多更全面的病例数据。人工神经网络主要是利用它能自动从数据集中抽取函数的关系的功能。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。

3.实现对肺癌的诊断的关键在于准确找到罹患肺癌的判定函数,可利用前向网络的函数逼近功能来实现。但是这里涉及到两个问题。首先,由于差别函数和预测率函数都是利用人工神经网络从已知的病例数据集中抽取出来的,它实际反映的是这些数据集中输入输出对的映射关系。因此要想保证诊断具有较高的准确性,就应该使用来建立函数关系的这些数据集(称训练集)具有充分的代表性,即这些数据应基本蕴含肺癌诊断的医学原理。这就涉及到如何选择网络合理的训练集及关键的输入项。另一个问题涉及到神经网络本身的要求,即网络的输入输出数据值都应在区间(0,1)中。这可以通过数据的编码和归一化来实现。

4.由于某些原因有些病人的病例数据不完整,约占总病例数据的10%左右。显然,如果按照传统的方法来建立肺癌病人的诊断模型〔4〕,这些有缺项的数据是不太好处理的,但是由于人工神经网络有较强的容错性,输入数据在某些项上的错误对网络最终结果的正确性影响不大。

参考文献

1.焦李成.神经网络系统理论.第1版.西安:西安电子科技大学出版社,1995,3

神经网络基本原理篇11

基金项目:本文系湖南理工学院教学改革研究项目(项目编号:2013B17)、湖南省教育厅科研基金(项目编号:10C0757)、湖南省自然科学基金(项目编号:11JJ2037)、湖南省高校科技创新团队(项目批准号:湘教通[2012]318号)支持计划资助的研究成果。

中图分类号:G647 文献标识码:A 文章编号:1007-0079(2013)35-0055-03

高校开展双语教学是高等教育与国际接轨的一条重要途径,也是我国高校教育改革与发展的必然趋势。双语课程教学[1-5]是我国高校普遍实施的一项具有探索性、前瞻性和创新性的教学改革,目前已取得了一定的成效。在逐步推进双语教学的过程中,对双语教学质量进行评价是一项十分重要的工作。由于双语教学与传统教学有着根本的区别,对它们应采取不同的评价方法。但是,在对双语教学质量进行评价的过程中,绝大部分高校都还缺乏适合于双语课程教学的专门评价指标体系,一般都依然沿用非双语课程的评价体系,致使教学管理部门难以获得对双语课程教学课程的有效评价。因此,建立高校双语教学质量评价指标体系,对课程进行定量评价显得十分必要。通过教学质量评价,能使学校能够及时了解双语教学课程的教学效果,有效地总结双语教学的成功经验,及时发现双语教学过程中存在的问题,有针对性地采取有效措施给予调整和完善,促进双语教学质量的不断提高。本文通过对影响双语教学质量的因素进行分析,对评价指标体系设计的原则进行探讨,建立了较完善的双语教学质量评价指标体系。将进化神经网络技术应用于高校双语课程课堂教学质量评价中,建立了高校双语教学质量评价模型,为高校双语教学质量评价提供了有益参考。

一、高校双语教学质量评价指标体系

1.高校双语教学质量评价指标体系的构建原则

构建高校双语教学质量评价指标体系时,首先当然要遵循教育科学的基本规律,在此基础上,还要充分考虑双语教学的特殊性,要体现双语教学课程的教学要求,要以提高双语效果为最终目标。双语教学的实施,要受社会发展程度、整个高等教育环境以及高校内部各种因素等多方面的制约。具体来说,影响高校双语教学质量的因素主要包括教师素质、学生素质、教学方法、教材质量、语言环境、管理体系等几个方面。正是因为影响双语教学质量的因素较多,所以,在对高校双语教学质量进行评价时,完全没必要对所有的教学质量特征都进行评价,往往需要从众多的原始数据和评价信息中筛选出一些有代表性而且独立性较强的主导性指标,用它们作为双语教学质量的评价指标,这样能够科学地、准确地表征双语教学质量的状况。

构建高校双语教学质量评价指标体系时,要遵循的原则主要包括:

(1)系统性原则。系统性评价是对双语教学质量的整体评价,而不单单从某一方面或某一内容去评价。双语教学质量的评价内容要覆盖双语教学各个环节,包括教师的备课、课堂教学过程的实施、作业的布置和评阅、课外的辅导和答疑等。

(2)科学性原则。评价指标体系应层次分明,各项评价指标要有明确的内涵,相互之间不能包含或重叠,更不能互相矛盾。随着教育改革的不断深入,评价指标体系也要不断更新。

(3)可行性原则。双语教学质量评价指标要符合目前高校教育教学改革的实际,评价标准是能够达到的,评价要点必须是可观察、可度量的,评价办法要简单可行、易于操作。

(4)导向性原则。开展双语教学质量评价,目的是为了以评促教、以评促学。在评价过程中,要坚持以学生为本,注重教学过程中学生的主体地位和主体作用的发挥,注重培养学生的能力。双语教学质量评价指标体系不仅仅是评价教师课堂教学质量的标准,更要成为教师教学工作的行为准则和努力方向。

(5)激励性原则。我国大部分高校的双语教学,目前都还处于成长初期,要实现双语教学的稳定发展,在制订评价指标体系时,应该以激励为导向,确保双语教学质量评价指标体系能有效地促进教师与学生在教学过程中共同发展,促进教学质量的提高。要注重教学过程中出现的闪光点,注重在教学过程中营造师生和谐融洽的氛围,并加以激发和鼓励。

2.高校双语教学质量评价指标体系的构成

在广泛开展双语教学调查研究的基础上,结合湖南理工学院双语教学课程的具体教学实践,构建了双语教学质量评价指标体系。设计的评价指标体系包括五个一级指标:教师素质、学生素质、教学过程、教学效果和管理体制,每个一级指标又被分解成若干个具体的二级指标,如图1所示。

其中,x1—x5分别表示教师是否具有较高的专业知识水平、较高的学术水平,是否具有出国经历和较强的外语应用能力,教学能力是否较强,教学态度是否较好;x6—x9分别表示学生否具有较好的专业知识基础,外语能力是否较好,学习态度是否端正,学习能力是否较强;x10—x15分别表示教材的选择是否合适,是否有丰富的教学资源,教学方法是否得当,教学内容是否有一定的广度和深度,课堂气氛是否活跃,考核方式是否合适;x16—x17分别表示学生专业知识掌握程度,外语水平提高程度;x18—x20分别表示教师准入制度是否严格,质量监控是否到位,是否有较强的政策支持力度。

二、基于进化神经网络的高校双语教学质量评价方法

1.一种进化神经网络算法

神经网络是一个模拟人的大脑神经系统的结构和功能来处理信息的复杂网络系统,凭借其强大的自学习、自适应、联想记忆等功能而获得了广泛的应用。在各种类型的神经网络中,BP神经网络[6-8]是一个杰出的代表,它是一种前向网络。典型的BP神经网络是由输入层、输出层和一个隐含层组成的三层网络,BP神经网络的学习算法简称BP算法,由于基本BP算法在学习过程中经常发生振荡,容易陷入局部极小值,收敛缓慢。为此,BP神经网络的学习过程通常采用附加动量法,算法的权值和阈值调节公式为:

(1)

(2)

其中,k为学习次数,α为学习率,mc为动量因子,,。

为了提高BP神经网络的学习速度和精度,本文采用文献[9]中的基于遗传算法的进化神经网络BP算法(GA-BP算法)来实现高校双语教学质量评价。该进化神经网络BP算法的基本思想是:首先用遗传算法对神经网络结构、初始连接权、初始阈值以及学习率和动量因子进行全面的优化设计,在解空间中定位出较好的搜索空间;然后用BP算法在这些小的解空间中对网络的连接权和阈值再次寻优,搜索出最优解。进化神经网络BP算法(GA-BP算法)流程如图2所示。

2.高校双语教学质量评价的BP神经网络模型

对高校双语教学质量进行评价时,具体的评价指标有20个,即x1,x2……x20,每个评价指标有五个评价等级:优秀、良好、中等、较差、差,评价目标同样也有这五个评价等级。

在算法的评价过程中,我们在对各评价指标进行数值化时,各个等级的取值方法如下:“优秀”取1,“良好”取2,“中等”取3,“较差”取4,“差”取5。在试验时,从测评数据集中选取了不同条件下的32个样本作为学习样本,形成了BP神经网络的学习样本集,部分学习样本如表1所示。

由于评价指标为20个,所以用于高校双语教学质量评价的BP神经网络的输入层单元数被选定为20个;同理,由于评价目标等级有5个,所以输出层单元数被选定为5个。为了减小网络规模,提高网络的训练速度,隐含层只设一层,对于隐含层单元数,本文采用如下估算公式来确定:

式中,NH表示隐含层单元数,NI表示输入层单元数,NO表示输出层单元数,NP表示学习样本数,这里NP的值取32。

按照这一估算方法,隐含层单元数估算结果为26个。于是,确定本文高校双语教学质量评价的BP神经网络结构为20-26-5,如图2所示。

3.评价实例

BP神经网络进化设计时,遗传算法的参数取值为:pc=0.7,pm=0.1,ph=0.1。BP神经网络训练时,精度要求为MSE≤10-4。在这一精度要求下,用选取的学习样本集对BP神经网络进行训练,在经过1265次训练后,BP神经网络达到收敛。在网络收敛之后再选取5个未曾学习过的新样本让网络进行评价,这些评价样本及评价结果分别如表2和表3 所示。

表3 评价结果

NO. 评价目标 实际输出

y1 y2 y3 y4 y5

1 优秀 0.989855 0.000292 0.001499 0.002650 0.001215

2 良好 0.001550 0.992985 0.000822 0.000615 0.000275

3 中等 0.003120 0.006520 0.987050 0.000852 0.003216

4 较差 0.002800 0.002952 0.001564 0.998087 0.005293

5 差 0.001853 0.004974 0.004268 0.005543 0.988210

从表3的评价结果可以看出,神经网络对这5个样本虽然未曾学习过,但就其评价结果来看,均与评价目标一致。这说明BP神经网络通过学习已具有较强的推理能力,能实现对高校双语教学质量的正确评价。

三、结语

在分析影响高校双语教学质量的因素和探讨评价指标体系构建原则的基础上,建立了有效的高校双语教学质量评价指标体系。采用进化神经网络方法,建立了高校双语教学质量评价模型。从评价过程来看,这种基于进化神经网络的双语教学质量评价方法具有以下优势:一是建立的评价模型完全依赖于评价数据,不需要考虑传统方法中的权重信息,避免了权重难以合理确定的间题;二是系统具有强大的自学习自适应能力,在环境条件发生变化时,系统只要通过重新学习就能正常工作。所以,进化神经网络技术在双语教学质量评价中的应用,为当前教学质量评价提供了一条新的途径,对建立智能化的高校双语教学质量评价辅助决策系统也具有参考价值。

参考文献:

[1]黄宝强,唐丽娟,肖小聪.双语教学质量评价指标体系的构建[J].中国电力教育,2012,(28):40-41.

[2]张静,赵静,张进明.试论高校双语教学评价体系的构建[J].高教探索,2007,(6):14-16.

[3]王韶辉,史仪凯.我国高校双语教学质量评估指标体系构建研究[J].北京大学学报(哲学社会科学版),2007,(5):291-292,290.

[4]方明,洪荭.财会类本科专业双语教学质量评价实证研究[J].财会通讯,2010,(7):33-35.

[5]张立倩.双语教学质量评价体系模型的研究[J].内蒙古农业大学学报(社会科学版),2013,15(1):67-69.

[6]马锐.人工神经网络原理[M].北京:机械工业出版社,2010.

神经网络基本原理篇12

1 概率神经网络原理与结构[3~5]

概率神经网络PNN是径向基网络的一个分支,是前馈网络的一种。它是一种有监督的网络分类器,基于概率统计思想,由Bayes分类规则构成,采用parzen窗函数密度估计方法估算条件概率,进行分类模式识别。

PNN的结构如图1所示。除输入层外,它由两层神经元构成。第一层采用径向基神经元,其个数与输入样本矢量的个数相同,第二层为竞争层,其神经元个数等于训练样本数据的种类个数,每个神经元分别对应于训练数据的一个类别。图中的模块C表示竞争传递函数,其功能是找出输入矢量n2中各元素的最大值,并且使与最大值对应类别的神经元输出为1,其它类别的神经元输出为0,这种网络得到的分类结果能够达到最大的正确概率。图1中P为输入矢量,R为输入矢量的维数,Q等于输入/目标矢量对的个数,即径向基层神经元个数,K为输入数据种类的个数,即输出层神经元的个数。图中的||dist||模块表示求取输入矢量和权值矢量的距离,此模型中采用高斯函数radbas作为径向基层神经元的传递函数。

图1 概率神经网络结构图

2 芳基酰类化合物抗癌活性的概率神经网络的建立

2.1 数据来源及预处理

根据量子化学计算得到30个芳基酰类化合物的量子化学参数和结构参数,再由相关分析计算结果选择以下影响化合物抗癌活性的独立变量:与金属离子发生络合的各原子上的静电荷之和CQS,分子的最高占据分子轨道能EHOMO,最低空分子轨道能ELUMO,π电子的次HOMO轨道能SHEP,疏水参数Л,芳基酰类化合物抑制核苷酸还原酶的半抑制量PC。以活性参数T/C为指标将待研究的化合物分为两类,即有抗癌活性的为第1类,无抗癌活性的为第2类,原始数据见表1。

2.2 网络的建立与训练

网络由3层神经元组成。输入层6个节点,对应于芳基酰类化合物的6个参数,隐含层神经元个数等于训练样本个数,输出层2个节点。将表1的原始数据作归一化处理,调用MATLAB语言工具箱中的函数net=newpnn(P,T,SPREAD)进行概率神经网络设计[6],计算结果如表1。表1的计算结果表明:概率神经网对训练样本有很好的预测结果。 表1 芳酰基化合物的活性参数与结构参数注:* I=1 compound with antitumor activity; I=2 compound with antitumor activity # BHA: benzohydroxamic acid

2.3 概率神经网络与普通判别分析的比较

尝试从30个样本中取出6个(表1中的5、10、15、20、25、30号样本)作为预测集,其余24个样本作为训练集进行概率神经网络预测,此时的网络结构为6-24-2,计算结果见表2。为了验证概率神经网络的识别能力,将24个训练样本分别用概率神经网络、Fisher判别和模糊k-均值聚类分析进行学习,然后对6个预测样本进行预测,预测结果见表3。计算结果表明网络对24个训练样本和6个预测样本的识别正确率为100%。Fisher判别虽能正确识别6个预测样本,但对24个训练样本的识别正确率只为91.7%。模糊k-均值聚类分析对24个训练样本和6个预测样本的识别正确率都只有67%。表2 24个训练样本的计算结果 表3 不同方法的预测结果

3 结论

概率神经网络综合了径向基函数神经网络和竞争神经网络的精华,对输入样本的非均匀性有较强的适应能力。网络结构简单,收敛速度快,网络总收敛于Bayes优化解,稳定性高,训练不需要太多的样本,适合于药物定量构效关系与活性识别研究。

【参考文献】

1 Elford HL,Wampler GL.Regulation of ribonucleotide reductase in mammalian cell by chemotherapeutic agents.Adv Enzyme Regul,1980,19:151~154.

2 陈念贻,钦佩,陈瑞亮,等.模式识别方法在化学化工中的应用.北京:科学出版社,2000,22~25.

3 吴启勋,李磊,安燕.盐湖水化学类型的人工神经网络判别方法.分析科学学报,2005,21(3):271~273.

4 童义平,林燕文.概率神经网络和FTIR光谱用于食道癌的辅助分析.化学研究与应用,2006,18(5):498~501.

神经网络基本原理篇13

监控中视频处理的过程如图1所示,本项目将在图像处理技术的基础上通过BP神经网络着重对分类识别的部分进行研究,以达到机器智能检测的目的。

1 图像的预处理

1.1 管道内部缺陷样本的采集

建立管道内部缺陷库,是进行管道内部缺陷识别的必要条件。同时也是对识别方法进行客观测试,估计其性能,评价其优缺点的根本依据。采集样本时应符合大多数管道问题的实际情况,反映各种管道材料、直径、形状的特征等。

较差的学习样本不但会导致网络的错误映射关系,而且还可能会使该网络的学习过程不收敛, 因此采集学习样本对于BP神经网络系统的学习和训练尤为重要。本实验采集学习样本的原则为:

1.1.1 代表性

所用样本需要起到以点带面的作用,应当体现出输入输出关系,如选用特征突出的样本,只有通过具有代表性的学习样本所训练出来的BP神经网络才能很好的映射输入输出的关系。

1.1.2 广泛性

所用样本应能提供该BP网络各种情况下的输入,广泛的样本可使训练出来的BP网络具有良好的适应力,这对于管道内部缺陷识别与分类来说是非常重要的。

1.1.3 紧凑性

若学习样本含有较多的无效成分会导致学习过程难以收敛,从而导致训练出来的网络会产生错误的映射,使网络输出过多偏向无效学习成分所形成的错误的映射关系。

1.2 归一化处理

管道缺陷种类繁杂,缺陷特征各不相同,即使是常见缺陷也会因大小和分布的不同而有所差异,所以在进行缺陷识别前需要对其进行归一化处理。缺陷的归一化处理可分为线性和非线性两种。进行归一化处理是为了是消除由于管道自身缺陷而带来的识别问题,从而进一步的为提取特征和分类器识别打下良好的基础。

通过线性归一化的方式将其归一化为统一大小的图像,归一化后的图像可以表示为:

其中,width和height分别表示未归一化时原图像的宽与高,W与H则表示规一化后图像所对应的宽和高,A(水平)、B(垂直)分别表示原图像的左上角与规一化后矩形框左上角的距离。

线性归一化算法较为简单,即将图像按一定比例线性调整为同一尺寸,可以保有原图像的形状与特征(几乎无失真),但是无法改变图像的亮度与清晰度等属性;非线性归一化是按照管道内部的特征分布来处理、调整清晰度,削弱那些偏亮、偏暗的区域,或是像素密集的区域,压缩像素分散的区域。

1.3 平滑去噪处理

各N噪声可能存在于样本图像中,如高斯噪声、白噪声等。图像的平滑化,即消除样本图像中的噪声成分,是图像增强技术中的一种。该操作可达到两个目的:

(1)按特定的需要突出图像中的特定信息;

(2)消除视频图像在输入时混入的噪声,以适应计算机的处理。

图像平滑化处理的要求有:

(1)不能损坏图像的边缘轮廓及线条等重要信息;

(2)使图像清晰。

平滑处理的方法分为:

(1)空间域法(时域),其中空间域法又分为线性和非线性滤波器;

(2)频域法一般需要对图像进行一次正向的数学变换(通常离散傅立叶变换,也可以为拉氏变换或Z变换)和一次反向的数学逆变换。

2 BP神经网络的运用

许多学者对BP神经网络的算法及结构进行过优化,有人提出:神经网络好比是一种自适应机器,神经网络是一个由若干简单处理单元所共同组成的大型分布式处理器,因此具有存储经验知识(记忆性)和使之可用(有用性)的特性。神经网络与人脑的相似之处有两个:

(1)所获取的知识都由外界环境学习而来;

(2)突触权值(神经元间的相互连接强度)用于储存所获取的知识。

2.1 BP神经网络的简介

人工神经网络是根据模仿动物神经网络的行为特征,进行分布式并行处理算法的一种数学模型。这种网络在处理信息时是通过调整内部大量节点之间相互连接的关系所实现的。而BP(Back Propagation)神经网络模型是由Rumelhart和Mccdknd为首的科学家小组提出是一种按误差逆传播算法训练的多层前馈网络。其凭借着强大的联想能力、容错能力以及自组织能力,成为现阶段应用最为广泛的神经网络之一 。BP神经网络最大特点仅依靠样本输入、输出数据,不借助系统的基本物理定律,就能实现由Rn空间(n个输入节点)到Rm空间(m个输出节点)的高度非线性映射。

2.2 BP网络模型

BP神经网络是一种反馈前向型的神经网络,也是一种典型的多层前向型网络,通过网络内各层之间的权值与结构表示出复杂的非线性1/0映射关系,BP神经网络同时具有较好的自我学习功能,能够通过误差的反馈算法,比照已有的样本进行重复训练,调整网络内各层间的权值,直到该网络的1/0关系在某个训练指标下与样本最为接近。一个典型的BP神经网络应包含输入层、中间层(也称隐层)和输出层,不同层之间相互连接,层内神经元之间无连接。其中隐含层可以为一层或多层。每一层都由互不连接的若干个神经元组成。相邻两层的每一个神经元之间的关系由权值所决定,权值的大小直观地反映了两个神经元间的连接强弱,整个BP网络的计算流程是由输入层-中间层-输出层单向前进,因而属于前向型网络。

2.3 BP网络原理

典型的BP网络分为三层,即输入层、隐含层和输出层。其算法主要由以下四部分组成,即模式顺传播――误差逆传播――记忆训练――学习收敛。

2.3.1 模式顺传播

2.3.2 误差的逆传播

根据输出层产生的误差,经中间层向输入层传播,在这个过程中,按照梯度下降原则对各层的权值和阈值进行误差校正。

所以,按照梯度下降原则,可得到输出层各单元的阈值调整量为:

(1)中间层到输入层计算:

权值调整量计算:

按照梯度下降原则,可得到连接权值的调整量为:

阈值调整量计算:

按照梯度下降原则,可得到输出层各单元的阈值调整量为:

以上的推导为标准差逆传递的算法,其中各连接权值的改变量分别与各个学习模式所对应的误差Ek成比例变化。而相对于全局误差

的连接权调整,需要在完成m个学习模式后统一进行,这是累积误差逆传递的算法。一般来讲,当样本较少时,累积误差传递算法要比标准误差传递算法速度快。

2.3.3 记忆训练

给出一组样板反复进行学习,调整权值和阈值的大小以使输出值满足一定的精度要求。

2.3.4 网络收敛

经由多次训练,BP神经网络的整体误差趋向于最小值。

由于BP算法采用了按误差函数梯度下降的方向进行收敛,因此,可能使迭代陷入局部极小点,BP网络收敛依赖于样本的初始位置,适当改变隐层单元个数,或给每个权值加上一个很小的随机数,都可使收敛过程避免局部极小点。

3 结语

本文提出的基于图像处理和BP神经网络技术的管道缺陷识别方法,可以通过BP神经网络完成机器视觉的学习,使管道机器人能够自主判断出管道内部是否存在缺陷,并进一步区分出管道接口渗漏、错口、管道腐蚀、管身穿孔、支管、淤积、结垢、障碍物等缺陷类型,完成整个智能检测。同时,该方法也存在一定的误识别率,这与训练样本的丰富程度与待测管道的内部环境密切相关。

参考文献

[1]张小伟,解智强,侯至群,等.一种基于BP神经网络耦合排水管线信息的城市河道风险评价研究[J].测绘通报,2014(12):93-96.

[2]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].华中科技大学,2008.

[3]王雪梅.基于神经网络的冷轧带钢表面缺陷识别分类技术研究[D].电子科技大学,2006.

[4]吴斌,齐文博,何存富,等.基于神经网络的超声导波钢杆缺陷识别[J].工程力学,2013(02):470-476.

[5]童文俊.BP神经网络在板形缺陷识别中的应用[D].江南大学,2008.

[6]刘彩红.BP神经网络学习算法的研究[J].西安工业大学学报,2012,32(09):723-727.

[7]弦.基于数据并行的BP神经网络训练算法[D].华中科技大学,2008.

[8]黄良炯.供水管道表面损伤特征提取及其评价技术研究[D].哈尔滨工业大学,2008.

[9]王赓.基于BP神经网络的脱机手写汉字识别研究[D].天津师范大学,2009.

[10]余本国.BP神经网络局限性及其改进的研究[J].山西农业大学学报:自然科学版,2009,29(01):89-93.

[11]李炯城,黄汉雄.一种新的快速BP神经网络算法――QLMBP[J].华南理工大学学报:自然科学版,2006,34(06):49-54.

[12]吴凌云.BP神经网络学习算法的改进及其应用[J].信息技术,2003,27(07):42-44.

在线咨询