网络的概率实用13篇

网络的概率
网络的概率篇1

在一定的网络区域内,以节点随机移动为例,理论上经过足够长的时间,节点会遍历网络,经历网络的各种负载状态,我们称之为节点的网络各态历经性。也就是在经过足够的时间后,节点能够掌握足够丰富的网络负载信息,而这些信息与当前时刻其他节点的负载高度相关。节点之间没有任何的负载信息交互。因此节点对网络状态感知的准确性就成为负载均衡的关键之一。基于历史信息的负载映射利用节点的历史负载信息来映射网络的负载状态,为节点的路由准入提供有效的参考。研究发现节点负载强度与节点在网络中的位置有很大的关系,当节点处在网络的中心区域时,由于经过的路由数比较多,所以节点负载一般较高;相反,当节点处在网络边缘时,负载较低。又由于节点的移动,节点在网络中的位置不断发生变化,从而节点的负载状态也在不断改变。所以,节点在历经各种网络负载状态时,记录下相应时刻的负载描述值,作为路由准入时的横向比较参考,使路由准入更准确。四个相隔不远时刻的网络拓扑,图中着色的节点为同一个节点A。从图中可以看到,从t1时刻到t4时刻这段时间内,节点A由网络的中心运动到了网络的边缘(其它节点也会移动,只是我们并不关心),而节点移动之后的位置被其它节点取代。2(b)中的t2时刻,节点B运动到了节点A在t1时刻的位置,其它几个图同理。节点在网络中位置的变化导致节点的负载状态改变,在t1、t2、t3、t4四个时刻,节点A的负载描述值分别为9、7、5和3,可见节点的负载在逐渐降低。而在这个过程中,节点不断记录负载信息,包括变化过程中负载的最大值、最小值以及整个过程中的负载平均值等。节点A记录的负载最大值是t1时刻,其负载描述值为9,负载的最小值是在t4时刻,其负载描述值为3,整个过程负载的平均值为(9+7+5+3)/4=6。节点利用这些历史负载信息来映射网络的负载状态。比如节点记录的历史最大负载描述值为9,那么很可能此时网络中的其它某个节点的负载值为9。通过当前的负载值与历史负载值比较,节点很容易判断出自己的负载轻重,从而决定是否准入路由,达到负载均衡的目的。

3.H&P算法

网络的概率篇2

1 概率神经网络的构成

就概率神经网络来说,其主要是由隐层以及输出层所构成的,其中,隐层为第一层,在这一层中,主要包括径向基神经元,而输出层则属于第二层,所谓的输出层也就是竞争层。概率神经网络从根本上来说,其可以表示为前馈型神经网络。而在概率神经网络中的径向基神经元则主要是以净输入为主,从这一点来对输入向量与权值向量之间的距离进行有效的测量,另外,也可以依据这一点来对隐层的传递函数进行概率密度的有效反映。

2 实际项目中的风险分析

2.1 相关性检验

应用相关的分析软件,计算得出相应的分子变量,对所计算得出的分子变量进行有效的统计。依据相关的医学专业理论知识可以了解到,统计值的分界线为0.1,以这一分界线为依据,将患有不同疾病的患者进行患病程度的划分,而划分所要依据的变量主要分为年龄、家族病史等。

2.2 概率神经网络的建立以及学习

就相关性分析可以了解到,将划分依据的变量作为相应的输入神经元,针对患者所患疾病的程度的轻重,来对患者的病情进行等级的划分,其中0则代表没有患病,1则说明锁环疾病的程度较轻,2说明所患疾病的程度属于中等,而3则说明患者所患疾病的程度较重。针对概率神经网络进行学习,主要的步骤包含如下:

首先,要对输入向量以及权值向量之间的距离进行有效的计算,所计算出的距离结果就可以表示为两向量之间的相似程度。

其次,将阈值向量与距离输出向量各自的元素进行一一的对应,并将对应的元素进行有效的相乘,在径向基函数非线性映射作用的影响下,对输出的向量进行获取。

在最后,要注意分析出竞争输出层中的权值向量的点,并将其与上一层的输出向量进行有效的相乘,从而可以的出具体的加权和向量值,选出加权和向量值中最大的一个值,将其确定为输出的最终值。

3 模型检验及结果分析

本文主要依据实例来进行分析,并选取了17000条相关的数据作为实际的训练集,其中100条为测试集。依据这1000条测试集来对所构建的概率神经网络进行分析,检验改网络在检测疾病上所具有的能力和准确度,在检验样本相同的情况下,所采用的训练数据样本不同,则网络检测的精确度也会有所不同。具体可见表1。

就上述表中可以了解到,在训练样本的数目增加的过程中,其n能够得到的模型精确度也会更高,然而,虽然精确度会有所提高,但是提高的速度则相对较慢。可以说,这种方式具有一定的优势也有一定的弱点,但是总体来说,其优势较为明显。

4 针对概率神经网络核保风险分析模型的探讨

在目前的各个领域中,概率神经网络都得到了广泛的应用。而在概率神经网络基础上锁构建的核保分析模型,具有学习简单以及模式分类能力强等特点,这就使得其在实际的应用中,具有良好的效果。在该网络结构中,只有两层结构,其中一层为隐层,另外一层就是输出层。在进行计算的过程中,可以忽略对网络权值的更改,这就使得其计算执行的速度相对较快,就本文的实验结果可以看出,该网络结构的建立相对用时较短,能够在最短的时间内构建出已经成型的网络结构,利用该网络结构对所选取的1000条测试集进行分析的时候,所耗费的时间相对较长,而在实际的应用中,其分析的精确度则相对较高,判定的疾病与实际的情况符合率能够高达80%,这就使得风险分析的模型得到了有效的充实,这对于全球性的疾病预测和治疗都有着重要的影响意义。

此外,从保险角度来看,保险公司可以依据模型建立智能化系统,要求投保人在投保时填写个人信息,然后把同疾病相关的信息输入该智能系统,计算出被保险人患病的概率,并将他们进行不同程度的风险分类,对于不同的风险类别制定不同的费率,对投保人收取不同的保费,或者做出拒保的决定。经过一定时期的运营,保险公司将不断积累大量的业务数据和反馈信息.从这些信息中选取数据加入训练集,使训练集样本数更大,覆盖面更广,并减少训练集的错误率,从而完善模型,使得模型对于患病判别的准确性更高。本模型运用Kendall检验选取同疾病相关性较大的6个因素作为输入神经元,但是未给出这些因素对于高血压的具体贡献度,我们可以通过主成分分析和logistic回归给出因素的具体贡献度。

结束语

在任何的国家当中,医疗保险都占有重要的地位。我国目前为了能够将医疗保险体系发展健全,开始将商业医疗结合到社会医疗保险体系中,从而使得我国建构出了一个较为多层次以及覆盖面较广的医疗保障体系,但是,商业医疗保险本身就有较高的风险性,因此,要想能够使得医疗保险事业可以得到长足的发展,就需要有效的保障投保人患病可能性预测的真实性和可靠性,尽可能的提升预测的可行性,并且积极的构建概率神经网络,利用该网络进行投保人所患疾病的检测,其检测的准确率可高达80%,具有实际可操作性。

参考文献

[1]陈永灿,陈燕,郑敬云,高千红.概率神经网络水质评价模型及其对三峡近坝水域的水质评价分析[J].水力发电学报,2014(3).

[2]莫剑冬,徐章遂,米东.应用概率神经网络诊断自行火炮发动机的故障[J].测试技术学报,2010(1).

网络的概率篇3

1 背景资料

流行音乐(Popular Music)于19世纪末20世纪初起源于美国,从音乐体系看,流行音乐是在布鲁斯、爵士乐、摇滚乐、等美国大众音乐架构基础上发展起来的音乐。中国流行音乐的风格与形态主要受欧美影响,在此基础上逐渐形成本土风格。近年来流行音乐中刮起了一股“中国风”,音乐风格不同的音乐人借助这一元素共同表达了一种向中国传统元素靠拢的趋势,使得流行音乐具有独特的中国风格。中国流行音乐中中国元素有逐渐增多的趋势,如流行音乐出现了戏曲元素、古典元素等,使得我国流行音乐得到了更大的发展,我国的流行音乐中的音乐元素也开始呈现多样性发展景象。像我国最近几年流行的Pop(流行)、Country(乡村)、Jazz(爵士)、Rock(摇滚)、R&B(节奏布鲁斯)、NewAge(新世纪)、经典(classic)等。

随着经济的快速发展,我国信息化速度的加快,互联网的不断发展,流行音乐的传播媒介从传统的电台和唱片逐渐过渡到网络下载和网络电台等。流行音乐的结构短小、内容通俗、形式活泼、情感真挚,并被广大群众所喜爱,广泛传唱或欣赏,流行一时的甚至流传后世的器乐曲和歌曲。这些乐曲和歌曲,植根于大众生活的丰厚土壤之中。在近几十年里,流行音乐慢慢的被作为商业性的音乐消遣娱乐,以及与此相关的一切“工业”现象许多的网络电台都会搜集上符合大部分人喜好的音乐,以供收听者的下载和播放。由于每个人喜好的音乐可能横跨若干种风格,各种网络电台需要搜集大部分人对不同音乐的喜好程度,需要根据流行音乐的风格分成各种类别的音乐。

2 模型的建立与求解

2.1 数据处理

我们选取中国流行音乐中的六大类风格音乐作为训练样本,选取的七个音符在乐谱中的数目百分比可以反应歌曲的风格。根据数据源分别计算出主要音符在乐谱中出现的频率。从计算的数据中,我们可以看出歌曲乐谱中的音符数频率满足一定的均匀分布,基本分布在0到1之间,我们的样本数据可以作为训练样本,在神经网络系统中试验,我们希望我们的试验可以达到一定的准确率。

2.2 概率神经网络模型

概率神经网络(PNN)是一种基于Bayes分类规则与Parzen窗的概率密度函数估计方法发展而来的并行算法。[1]在实际应用中,尤其是在解决分类问题的应用中,它的优势在于用线性学习算法来完成非线性学习算法所做的工作,同时保持非线性算法的高精度等特性。PNN网络可以用来进行更多样本的预测,训练样本较大时且要求精度较高时,网络常常不收敛且往往陷入局部最优。

概率神经网络由径向基神经元和竞争神经元组成,经常用来解决分类问题。概率神经网络的拓扑机构如图2所示,共分4层,分别为输入层、模式层、求和层和输出层。[2]

(1)输入层接受来自训练样本的值,将特征向量传递给网络,其神经元数目和样本矢量的维数相等;

(2)模式层计算输入特征向量与训练集中各个模式的匹配关系;

(3)模式层神经元的个数等于各个类别样本数之和,给曾每个模式的输出为

式中,;为输入层到模式层连接的权值,为平滑因子,它对分类的起着至关重要的作用。

(4)求和层,是将属于某类的概率统计,按①式计算,从而得到故障模式的估计概率密度函数。因此求和层单元简单地将自己类的模式层单元的输出相加,而与属于其他类别的模式层单元的输出无关。[3]求和层单元的输出与各类基于内核的概率密度的估计成比例,通过输出层的归一化处理,就能得到各类的概率估计。

(5)基于PNN故障诊断方法。

假设有两种已知的故障模式、,对于要判断的故障特征样本:若,则;

式中,先验概率(,);我们可以根据现有的故障特征样本求其统计值。

2.3 模型的求解

用训练好的PNN神经网络对训练数据进行迭代,得到60个样本的判定结果,如图2,可见只有6个样本判断错误,准确率达到90%,之后我们仍然用的是MATLAB软件做出误差图,能更清晰地发现该模型的准确性,其中出错的6个样本是因为这些样本不仅只有一种风格属性,还有其它风格的属性,因为该模型的决策属性是音符、高八度、低八度、空拍、节拍减半、节拍延长、浮点音符在乐谱中的出现频率所组成,难免会出现前几个属性服从一种风格,而其余几个属性却服从另外一种风格,所以判断会有误差,因此可以判定,该模型确实可以对现有的音乐分类做出相对准确的判断。

2.4 模型的预测检验

将测试数据的代入,由图3,我们用测试的样本数据通过神经网络试验,我们得到预测的错误率是21%,预测的效果还是可以说明了该模型的可行性以及有效性。

3 模型的推广

3.1 对流行音乐市场的分析

随着互联网的发展,在利用概率神经网络模型的分类,我们通过MATLAB对其实现,可以看出我们的分类准确度较高,达到将近95%以上,这表明该分类方法合理。利用此方法对音乐的分类详细,搜索灵敏度高,比如对网络电台对音乐的推荐会有很大帮助。在音乐电台中经常要满足听众的需求而搜索好多不同类型的歌曲,其歌曲因人的喜好而具有不同风格的歌曲,按照我们的模型概率神经网络(PNN)来模拟的分类方法可以将各种不同类型的歌曲进行详细准确无误的分类,从而能在音乐电台时间可以找到听众所需求的歌曲,而且迅速及时刚好符合短时间内的多需求量的特点。使得其音乐电台更加受听众的喜爱。

3.2 基于流行音乐的大众审美研究等

通过对音乐细致精确地分类,我们从内心直觉感受出发通过音响激发想象和联想,去审美音乐,并且视听联觉形象思维和创造性思维[4]等能力培养与审美音乐有密切关系,所以我们可以充分调动视听联觉通过音乐审美可以锻炼自己的想象思维,掌握审美音乐的特征和方法,可以了解审美音乐的心理要素及其活动过程,从而更容易引导和锻炼人的思维和想象能力。

参考文献

[1]Specht D.F.probabilistic neural networks[J].cural Ncural Networks,1990.3(1):109—118.

网络的概率篇4

一、课堂教学模式下存在的问题

概率统计课程是我校大面积的公共基础课,各专业都把这门课开设在专业课之前,是理工科类学生学好专业的基础,其重要性不言而喻.但目前,由于各方面的原因,使得这门课的教学现状存在着多方面的不足.主要有如下几点:

1.大班教学,课堂学习效果差

我校的概率统计课程是由理学院公共部的老师承担教学任务,由于师资有限,每学期基本上都是以4个班级合在一起为一个教学班,大概120名学生左右,安排在一个大教室里上课,这样会使坐在后面的学生由于距离太远看不清老师的板书或者听不清老师讲的话而大大影响了学习,有些甚至因此失去了学习的兴趣.而另一方面,老师也更难掌控整个课堂的教学,其一,学生多了,课堂纪律就会下降,这就影响了课堂的教学质量;其二,学生间的差异也会增大,这样,教师在课堂上就会顾此失彼,很难进行合理的课堂教学过程的设计.

2.内容多,课时少

我校概率统计课,随着教学计划的多次调整,从原来的51学时现被压缩到了42学时,这点学时根本讲不完原来教学大纲上规定的内容,所以只有修改大纲,删减教学内容,考虑到现在的学生质量的下降,就删减了相应的学生感觉比较困难的章节,比如概率中的大数定律,这章的内容在概率论中的地位是相当重要的,是整个概率论的一大支撑,但很遗憾,只能舍弃不讲.再比如统计中的回归分析,它的应用是相当广泛的,学生以后很可能经常会用到这个方法,但考虑到学时也只能删除不讲.这样会对学生的知识面产生影响,势必会影响专业课的学习以及今后的考研内容的复习.从长远看,是很不利于学生的发展的.

3.课堂教学内容死板,教法单调

课堂上的教学,受课时的影响,为了及时完成教学内容,教师只能是以讲解为主,甚至很少有时间提问,再让学生思考,这样,教师的教法就很单调,这种“满堂灌”的教学方式早已被证明是不利于学生的创新意识的培养的,甚至是抹杀了学生的探索性思维,这样很难调动学生的积极性,造成学生的学习主动性不高,甚至出现学生课堂玩手机、看报纸等不良的学习风气.

二、BB平台的教学模式的优势

为了解决上述传统课堂教学所存在的这些问题,我们近期在校网络BB平台上创建了概率统计课程.从使用的效果看,很好地填补了以上课堂教学的不足之处.具体表现为以下几个优势:

1.充实了课堂教学内容

在BB平台上,开辟了很多的学习内容板块,比如:习题解答,在这板块中,放置了课后习题的详细解答,这样可以方便学生进行自学,以前,学生经常抱怨习题课太少,老感觉自己不会做题,有了这个详细解答后,学生的疑问就少了,不懂的可以自己去看解答,这样就非常的方便.对学生的学习起到了很大的帮助作用.再如课堂录像,我在网络上放了完整的课程录像,这样,学生如果对哪一章哪一节的内容在课堂上还没有完全消化理解,他就能够自己课后上网看这节课的录像,尤其是课堂上的一些难点,学生很可能一下子理解有困难,那么通过再次聆听老师的讲解,就能使学生很好地理解知识、掌握知识.另外,对于那些即将参加考研的同学,在复习中如果哪一部分的内容忘记了,就可以上网找到录像来进行复习.我在这次的考研辅导班上就向学生公布了网络课程的地址,让学生自己看视频复习,学生反映效果很好,非常方便,想什么时间看都行,想看哪章内容可以很方便地挑,充分发挥了学生的学习主动性.

2.激发了学生的学习兴趣

传统的课堂教学一味地填鸭式的教学法,让学生感觉很沉闷,久而久之,学生就会失去对这门课程的兴趣,而利用网络平台,可以很好地激发学生的学习兴趣.比如,在问题讨论区,在每节课后,都会有相应的一些问题,让学生在这里交流探讨,教师也积极地在网上进行答疑,让学生在讨论中明知,在争论中解惑,在思考中提升,充分发挥学生的主体地位.再如,在网络平台上,放置了很多的概率小实验,需要在计算机上操作完成,这些都是些小程序,每名学生都可以进行自主的实验,这样可以更好地理解和掌握知识,而这在课堂是不可能办到的.又比如案例分析,这一块内容放了很多的概率统计的经典案例,这些平时在课堂上很难有时间讲,学生在学习的过程中也老对这门课程产生疑惑,学了到底有什么用、哪里有用等类似问题,而通过查看这里的内容,学生就能了解这门课程在实际生活、生产中的重要应用,这样也从另一方面大大地激发了学生的学习兴趣.

三、结束语

最后,认识到基于BB平台下的概率统计课程教学改革,是一项比较繁重的任务,可能会出现很多新的挑战,很多新的问题需要思考,我们也将不断地进行探索实践,让学生能有一个更完整、有效的学习模式.

【参考文献】

网络的概率篇5

1 概率神经网络原理与结构[3~5]

概率神经网络PNN是径向基网络的一个分支,是前馈网络的一种。它是一种有监督的网络分类器,基于概率统计思想,由Bayes分类规则构成,采用parzen窗函数密度估计方法估算条件概率,进行分类模式识别。

PNN的结构如图1所示。除输入层外,它由两层神经元构成。第一层采用径向基神经元,其个数与输入样本矢量的个数相同,第二层为竞争层,其神经元个数等于训练样本数据的种类个数,每个神经元分别对应于训练数据的一个类别。图中的模块C表示竞争传递函数,其功能是找出输入矢量n2中各元素的最大值,并且使与最大值对应类别的神经元输出为1,其它类别的神经元输出为0,这种网络得到的分类结果能够达到最大的正确概率。图1中P为输入矢量,R为输入矢量的维数,Q等于输入/目标矢量对的个数,即径向基层神经元个数,K为输入数据种类的个数,即输出层神经元的个数。图中的||dist||模块表示求取输入矢量和权值矢量的距离,此模型中采用高斯函数radbas作为径向基层神经元的传递函数。

图1 概率神经网络结构图

2 芳基酰类化合物抗癌活性的概率神经网络的建立

2.1 数据来源及预处理

根据量子化学计算得到30个芳基酰类化合物的量子化学参数和结构参数,再由相关分析计算结果选择以下影响化合物抗癌活性的独立变量:与金属离子发生络合的各原子上的静电荷之和CQS,分子的最高占据分子轨道能EHOMO,最低空分子轨道能ELUMO,π电子的次HOMO轨道能SHEP,疏水参数Л,芳基酰类化合物抑制核苷酸还原酶的半抑制量PC。以活性参数T/C为指标将待研究的化合物分为两类,即有抗癌活性的为第1类,无抗癌活性的为第2类,原始数据见表1。

2.2 网络的建立与训练

网络由3层神经元组成。输入层6个节点,对应于芳基酰类化合物的6个参数,隐含层神经元个数等于训练样本个数,输出层2个节点。将表1的原始数据作归一化处理,调用MATLAB语言工具箱中的函数net=newpnn(P,T,SPREAD)进行概率神经网络设计[6],计算结果如表1。表1的计算结果表明:概率神经网对训练样本有很好的预测结果。 表1 芳酰基化合物的活性参数与结构参数注:* I=1 compound with antitumor activity; I=2 compound with antitumor activity # BHA: benzohydroxamic acid

2.3 概率神经网络与普通判别分析的比较

尝试从30个样本中取出6个(表1中的5、10、15、20、25、30号样本)作为预测集,其余24个样本作为训练集进行概率神经网络预测,此时的网络结构为6-24-2,计算结果见表2。为了验证概率神经网络的识别能力,将24个训练样本分别用概率神经网络、Fisher判别和模糊k-均值聚类分析进行学习,然后对6个预测样本进行预测,预测结果见表3。计算结果表明网络对24个训练样本和6个预测样本的识别正确率为100%。Fisher判别虽能正确识别6个预测样本,但对24个训练样本的识别正确率只为91.7%。模糊k-均值聚类分析对24个训练样本和6个预测样本的识别正确率都只有67%。表2 24个训练样本的计算结果 表3 不同方法的预测结果

3 结论

概率神经网络综合了径向基函数神经网络和竞争神经网络的精华,对输入样本的非均匀性有较强的适应能力。网络结构简单,收敛速度快,网络总收敛于Bayes优化解,稳定性高,训练不需要太多的样本,适合于药物定量构效关系与活性识别研究。

【参考文献】

1 Elford HL,Wampler GL.Regulation of ribonucleotide reductase in mammalian cell by chemotherapeutic agents.Adv Enzyme Regul,1980,19:151~154.

2 陈念贻,钦佩,陈瑞亮,等.模式识别方法在化学化工中的应用.北京:科学出版社,2000,22~25.

3 吴启勋,李磊,安燕.盐湖水化学类型的人工神经网络判别方法.分析科学学报,2005,21(3):271~273.

4 童义平,林燕文.概率神经网络和FTIR光谱用于食道癌的辅助分析.化学研究与应用,2006,18(5):498~501.

网络的概率篇6

文献标志码:A

Abstract:

To solve the congestion problem at node in delay tolerant networks, an active congestion control strategy based on historical probability was proposed. The strategy put forward the concept of referenced probability that could be adjusted dynamically by the degree of congestion. Referenced probability would control the forwarding conditions to avoid and control the congestion at node. At the same time the utilization of idle resources and the transmission efficiency of the network would be promoted. The simulation results show that the strategy upgrades delivery ratio of the entire network and reduces the load ratio and message loss rate. As a result, the active congestion control is realized and the transmission performance of the network is enhanced.

Key words: Delay Tolerant Network (DTN); probability policy routing; active congestion control; referenced probability; dynamic adjustment

0引言

容迟容断网络(Delay Tolerant Network,DTN)网络在2003年,由Fall[1]提出,其基本设计目标是支持具有断续连接、大时延、高误码率等特性的异构网络的互联和互操作。DTN具有与传统网络不同的特性,不能采用传统的方法解决DTN中的问题[2-3]。影响DTN正常运行的关键技术有很多,拥塞控制技术便是其中之一。

DTN拥塞控制根据关注点的不同可分为节点级拥塞、链路级拥塞和区域级拥塞。节点级拥塞控制方法有被动拥塞控制和主动拥塞控制两种,目前对DTN拥塞控制的研究普遍为被动拥塞控制,而主动拥塞控制较少。被动拥塞控制算法以消息丢弃策略为主,主要思想有丢弃排队时间最长(Drop Front,DF)的消息、丢弃最后到达(Drop Last,DL)的消息、丢弃剩余生存时间(Time To Live,TTL)最少(Drop Oldest,DO)的消息、丢弃剩余TTL最多(Drop Youngest,DY)的消息[4-6]。其中性能表现较好的是DF和DO,原因是这两种丢弃策略先丢弃的是在网络中存在时间较长的报文,这种报文在网络中有更多的拷贝,丢弃它们不但控制了拥塞,且对网络的递交性能影响最小[7-8]。节点主动拥塞控制算法有以下几种:1)SenTCP(Sensor Transport Control Protocol)[9]是一种专门为传感器网络设计的开环逐跳拥塞控制协议;2)ESRT(EventtoSink Reliable Transport)[10]采用基于节点的本地缓冲监测的拥塞检测机制,根据网络的当前状态调节节点速率,实现拥塞控制;3)ACC(Autonomous Congestion Control)[11]采用经济价格模型提出了一个基于规则的拥塞控制机制,该方案中每一个路由节点基于可用缓冲、接收一个消息的风险和收益等本地信息,自主决定是否接收消息。以上算法为协议改进,算法较为复杂,在实际应用中很难实现。

本文设计的动态调整参考概率(Dynamically Adjusting Referenced Probability, DARP)主动拥塞控制算法,以历史相遇概率策略路由(Probabilistic Routing Protocol using History of Encounters and Transitivity,PROPHET)算法为基础。PROPHET算法的思想是节点以历史相遇概率作为比较依据,只有当相遇节点的递交概率大于转发节点的递交概率时才对消息转发,即消息只会被转发给那些更有可能向目的节点传递消息的节点。该算法的优点是选择性地转发消息,在节约网络中有限资源的同时,也提高了每次转发的递交效率。在此基础上,DARP算法提出参考概率这一概念,重新定义转发规则,根据节点拥塞程度即节点缓存占用比调整参考概率的大小,以此控制数据的转发,在不影响其他节点传输消息的情况下,实现对局部拥塞节点的主动拥塞控制。同时,本算法还能够在网络资源有所空闲的情况下,提高DTN资源的利用率,实现DTN的高效传输。

3仿真实验与分析

3.1性能指标

DTN技术的应用目的是在恶劣的通信条件下尽可能多地实现数据的传递,因此递交率的高低是评价一种DTN算法最重要的评价指标[12]。负载比率和消息丢失率是检测网络出现拥塞程度的主要指标[13-14],本文通过3个指标分析算法的性能,分别定义如下。

1)递交率。递交成功的消息数量与总的投递消息数量的比值,是DTN技术最重要的评价指标。

2)负载比率。定义为:

O=成功传输消息的次数-传到目的地消息的个数传到目的地消息的个数

用来描述消息传递的重复率。负载比率越高说明消息传输的重复率越高,网络的效能越低,若负载比率为0,即成功传输消息的次数等于传到目的消息的个数,说明传输效率为100%。

3)消息丢失率。定义为:

D=丢失消息的个数连接开始时传递消息的总个数

消息丢失率表示由于TTL到期及缓存发生拥塞而被丢弃的消息所占的百分比,在相同的网络环境中,由于TTL到期而被丢弃的消息比例相同,因此丢失率可以用来描述网络出现拥塞的程度。

3.2仿真场景设置

ONE(Opportunistic Network Environment)仿真平台是基于Java的离散事件仿真器,是专门针对DTN协议框架而设计的,可以实现移动模型、各种算法及应用协议的仿真。本文采用ONE仿真平台进行实验。

仿真模拟场景采用ONE中默认场景,模拟区域大小为4500m×3400m,由126个节点组成。节点共分为3组,根据3组节点的特点不同分别进行设置。第1组为行人步行节点,速度为0.5~1.5m/s,节点80个;第2组为汽车行驶节点,速度为2.7~13.9m/s,节点40个;第3组为有轨电车行驶节点,速度为7~10m/s,节点6个。参数C的最大值H、最小值L分别取值1.1,0.8。默认仿真参数如表1所示。

以上实验表明,无论是在节点缓存不同或是仿真时间不同的情况下,针对不同算法,DARP主动拥塞控制算法对DTN的消息递交率、负载比率及消息丢失率各性能指标都有所改善。这说明本文提出的DARP算法对网络资源合理地进行了分配,起到了良好的拥塞控制作用,在主动避免拥塞发生的同时也提高了网络的传输效率,且适用范围较广。

4结语

本文在概率策略路由PROPHET算法的基础上,通过参考概率这一概念提出了DARP主动拥塞控制算法,重新定义了数据的转发策略,对DTN中的资源合理分配。本文算法在不同DTN传输的条件下,均能通过控制转发条件合理地对网络资源进行分配,且保持稳定,有效地实现节点拥塞控制。在网络资源空闲时,DARP算法对资源充分利用,提升节点缓存的利用率及网络对消息的传输性能;在网络资源不足时,合理利用有限资源,减缓节点的拥塞程度,进而实现整个网络的拥塞控制。实验结果表明,在不同条件下,DARP算法在递交率、负载比率及消息丢失率3个重要性能指标上都表现出良好性能,总体增强了DTN的综合传输性能。下一步将继续研究针对其他路由算法的主动拥塞控制方法。

参考文献:

[1]FALL K. A delaytolerant network architecture for challenged Internets [C]// Proceedings of the 2003 Conference on Applications, Technologies, Architectures, and Protocols for Computer Communications. New York: ACM Press, 2003: 27-34.

[2]FAN X, WANG M. Delaytolerant network routing algorithm based on energy restriction and history information [J]. Transactions of Beijing Institute of Technology, 2009, 29(4): 332-335.(樊秀梅,王明媚.基于能量约束和历史信息的容迟网络路由算法[J].北京理工大学学报,2009,29(4):332-335.)

[3]SU J, HU Q, ZHAO B, et al. Routing techniques on delay/disruption tolerant networks [J]. Journal of Software, 2010, 21(1): 119-132.(苏金树,胡乔林,赵宝康,等.容延容断网络路由技术[J].软件学报,2010,21(1):119-132.)

[4]ZHANG X L, NEGLIA G, KUROSE J, et al. Performance modeling of epidemic routing [J]. The International Journal of Computer and Telecommunications Networking, 2007, 51(10): 2867-2891.

[5]KRIFA A, BARAKA C, SPYROPOULOS T. Optimal buffer management policies for delay tolerant networks [C]// SECON08: Proceedings of the 5th Annual IEEE Communications Society Conference on Sensor, Mesh and Ad Hoc Communications and Networks. Washington, DC: IEEE Computer Society, 2008: 260-268.

[6]LINDGREN A, PHANSE K S. Evaluation of queuing policies and forwarding strategies for routing in intermittently connected networks [C]// Proceedings of the First International Conference on Communication System Software and Middleware. Washington, DC: IEEE Computer Society, 2006: 1-10.

[7]WANG G, XU Z, LI X. Congestion control strategy based on quality of message in DTN [J]. Computer Engineering and Applications, 2012, 48(9): 74-77.(王贵竹,徐正欢,李晓峰.DTN中依据报文质量的拥塞控制策略[J].计算机工程与应用,2012,48(9):74-77.)

[8]LIU Q, PAN Y, LI Y, et al. Congestion control strategy based on copy rate in DTN [J]. Journal of Beijing University of Posts and Telecommunications, 2010, 33(4): 88-92.(刘期烈,潘英俊,李云,等.延迟容忍网络中基于复制率的拥塞控制算法[J].北京邮电大学学报,2010,33(4):88-92.)

[9]WANG C, SOHRABY K. SenTCP: a hopbyhop congestion control protocol for wireless sensor networks [C]// INFOCOM 2005: Proceedings of the 24th Annual Joint Conference of the IEEE Computer and Communications Societies. Piscataway, NJ: IEEE Press, 2005: 1003-1016.

[10]AKAN O B, AKYILDIZ I F. ESRT: eventtosink reliable transport in wireless sensor networks [J]. IEEE/ACM Transactions on Networking, 2005, 13(10): 1003-1016.

[11]BURLEIGH S, JENNINGS E, SCHOOLCRAFF J. Autonomous congestion control for an interplanetary Internet [EB/OL]. [20130830]. http:///doi/pdf/10.2514/6.20065970.

网络的概率篇7

Keywords: structural damage; Damage identification; Cantilever version; The probability of wavelet neural network (WPNN); Data fusion

中图分类号:TU973+.1 文献标识码:A文章编号:

1引言

当前,世界范围内建筑工业的重心正在从大规模新建转向新建与维修加固并举[1]。土木工程结构如房屋建筑、桥梁、海洋平台等在投入使用之后,由于地震、火灾、咫风等自然灾害或一长期作用的疲劳、腐蚀等原因而产生不同程度的损伤,结构损伤经过长期的累积必然会导致结构发生破坏或使用性能降低[2]。结构的损伤检测、诊断是土木工程结构经历自然灾害、长期作用后进行维修、加固的基础,是一项复杂的系统工程,其核心的问题是基于什么理论进行损伤的检测[3]。

在损伤识别以及其它的信息获取及处理过程中,信息的确定程度主要取决于选用传感器的种类、所选择的方法以及信息源本身[4]。进一步说,单一传感器获得的信息通常是不完整、不精确的。多传感器数据融合技术从多源信号中获取信息,减小了信息的不确定度,助于帮助制定决策。无损检测数据融合近几年发展很快。来自不同国家的很多人对它表现出极大的兴趣,他们已经提出了多种适用于无损检测数据融合的模型[5]。本文给出了一种新的基于小波概率神经网络(wavelet probabilistic neural network , WPNN)和数据融合的结构损伤检测方法模型,并给出了该模型在结构损伤识别中的应用。

2基于频率的结构损伤识别原理

运用试验测试的数据来确定结构系统运动方程中的参数叫做参数识别。参数识别的典型过程包括在结构系统的模态试验中测量由于外部激励作用下的结构响应;从响应的数据中直接地或通过数据处理技术确定系统的动力特性,诸如自振动频率和振型。结构的频率相对振型来说更容易较准确测量,而且能够反映结构整体特征,使其成为结构损伤识别中的重要特征参数。由于系统的自振动频率和振型是系统参数如质量和刚度的函数,所以可以将实验得到的结构动力特性与数学模型预测的结构动力特性进行比较从而确定系统参数[6]。结构损伤探测的基本方法正是基于以上的基本概念而产生的。

当不考虑阻尼时,结构振动的特征值方程为

(1)

其中矩阵 、 分别表示离散的质量矩阵、刚度分布, 与 分别是结构第i阶固有频率和正则化振型向量。设损伤使结构刚度矩阵、质量矩阵、频率及振型向量的变化分别为 、 、 和 则有

(2)

由于结构定部分的质量和刚度损失而引起的 、 的任何变化,都将在自振频率和振型的测量值中有所反应。当系统自振频率和振型的测量与原始未损伤系统自振频率和振型之间出现了差异时,就是表示系统中出现了损伤。一般来说,建筑结构的损伤对结构质量的影响很小,即可取 。将上式左乘 然后展开并忽略二阶项,则有

(3)

P.Cawley研究表明两阶频率的变化比值只与损伤位置有关,而与损伤程度无关。通常采用归一化的频率变化率,设第i频率的变化率为:

(4)

式中fui和fdi分别是结构损伤前后的第i阶频率。FCRi与损伤程度和损伤程度有关,假定损伤不引起质量变化,则有

(5)

将(9)式关于 级数展开并忽略高阶项,可得:

(6)

将频率变化按下式归一化,得

(7)

可见,归一化的频率变化也只与损伤位置有关。

3小波概率神经网络与多传感数据融合技术原理

目前,基于动力响应的各种智能损伤诊断技术得到研究,但这些技术存在着识别精度不高或适用条件等缺陷。迅速发展的数据融合技术具有充分利用各个数据源包含的冗余和互补信息的优点,可以提高系统决策的准确性和鲁棒性。基于小波概率神经网络(wavelet probabilistic neural network , WPNN)和数据融合的结构损伤检测方法将两者有机结合,扬长避短在损伤识别中显示出独有的优越性。

为了充分发挥数据融合与 WPNN 的优点,提出了基于 WPNN 与数据融合的损伤检测模型见图1,它首先将来自传感器 1 的结构响应进行数据预处理、特征提取,采用小波理论,获得该传感器的小波能量特征向量;依次类推,获得其他传感器的小波能量特征向量;然后将这些小波能量特征向量放入WPNN中,进行神经网络训练及融合计算;最后根据最大的概率密度函数值得到融合损伤识别结果及损伤类型。

图1基于WPNN与数据融合技术的损伤识别模型

可见,基于 WPNN 与数据融合技术的损伤识别与诊断过程是根据从目标的检测量得到损伤特征向量(模式),经过数据融合分析计算与处理,进行损伤识别及损伤定位的过程。

4结构损伤在线检测原理

结构损伤检测的核心技术是模式识别,而模式识别就是将理论分析得到的损伤模式特征库与实测的模式进行匹配。一般先通过分析各种不同的损伤序列或破坏模态来建立模式库,然后观察实测振动信号的变化,并将它与可能发生损伤的模式数据库进行比较,选择最相似的模式。神经网络本身具有模式匹配与记忆的能力,而且对于具有一定噪声的模式,识别效果更好。运用模式识别进行损伤检测与用神经网络进行损伤检测是两种不同的诊断方法,但二者密切相关,可以用神经网络来实现模式识别的损伤检测。结构损伤的在线检测原理如图2所示。

5数值模拟实验分析

为了验证神经网络技术在结构损伤检测中的有效性,利用ANSYS有限元程序模拟钢筋混凝土悬臂板,物理参数为:板长lm,宽度0.5 m,密度为7.85 ×103 kg/m3,杨氏模量2.02 ×105 MPa,泊松比0.3。数值模拟试验模型图如图3所示。以单元刚度折减15%来模拟结构的损伤,并忽略结构损伤引起的结构质量的改变。

悬臂板无损伤时前三阶频率为: =8.3206Hz,=35.6900Hz,=51.7780Hz。(理论值为 =8.5620Hz,=36.8200 Hz,=53.2900Hz),用16个位置刚度分别降低5%来模拟单元的损伤情况。

图2 结构损伤在线检测原理

图3 数值试验单元网格划分图

由于结构中某类损伤的发生可能只与几个监测参数相关联,即只跟损伤状态样本中与该损伤状态模式对应的非零特征量相关;同样,某一传感器的输出数据也可能与几类损伤状态模式有关。为了充分利用各传感器的输出数据进行损伤检测,采用1、3、4、5、6、8、9、10、12、13、14、15、16单元所得到的训练样本进行损伤检测与识别模型的训练,基于 WPNN 与数据融合的损伤识别模型的训练样本数可以确定出来,检验样本数为2、7、10、11单元的数据。WPNN模型的拓扑结构为20-165-5-5,即输入层神经元个数为 20,模式层神经元个数为 165,求和层和决策层中的神经元均为5 个。模型配置训练好后,用另外2、7、10、11这4个检验样本进行检验,基于 WPNN 与数据融合损伤检测方法的识别正确率较好。

6结论

多传感器数据融合损伤识别性能较好,使用基于 WPNN 与数据融合的损伤识别方法能够提高损伤识别与诊断的准确性与可靠性。多传感器所采集的信息具有冗余性,当其中有一个甚至几个传感器信息不可靠时,经过数据融合处理后会使基于 WPNN 与数据融合的损伤识别方法在利用这些信息时具有良好的容错性。总之,利用神经网络进行特征级数据融合对结构损伤进行诊断与识别,具有很大的潜力,值得进一步在理论与实际应用上开展深入研究,这种方法也必定将成为结构损伤诊断研究领域的新方法。

参考文献

[1] 李国强,李杰.工程结构动力检测理论与应用[M].北京:科学出版社, 2-4

[2] Tsou P., Shen M. H. Structural damage detection and identification using neural networks [J]. AIAA Journal, 1994,32: 176-183

[3] 杨英杰,虞和济.结构损伤状态识别的神经网络方法[J].东北大学学报,1994,15 (2):210-214.

网络的概率篇8

数据挖掘和机器学习就是一种可以对数据进行整理的方法。基于贝叶斯网络的分类器是机器学习以及数据挖掘的重要分支,所以对于此类分类器的研究在现今的科研领域有着极为重要的价值。

二、贝叶斯网络

贝叶斯网络是一种可以把变量各个属性的联合概率密度用简单的框架之间的关系表现出来的概率图模型。贝叶斯网络包含一个图模型(DAG)以及条件概率分布表。有向无环图将变量之间的属性之间的关系用连接线表示,而属性之间的从属关系的条件概率则可以用概率分布表进行相关的解释。

(1)贝叶斯网络理论基础。想要了解贝叶斯网络,需要先掌握如何计算概率论中联合概率密度的方法。贝叶斯网络就是从这个问题进行展开最后总结出的模型。所以概率论是研究贝叶斯网络的基础。下面简单介绍几个在贝叶斯网络中常用到的概率论相关公式:

公式 1 条件概率:首先假设Ω是一个基本事件集合,A和B是Ω中的两个基本事件,并且P(A)>0,则条件概率为:

P(B┃A)=■ (2-1)

公式 2 乘法公式:假设基本事件A和基本事件B是基本事件集合Ω中的元素,并且P(A)>0,则乘法公式如下式:

P(AB)=P(A)P(B┃A)或P(AB)=P(B)P(A┃B) (2-2)

将上述公式推广到一般情况,对于n个随机量A1,A2,A3,…,An,并且有:P(A1)≥P(A1A2)≥P(A1,A2…An)>0,则可以得到如下公式,又称链式规则:

P(A1,A2…An)=P(A1)P(A2┃A1)…P(An┃A1A2…An-1) (2-3)

公式 3 全概率公式:假设对于n个基本事件A1,A2,A3,…,An属于集合E,并且有Uni=1Ai=Ω,Ω是一个样本空间,并且当i和j不相同时,事件Ai和事件Aj互不相关,则有:

P(B)=Uni=1P(B┃Ai) (2-4)

上式就是全概率公式的一种表达形式。利用此公式可以将事件B的概率分散到各个独立样本空间上的概率情况。

公式 4 贝叶斯公式:设A1,A2,A3,…,An∈R,并且有P(Ai)>0,i=1,2,…,n对于任意符合P(B)>0,并且B∈R的事件B,则有:

P(Ai┃B)=■ (2-5)

上式就是贝叶斯公式,利用这个公式,就可以在已经有先验概率的条件下,进行相应的计算,最后得到事件A和B之间的联系。

(2)贝叶斯网络。贝叶斯网络是一种图形模型,可以用它来对随机变量之间的依存关系进行一定的概括,该模型由结构以及参数两部分组成,其中参数即条件概率分布,它们分别用来定性定量概括随机变量之间的从属概率关系。所以贝叶斯网络是以概率论为基础,借助图形理论来描述变量之间关系的网络模型,利用此模型可以解决联合概率相关问题。

三、贝叶斯网络分类器

根据变量之间关系的不同,几种常见的贝叶斯网络分类器有:朴素贝叶斯网络分类器、TAN朴素贝叶斯网络分类器等。

(1)朴素贝叶斯网络分类器。这种分类器是目前最为常见的分类器之一,它在各个领域中都很好的发挥着作用。此类分类器中进行了朴素贝叶斯假设,也就是在对类值确定时,这些属性的条件概率分布相互独立。这类分类器有如图下的星形结构:

(2)树扩展朴素贝叶斯网络分类器。树扩展朴素贝叶斯分类器模型是在朴素贝叶斯分类器模型基础上对所关心的属性加上了一定的限制因素,可以看成是对后者的扩展模型。这类模型增加了各个子节点之间的相互依存关系,结构如下图:

(3)分类器性能评价标准及评价方法。当今的科研领域最常用的评价标准主要利用交叉验证(Cross Validation)的方法,此类方法主要有旁置法(holdout)、N折交叉验证法,以及留一法(leave-one-out)。

四、贝叶斯网络分类器的应用

贝叶斯网络模型时在数据处理、机器学习中的一个较好的应用,现今已经较为广泛的用于大数据处理。

五、结论

贝叶斯网络分类器是基于贝叶斯网络对数据进行分类的图形概率模型,当今大数据的时代得到了广泛的应用,能够通过不同数据关系对不同分类器进行很好的使用,可以对数据处理过程进行较好的简化。

参考文献:

[1]王中锋,王志海.基于条件对数似然函数导数的贝叶斯网络分类器优化算法[J].计算机学报,2012.

[2]李艳颖,杨有龙,汪春峰等.基于粗糙集属性约简与进化算法的贝叶斯网络分类器[J].郑州大学学报(理学版),2014.

网络的概率篇9

在社交网络中,用户间的好友关系需要经双的认证才能够建立起,因此,社交网络可以看成是一个以用户为节点,以用户间的好友关系为边的无向无权网络,话题消息沿着节点间的边迚行传播,具如1所示[11]。

1.2传染病扩散机制的网络舆情话题传播模型

1.2.1网络舆情话题传播中各节点的定义

将网络节点分为三类:易感染节点(S)、传播节点(I)和免疫节点(R),它们分定义如下:(1)易感染节点指未被传播状态,在t时刻未接收到某舆情话题信息的节点,处于S状态的节点很易因为接收到某话题状态转变为I状态。(2)传播节点表示在t时刻已经开始不断向网络中収布舆情话题信息的节点,幵且由于此状态节点对信息的传播,可以使未被传播状态的节点改变自身状态,变成I状态节点开始转収这信息。(3)免疫节点表示t时刻此节点处于免疫状态,不会被传播状态的节点传播的信息所影响[12]。

1.2.2网络舆情话题传播模型各节点转换觃则

针对某则舆情话题,社交网络中每个节点状态会在易感状态、传播状态、免疫状态乊间迚行转换,节点状态转换觃则具如下:(1)在始的网络中所有节点都为S状态;(2)在话题传播程中,网络总用户数定不变;(2)S(k,t)、I(k,t)及R(k,t)分表示t时刻网络中的度为k的易感染节点、传播节点及免疫节点的密度,那么S(k,t)I(k,t)R(k,t)1;(3)若一个易感染节点S与一个传播节点I迚行接触,那么该易感染节点转变成为传播节点的概率为PSi,PSi叫内部感染概率;(4)若一个易感染节点S与一个传播节点I迚行接接触,但会通其它径得到了目标舆情话题,从而以概率α由易感状态转变成为传播状态,那么α叫外部感染概率;(5)一个传播节点I对某话题失去兴趣而止传播,概率Pir转变为免疫节点,那么Pir叫免疫概率;(6)一个易感染节点S对话题内幵不感兴趣,虽然知道了该话题,但不会传播该话题,幵将以概率Psr接转变成为免疫节点,那么Psr叫接免疫概率。

1.2.3网络舆情话题传播模型的建立

社交网络话题传播是一动态程,即话题信息是否迚行传播受一个或多个因素影响,幵且网络节点传播话题时,与临近节点传播话题信息的情密切关,传播节点的度越,对话题在网络中的传越有。综合上述可知,社交网络舆情话题传播的节点状态转变具如2所示。

2实验仿真

2.1数据源

为了测试本文提出的社交网络舆情话题传播模型的有效性,选择标准数据集:Facebooksocialnetworkdataset迚行仿真实验,该数据集包含4039个节点,88234边[13]。仿真平台为:双核CPU2.85G,内存为4G,WindowsXP操作系统,编程工具箱为:Matlab2012。

2.2结果与分析

2.2.1不同节点的密度随时间的变化关系

假设始时刻网络中仅有一个传播节点,其余节点部为易感染节点,将式(1)中的各数设置如下:内部感染概率psi=0.4,外部感染概率α=0.3;免疫概率pir=0.2,接免疫概率psr=0.1,网络各节点的密度与舆情话题传播乊间的变化关系如3所示。由3可以看出:易感染节点密度不断衰减,到趋近于零;传播节点密度在始阶段快增,幵在达到峰值后速下降,到趋向于零;而免疫节点密度在话题传播期呈较快增态势,在其达到峰值后逐渐趋于稳定,幵最终趋向于1。

2.2.2内部感染概率对传播程的影响

当内部感染概率収生变化时,传播节点密度、免疫节点密度变化趋势如4所示。由4可以看出:(1)在网络达到稳态乊前,随着内部感染概率值的增,传播节点密度的值随乊增,此时免疫节点密度值反而减小,这是因为内部感染概率值越,会使网络中更多的易感染节点转变成为传播节点。(2)随着内部感染概率值增加,社交网络舆情话题的传播演化程达到稳定状态的时间越。(4)随着内部感染概率值等于零时,社交网络信息还是可以迚行传播,这与乊前研究结果有一定的差异,这主要是由于网络拓扑结构不同引起,相较于传统网络,社交网络的连通性更高;再加上社交网络用户乊间可以传播舆情话题信息,同时还可以通其它外部渠道获知该话题。

3.2.3免疫概率对传播程的影响

当免疫概率収生变化时,传播节点密度、免疫节点密度变化趋势如5所示。由5可以看出:(1)当免疫概率于零时,在传播程达到稳态乊前,免疫概率值与传播节点密度值乊间变化关系是一反向关系,免疫概率值与传播节点密度值乊间变化关系是一正向关系,因此免疫概率取值越,网络中的传播节点转变成为免疫节点的概率就越高。(2)当免疫概率等于零时,免疫概率值在传播期速增加,达到峰值后逐渐趋于稳定,这主要是由于当免疫概率等于零时,传播节点将始终保持自身状态,而不会向免疫状态迚行转变,而此时免疫节点密度值幵不为零,这是因为接免疫概率的存在,部分易感染节点易转变为免疫节点。

2.2.4外部感染概率对传播程的影响

当外部感染概率収生变化时,传播节点密度、免疫节点密度变化趋势如6所示。由6可知,在话题传播程达到稳定状态乊前,随着外部感染概率的不断增,传播节点密度也应增加,而免疫节点密度不断减小,这主要是由于外部感染概率描述易感染节点通媒报道以及现实生活中的人关系等网络外部渠道获知舆情话题,幵由易感状态转变成为传播状态的概率,因此外部感染概率值越,易感染节点的个行为受外部环境的影响。

2.2.5接免疫概率对话题传播程的影响

当接免疫概率収生变化时,传播节点密度、免疫节点密度变化趋势如7所示。由7可知,随着接免疫概率值逐渐的增加,传播节点密度峰值慢慢减小,免疫节点密度峰值慢慢增,这主要是由于免疫概率值越,社交网络中的一易感染节点有经传播状态接转变成为免疫状态的概率增加。

2.2.6始传播节点度对传播速度的影响

当始传播节点度值収生变化时,传播节点密度变化曲线如8所示,从8可以看出,如果始传播节点度越,其网络话题信息传播速度就越快;如果始传播节点度越小,网络话题信息传播速度对较慢。

2.2.7度值不同的节点密度随时间的变化关系

当易感染节点、传播节点及免疫节点的密度值収生变化时,舆情话题演化趋势与时间乊间的变化关系如9所示。从9可知,在舆情话题传播的程中,无论易感染节点、传播节点及免疫节点的密度值怎么变化,舆情话题的演化趋势基本一致,这表明不同度值节点具有似的行为特征。

网络的概率篇10

引用格式:王助娟,张轶. 基于网络编码的动态频谱接入性能研究[J]. 移动通信, 2016,40(1): 49-53.

Research on Performance of Dynamic Spectrum Access

Based on Network Coding

WANG Zhu-juan1,ZHANG Yi2

(1. Wuhan Research Institute of Post and Telecommunications, Wuhan 430074, China;

2. Wuhan Textile University, Wuhan 430020, China)

[Abstract] The feasibility of the application of network coding to cognitive radio network was discussed in this paper. The user service performance of network coding in wireless network was analyzed by means of Markov model. Theoretical analysis and numerical simulation show that network coding can effectively reduce the conflict probability of secondary and primary users, increase user throughput. In addition, its application to spectrum allocation is able to improve the spectrum prediction capability of the primary users and beneficial for the spectrum utilization of primary and secondary users.

[Key words]dynamic spectrum allocation cognitive radio network coding throughput

1 引言

在动态频谱接入(DSA,Dynamic Spectrum Access)的认知网络研究中[1-4],文献[7]通过连续马尔可夫规划来研究信道预留机制对网络性能提高的可能;在文献[8]中,该机制将主用户带宽划分为若干个次用户带宽供次用户接入,主要考量了阻塞概率、非完成概率以及中断概率,所应用的缓存机制能有效地减少前两类的概率;文献[9]调整缓存机制和等待时间限制来最大化用户的QoS;文献[10]将次用户的数据流区分为两种不同的服务等级,基于马尔可夫决策规划研究了不同机制的接入性能。

认知网络包含多个传输信道,每一个传输信道作为一个主网络,一个主网络包括一个基站(BS),BS随机收到数据包再广播出去,信道在忙/闲(busy/idle)两种状态间切换,busy/idle的概率依靠包的到达率和链路速率确定,文中基于马尔可夫规划分析了动态频谱接入的性能参数。各PU存储随机到达的数据包,利用线性网络编码将其编码,再将这些数据包广播到接收端。由于主用户的数据传输使用了网络编码,信道的忙时间为下界值,相比较未进行网络编码的机制,在忙期和闲期间转换的频率明显降低。在信道探测中,次用户利用所设定的计数器指示忙期并在给定时间期限内不会再次访问该传输信道,同时保持对信道探测列表的轮询用于随机接入到空闲信道,探测包括以下步骤:次用户首先访问候选列表,当候选列表所列出的信道均为忙时,探测剩余的信道。因此主用户使用网络编码传输数据能够减少对信道前期探测的需求,同时增加了次用户数据传输的机会,从而提升了次用户的吞吐量以及服务质量。

2 系统模型

本文所研究的认知无线电网络包括N个主用户,即可随机接入的信道数为N。每一个主用户传输信道等效于一个主用户子网络,其中包括一个基站和R个接收节点,在这个次级网络中,基站将数据包以广播的方式发送到所有接收节点。假设次用户的发送时间被划分为若干个时隙并保持和主用户同步,在每个时隙中数据包到达时间可以是任意,并且服从速率参数为,主用户信道服从删除概率为。认知网络的整体架构如图1所示:

假设次用户和主用户保持同步,主用户的数据包传输持续一个时隙长度T,每个时隙被分割为a个微时隙,包括用户探测过程和发送数据过程。如图2所示,从a1到aS表示探测周期,在aS时表示探测结束,开始数据包传输。

由系统整体架构图可知,普通的认知网络频谱接入机制对于接收到的数据包只是做放大转发或直接转发。图3描述了利用网络编码的频谱分配方式,即将接收到的多路主用户数据包进行网络编码,然后再发送出去,在计算复杂度允许时,可对多维数据流进行线性组合编码。

系统模型分析基于以下场景,分别是使用网络编码机制和未使用网络编码机制,在前者的场景中又将其分别建模为两种模型,即任意时刻均采用网络编码来对数据包进行处理;和当且仅当信道全忙时才使用网络编码。当使用网络编码时,每个基站接收存储下S个数据包并使用线性网络编码将其编码,再广播到接收端。当主用户子网络中的接收端解码出全部S个数据包,基站才接着发送下一组数据包,此处假定缓存足够大。网络编码通过伽罗华域上GF(2n)的操作组合、提取信息,其中F为有限域并保证n足够大。相反,在未使用网络编码的场景中,基站将依次广播数据包直到被全部正确接收为止。

3 理论分析

对于广播传输数据的删除信道而言,当网络中的授权用户对传输数据采用网络编码服务时,在每个拥有R个接收节点的子网络中,若能准确接收到S个编码包,就能够以较高概率解码出S个数据包。定义TIMELNC为全部接收端成功并解码出S个数据包的完成时间,则TIMELNC的数学期望为[6]:

E(TIMELNCE)

(1)

对于稳定的主用户队列而言,有:

λ

其中THLNC为最大吞吐量,由Little公式可导出主用户信道的空闲概率,即:

(3)

再定义未使用网络编码机制的完成时间为TIMER,则:

(4)

同样对于未使用网络编码机制的主用户队列也存在条件:

λ

其中THR为未使用网络编码机制的最大吞吐量,此时的信道空闲概率为:

(6)

由公式(1)到公式(6)可得到:

(7)

正如所期望的,网络编码机制能增加信道的空闲概率,提高次用户接入频谱的机会。

4 稳态性能分析

本节基于连续马尔可夫规划[7-8]对所提线性网络编码机制的稳态性能进行分析和仿真。设i和j分别表示主用户和次用户在系统中所占信道数,则主用户和次用户的数据包到达率、服务时间以及状态空间等参数含义归纳如表1所示:

表1 各状态空间参数说明及设置

符号 含义及仿真参数设置

N 信道数,N=5

λ1/λ2 主/次用户数据到达率λ1=0.02,λ2=0.01

μ1/μ2 主/次用户服务率μ1=μ2=1/80

i/j 主/次用户占用信道数

系统状态空间

状态概率分布空间

i, j 状态为i个主用户、j个次用户的概率分布值

non-LNC 未使用网络编码的场景

LNC-1 仅在信道全忙时使用网络编码的场景

LNC-2 一般情况下均使用网络编码的场景

状态空间(i, j)转移图如图4所示:

图4 状态空间(i, j)转移图

由连续马尔可夫规划及状态转移图可得稳态形式的通项表达式,并且对于状态集合(i, j)有等式约束:

πiπ (8)

式中下标i代表input;o代表output。稳态形式的通项方程式为:

(iμ1+jμ2+λ1+λ2)πij=(i+1)μ1πi+1j+λ1πi-1j+λ2πij-1+(j+1)πij+1

(9)

(λ1+λ2+iμ1+jμ2)πij=(j+1)μ2πij+1+λ2πij-1+λ1πi-1j+

(j/N-i)λ1πi+1j-1 (10)

(i, j) (11)

求解线性方程组(8)~(11)可得到状态概率分布空间的全部向量。

性能分析包括被广泛关注的三个参数,即阻塞概率、中断概率和吞吐量。阻塞概率即信道全忙时次用户不能接入信道从而被阻塞的概率,表示为:

(12)

中断概率即系统中占据信道的任何一个次用户会以一定概率被随机到达的主用户中断通信,表示为:

(13)

参数设置如表1所示,其中N=5,主用户数据包到达率为0.02,次用户到达率为0.01,服务时间均为1/80s,数值分析基于三种场景,即non-LNC(未使用网络编码)、LNC-1(仅在信道全忙时使用网络编码)和LNC-2(一般情况下均使用网络编码的场景)。考量目标为系统吞吐量Th、阻塞概率PB以及中断概率PI。

如图5所示,相比于未使用网络编码的机制,使用了线性网络编码机制的认知网络其吞吐量有所增加,并随着次用户达到率的增大,吞吐量的增加量进一步提高。经过归一化处理及量化分析,LNC-1机制平均吞吐量比non-LNC机制提高约10%;LNC-2机制平均吞吐量比LNC-1机制提高约8%,相比于non-LNC机制提高约20%。

图6和图7分别显示了不同机制下次用户的阻塞概率和中断概率的相对变化。由图6可知,随着次用户到达速率的变化,LNC-2机制的阻塞概率总是小于LNC-1及non-LNC机制。同样,图7显示的中断概率的变化情况也反映出了使用线性网络编码对次用户接入信道性能的提升,如引言中所提到的,用户接入到信道从而得到频谱资源的概率增加以及处在通信中而被主用户打断的概率的减少正好反映了用户QoS的提高。

5 结论

相比于传统的认知网络频谱分配策略,利用网络编码增加次用户的传输能力能够较大幅度地提高系统性能。文中基于马尔可夫模型对其性能做了相应的数值分析,在给出状态转移图的基础上,通过求解系统状态方程得到所需的性能参数。由三种场景的分析结论可得,认知无线电网络中引入网络编码机制作为其动态频谱分配策略能缩短主用户的通信持续时间,降低授权用户和非授权用户的冲突概率,冲突概率可以达到理论上的最小值。由此可见,文中所提的机制相比于其他接入策略而言,进一步优化了网络中用户的接入性能,提高了服务质量。

参考文献:

[1] FCC 02-155. Spectrum policy task force report[S]. 2002.

[2] MITOLA J, MAGUIRE G Q. Cognitive radio: make software radios more personal[J]. IEEE Personal Communications, 1999,6(4): 13-18.

[3] TANG P K, CHEW Y H. On the modeling and perfor-mance of three opportunistic spectrum access schemes[J]. IEEE, 2010,59(8): 4070-4078.

[4] SUBRAMANIAN A P. Fast spectrum allocation in coordinated dynamic spectrum access based cellular networks[C]. USA: IEEE Proceeding of DySPAN, 2007: 320-330.

[5] AHLSWEDE R, CAI N, YEUNG R. Network information flow[J]. IEEE Transactions on Information Theory, 2000,46(4): 1204-1216.

[6] S WANG, Y E SAGDUYU, J ZHANG, et al. Spectrum shaping vianetwork coding in cognitive radio networks[J]. IEEE, 2011,42(4): 396-400.

[7] ZHU X, SHEN L. Analysis of cognitive radio spectrum access with optimal channel reservation[J]. IEEE, 2007,11(4): 304-306.

网络的概率篇11

文章标识码:A

文章编号:1007-3221(2015)03-0045-06

引言

自然灾害和交通拥堵使人们越来越重视交通运输网络的可靠性,目前对城市道路网络可靠性研究主要有三类:通行能力可靠性、行程时间可靠性和连通可靠性。其中,连通可靠性是交通网络可靠性分析研究的基础,只有在连通的基础上才能确保各类交通流完成出行。

连通可靠性反映的是交通网络节点两两间保持连通的概率,它是进行其它可靠性分析的研究基础,最早是由日本的Mine Kawai在1982年提出的,随后,各国学者作了进一步的理论探讨。早期连通可靠性研究的对象主要是系统的物理结构,考虑的是系统连通性,连通可靠性一般只有0,l两种状态,1代表连通,0代表不连通。城市的交通状态是随机变化的,仅用两个变量不能反映交通网络连通的不断变化,常态环境下城市道路连通性有多种状态。朱顺应、陈晓明、吕斌等采用饱和度法(v/c)来刻画路段连通可靠性的状态,连通的概率是流量v和通行能力c的函数,p=F(v,c),这样连通可靠性由{0,l}扩展到[0,1]区间,这种扩展使连通可靠性的应用范围更广;但同时又面临新的问题,虽然通过标定函数可以求得F(v,c)路段的连通可靠性,但由于交通网络的结构往往比较复杂,规模过大,整个交通网络连通可靠性的定量研究会变得非常困难。因此,路段连通可靠性、路网规模及整个路网系统的连通可靠性之间的关系一直没有定论。

本文在道路状态影响因素方面主要考虑交通流量和通行能力。连通可靠性是流量和通行能力的函数,即连通可靠性p=F(v,c),p∈[0,1];用对偶拓扑法获得交通网络图,定义随机交通网络的渐近连通可靠性,利用随机网络模型研究路段连通可靠性、路网规模及路网连通可靠性之间的定量关系,在一定条件下一定程度上解决两个基本问题:a.当路段连通可靠性较小的状态下(交通拥堵状态或路段遭到毁坏),路网是不是仍然保持连通的;6.路网结构和规模确定条件下,路段连通性和整个路网连通性之间的定量关系,即路段的连通概率为多少时才能保证整个路网是连通的。

1 交通网络的随机网络模型

1.1 交通网络拓扑结构图的获得

交通网络连通可靠性分析首要问题是利用一定的规则处理现实中的交通网络。一个交通网络由交叉口和路段(或称为边)组成.常用刻画静态交通网络的网络拓扑方法主要有:原有拓扑法,以边为拓扑结构的边,交叉口为节点;对偶拓扑法,以道路编号或者路名为节点,即相同的路名可用一个节点代替,交叉口为节点之间的连线。利用对偶拓扑法转化路网的拓扑图实质是进行点和边的相互转化来表达网络的连通性。在进行边转化为点时,原图中一条边就转化为对偶图中的一个点,而在点(交叉口)转化为边时,要根据网络的连通性而定,通过转化原图中边和交叉口的连通概率完全转化为对偶图中边出现的概率。

本文首先利用原有拓扑法建立交通网络图,然后通过不同路段交通流量和通行能力整合网络图,合并交通流量v和通行能力c接近的路段,拆分交通流量和通行能力差别过大的路径。具体做法,设定两个阈值ι和a,对具有同一路名的不同路段s和t,若满足|vs-vt|>ι或|cs-ct|>a,则在网络图中路段s和t作为两条边看待,否则可把路段s和t合并为一条边;对不同路名的相同方向路段s和t若|vs-vt≤ι且||cs-ct|≤a,则两条道路s和t在网络图中视为一条边。经过上述整合之后,再利用对偶拓扑法可以得到所需要的交通网络图。

1.2 城市交通网络的随机网络模型

利用上述方法得到一个交通网络图G(A,E),其中A={a1,a2,…,ai…,an}表示对偶图中节点的集合,实际代表路网道路的集合;记E=.{e1,e2,…,ei…,en}为对偶图中边的集合,实际表示交通网络中道路的连通关系。以下讨论皆在G(A,E)对偶图中进行。若要确定网络图G(A,E)的连通性,需要确定网络图G(A,E)是以何种结构出现的,即图G(A,E)的边生成规律。

对交通网络的结构研究,多是结合规则网络、无标度网络或随机网络等相关模型,这类方法从静态角度刻画了交通网络的平均距离、度分布、连通性等几何特征,静态网络模型在刻画交通网络连通性随时间变化特性方面显得不足,特别是现实中随着交通需求增大,拥堵加剧;交通需求随机性对连通性的影响主要反映在图G(A,E)中边出现的概率,本文的研究基础是基于随机网络模型,网络图G(A,E)中边的集合E={e1,e2,…,ei,…,eq}中每条边的出现,也就是任何两点连接成边以概率p出现,并且每两点连接形成边是独立的,相比而言这种模型能较好的反映交通网络连通性的随时间变化的规律。

2 交通网络渐近连通可靠性定义

对于交通网络图G(A,E),若有n个顶点,对此网络图进行标号,得到一个有n个顶点的标签图,其中n≥2,这个标签图最多可有组合Cn条边,假设这个图实际有q条边,它所形成的标签图的数量2N。记P为交通网络G(A,E)中每条边出现的概率,进一步定义:P(G)=pq(1-p)N-q,其中G∈Ω|E(G)|=q,N=Cn,这里Ω=Gn(标签图)。

以下分别从两个角度,定义交通网络的渐近连通可靠性。

定义1:随机交通网络G(A,E),记Cn为所有n阶连通图的集合,交通网络G(A,E)中每条边出现的概率p确定,若P(Cn)存在,且lim P(Cn)=1,则称几乎所有的n阶图具有连通性,称交通网络G(A,E)具有网络规模变大时的渐近连通可靠性。

定义2:随机交通网络G(A,E),G(A,E)的顶点n为常数,G(A,E)中任意两点连通的概率(也是每条边出现的概率)为p,若存在po,当p>p。时,随机交通网络G(A,E)是连通的,当p

从定义l得知,若交通网络具有网络规模变大时的渐近连通可靠性,当网络规模大到一定程度时,即使连通的概率很小,交通网络仍然是连通的。由定义2知,当交通网络规模一定时,路段连通的概率不同,整个交通网络可能连通,也可能不连通;特别的,在满足随机网络模型条件下,一定存在交通网络连通可靠性的阈值,交通网络是具有渐近连通可靠性的。下面结合ER随机图模型,给出阈值的具体表达式。

3 交通网络渐近连通可靠性证明

结合两种定义给出三个结论,并进行证明。

对于标签图G(A,E),其中n≥2,一个标签图最多可有Cn条边,假设这个图有q条边,从Cn条可能的边中选取q条边得到的组合数为C2C,有n个顶点和q条边的标签图的所有组合数量记作L(n),则L(n)

结论1 当p=0时,边数q=0,网络中所有节点都是孤立的,节点间无边连接,交通网络不连通,即lim P(C。)=0,当p=l时,网络中所有节点都是连通的即lim P(Cn)=1,随机交通网络演变为固定的网络。

结论2 当p>0为常数时,lim P(Cn)=1,即,随机交通网络G(A,E)具有网络规模变大时的渐近连通可靠性。

证明 对于图G(A,E),|A|=n,要证lim P(Cn)=1,可证不连通的概率为0,若该图是不连通的,可设图G有k(k>2)个分支构成G=M2UM3U…UMk,其中,Mi为第i个分支,假设其顶点数为m;则Mi到其他分支即Mi中不连通的边最多有(n-m)m,每条边都独立的不出现的概率为(1-p),则p([Mi,Mi]=φ=(1-p),图G(A,E)所有不连通边的上界记作ιn则,对于级数μn=公式中n-m和m是对称,故有n-m≤n/2或m≤n/2,不妨设m≤m/2

以上结论说明当随机交通网络的规模大到一定程度时,虽然某些道路是不连通的,但整个交通网络是连通的,结论2没有说明达到何种程度;从另一个角度考虑,如果网络规模确定,连通的概率p增大到某种程度也能保证交通网络是连通的,至于p要达到何种程度,结论3在一定程度上给予解决。

结论3若交通网络G(A,E)的顶点n为常数,则G(A,E)连通可靠性的阈值为,即:当p>po时,随机交通网络G(A,E)是连通的,当p

分析假设连通的概率为p,则对一固定节点成为孤立节点的概率为(1-p),考虑JD比较小的情况,即当p-o时,而可以用渐近。则某一固定节点成为孤立点的概率为。若网络存在一个孤立点,则某一固定节点是这个孤立点的概率也为,求得证明是图G(A,E)连通的阈值,分两步即可:a)当时,证明存在孤立点;b)当时,证明网络是完全连通的。

证明a)证明当时,存在孤立点。的期望,σ?为xn的方差。

由上面的分析知,某一固定节点为孤立点的概率为整个网络存在孤立点的期望个数为即Exn≥2;

需要证明存在孤立的节点的概率收敛于1。

先证xn的方差是有界的:考虑E[(xn)(xn-1)]是孤立节点有序对的期望个数,因此,E[(xn)(xn-1)]=n(n-l)(1-p)2n-3。xn的方差

由车比雪夫大数定理知:即存在孤立的节点的概率收敛于1。

b.证明当时,图G(A,E)是连通的。只有一个分支,网络是连通的。

综合a和b知,当时必然存在孤立的节点,此时图G(A,E)不连通;当时,图G(A,E)是连通的,所以是图G(A,E)连通的阈值,结论3成立。

结论3 在一定条件下揭示了路段连通可靠性和整体路网连通可靠性之间的定量关系:网络的规模确定,每条道路的连通概率p大于时,交通网络是连通的;反之,如果道路连通概率p小于,就会影响路网的连通性,这为日常交通的控制和管理提供了重要的理论依据。另,结论2和结论3从两个方面分别反映了交通网络连通可靠性的规律,两者之间揭示的规律是一致的,可以容易地利用结论3得出结论2:当p固定时,一定存在n*,使得,显然,当时整个路网就是连通的,这为交通网络规模控制提供了理论依据。

4 交通网络渐近连通可靠性的应用示例

如图1所示,为宁波市高新区交通网络图,利用本文第1.2中的方法,根据某一时段的交通流量和通行能力对路段进行整合,利用对偶图法得到所需网络图如图2。图2由39个顶点,236条边构成,顶点代表道路,边代表39条道路之间的连通关系。由随机网络模型求得,宁波高新区交通网络对应边的连通可靠性约为0.2,有39个点构成的随机网络,连通的阈值为In39/39=0.093,所以,当道路畅通的情况下,边与边的连通概率较大,此时整个交通网络具有较好的连通性。但当边的连通概率降低时,整个路网的连通可靠性也会降低,如当连通的概率为0.1时,得到的随机网络图为图3,此时就会出现孤立点,孤立点存在表示道路是不连通的。

网络的概率篇12

概率图模型具有灵活的推理机制、强大的不确定知识表达能力,目前在众多领域得到了广泛的应用,如数据挖掘方面,将概率图模型用于数据挖掘不但能够充分利用领域知识和样本数据的信息处理不完整数据,而且能够对变量间的因果关系进行学习;故障诊断方面,根据经常发生的故障和系统现有的状态,利用概率图模型进行预测,制定故障预防机制;经济领域方面,利用概率图模型对石油价格、股票价格进行预测;工业方面,贝叶斯网络系统已用于工程设计制造及产品质量控制,概率图模型除了在上述几个方面取得很好的应用外,还在交通管理、文化教育、医疗诊断等方面得到应用。上述各领域有个共同特性就是处理过程中存在不确定性,而概率图模型能够很好地根据上下文的因果关系进行预测,能很好地对在不确定性问题进行推理、决策。

一、概率图模型概述

概率图模型是近年来图论与概率论相结合的产物。概率图模型提供了直观、灵活的拓扑结构图,拓扑结构图是一种很好的不确定问题的建模工具,从计算算法角度理解图本身就是一种数据结构,因此概率图模型中的图为领域研究提供了算法,为问题的解决提供了思路;在使用概率图模型进行领域研究的过程中,概率图模型还提供了条件概率表,概率表中的条件概率为问题的研究提供了推理数据。因此概率图模型的使用,为各种随机不确定问题的建模和分析注入了新的活力。

概率图模型之所以能在不确定性问题处理过程中得到很好的应用,主要是概率图模型能够很好地模拟收集不确定问题的初始信息和最终目标信息之间的关系,可以模拟不确定事件各节点之间的相互关系及依赖关系,可以通过概率推理的方法推理目标信息的信度或者说可能状态的分布等。但在用概率图模型来解决不确定性问题的过程中也可能会遇到很多因素制约,这些题制约因素增加了概率图模型解决不确定问题的难度。制约因素包括很多,有外在的也有的是模型自身的。如环境变化、政策变化都会给概率图模型的使用带来影响。概率图模型本身也存在一些问题,如在使用概率图模型时,如何确定模型参数;如何确定参数概率及如何进行推理等,这些问题的解决有待于在实际应用过程去发现解决,如何处理概率图模型本身的这些问题也是概率图模型研究的一个重要方面。

二、贝叶斯网络模型

贝叶斯网络模型是贝叶斯网络模型最主要的模型之一,在不确定问题研究方面取得了很好的应用。图1就是一个简单的贝叶斯网络模型。从该模型可以知道,一个完整的贝叶斯网络模型由两部分组成:一个是反映节点依赖关系的拓扑结构图,拓扑结构图由节点和边组成,节点表示了随机变量的个数,该模型中有4个节点分别为A、B、C、D,若用V表示节点集,则V可记为V={A,B,C,D},随机变量间的依赖关系在贝叶斯网络就是通过有向边来体现,如果用E来表示边集,则E可以记为E={AB,AC,BD,CD},如果用T表示拓扑结构图,则T可记为T={V,E};另一部分是为表示各节点依赖关系强弱的概率表,从表中可以知道各随机变量依赖关系的强弱,如果用G表示概率表,若S表示贝叶斯网络,则S可记为S={T,G}。

三、供应链不确定性问题决策系统的贝叶斯网络建模

(一)贝叶斯网络求解供应链不确定性决策问题的过程

供应链各级企业存在诸多不确定性,这些不确定性影响供应链的运作。为了实现供应链企业利润的最大化,尽量减少供需矛盾的出现,供应链管理人员必须能及时把握供应链企业中的不确定性,对出现的不确定及时做出决策。如今的计算机技术正试图结合概率论解决供应链中这些不确定性问题,而贝叶斯网络模型是图论与概率论的完美结合,是一种很好的处理供应链不确定性问题决策的工具,贝叶斯网络中的图能够很好地描述供应链各环节不确定性问题中各事件的相互关系,而条件概率则体现了事件间的依赖程度,总之贝叶斯网络能清楚展示供应链不确定性问题中各节点错综复杂的相互关系,且模型直观易于理解,推理技术成熟,计算简单。但用贝叶斯网络解决供应链不确定性决策问题的有严格的过程,具体的过程如表2所列:

(二)贝叶斯网络求解供应链不确定性决策问题的原则

从表2所列可知,用贝叶斯网络求解供应链不确定性问题决策的过程简单,但同时建模的过程中必须遵循一定的原则,具体的原则为:

1.模型简单性原则

在能正确解决供应链不确定性问题的情况下,尽可能降低贝叶斯网络的复杂度,使所建模型简单化,这样能节省建模时间及建模成本,降低模型结构学习的难度,简化模型的推理过程。

2.模型整体性原则

贝叶斯网络本身就是个整体,不是子模块的简单重组,因此,在对供应链不确定性问题建模的过程中,必须采用一定的策略及评价机制保证所建模型的整体性。常用的建模方法有“自上向下”及“自下向上”两种。

3.反馈性原则

用贝叶斯网络建立的供应链不确定性问题决策模型是否正确及符合要求,要反复进行验证,要靠供应链管理人员把企业管理中遇到的各中不确定问题及时反馈给建模人员,建模人员应根据反馈信息,及时对模型进行学习、修正,保证供应链不确定性问题决策模型模型的正确性。

(三)基于贝叶斯网络供应链不确定性问题决策的建模过程

用贝叶斯网络对供应链不确定性问题决策系统进行建模,分为问题分析、模型设计和模型测试三个阶段。首先是聘请领域专家,对复杂的问题进行任务分解;然后是分析不确定性问题的相关变量,建立网络结构及确定节点的概率分布,构建模型;最后对模型进行学习、评价、测试、修正错误,直到模型较为准确为止。

1.问题分析

运用一定的方法对供应链不确定性问题进行分析和理解,明确建模的目标,在充分认识供应链不确定性问题的基础上,确定建模方案。该过程要完成的任务有:先验概率的确定、复杂性分析、专家选择、任务的分解等。供应链不确定性问题的分析要通过建模人员、企业、客户三方的反复沟通。同时,在建模过程中必须聘请专家,综合专家的意见,确保所建模型的客观性、正确性。

2.模型设计

该阶段的任务主要是确定贝叶斯网络模型的拓扑结构图及概率分布。BN建模过程由一定性过程和一个定量阶段组成,定性过程是确定拓扑结构;定量阶段是确定概率参数。这两项任务完全后,网络模型也基本上确定。但实际中建立一个贝叶斯网络模型往往是一个反复的过程。具体的步骤为:

(1) 确定节点集。根据供应链不确定性问题的历史资料及领域专家提供的信息来确定变量数目。

(2) 确定条件概率表的条件概率。节点条件概率可以由三种方式来确定:一是用先验历史资料的记载和用户的知识来确定;二是建模人员通过观察和测试来确定;三是通过专家提供的信息来确定,也可以混合三种方式来确定条件概率。

3.模型优化

模型优化主要是完成对模型的测试,测试其模型结构是否合理、正确,结果是否理想,如果有问题则必须对所建模型进行修正,直到符合要求。通常使用的测试方法有模型结构的正确性测试方法、概率条件正确性测试方法、案例测试方法等。

四、总结

概率图模型在不确定问题处理方面虽然得到很好的应用,但也有些方面必须在研究过程中继续加强。特别要在以下两个方面需要做进一步研究:

1.有些不确定性问题的参数数据在研究过程中是无法预先确定的,这就要求在研究过程中不断地加强对所构建的模型进行参数学习的研究,这是在使用贝叶斯网络对供应链不确定问题进行研究的过程中必须努力的一个方向。

2.推理算法的研究是贝叶斯网络研究的另一个难题,因此研究出适合于供应链不确定性问题决策的贝叶斯网络推理算法是今后研究的一个重点与难点。

参考文献:

[1]Radu stefan niculescu, Tom M.Mitchell, R.Bharat Rao. Bayesian network lesrning with parameter constraints[J]. Journal of machine lesring research, 2006:7~10.

[2]Comaniciu D, Ramesh V,Meer P. Kernel based object tracking[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,25(5).

[3]Nummiaro K, Koller Meier E, Gool LV. An adaptive color??based particle filter[J]. Image and VisionComputing,2003,21(1):99~110.

[4]DN.Friedman.Probabilistie GraPhieal Models Princi Plesand Teehniques.theMITPress,2009.

[5] Rickard E,Neapolitan.Learning Bayesian networks[M].NortheasternlLinois University,Chica-go, Illinois,2004.

网络的概率篇13

这些问题都涉及到用户模型的两个功能:评估和预测。而自适应超媒体系统能否准确生成合适的自适应内容和自适应导航,对用户的不确定信息的准确评估是关键因素。而贝叶斯网络最大的优点就是处理不确定信息,因此本文将主要探讨贝叶斯网络技术在自适应超媒体系统中的应用。

1超媒体系统中的不确定性

在自适应超媒体系统中,用户建模过程中存在的不确定性因素最多,用户模型就是在众多的不确定因素的基础上做出对用户的评估和预测。用户模型需要处理的不确定因素主要有如下几类。

(1)关于用户领域知识的初始掌握程度的不确定性。用户对领域内的知识掌握程度一般是无法确切衡量的。例如在教育超媒体系统中,学生的知识水平就存在很大的不确定性,这种不确定性在实际的课堂教学中也无法完全排除。一个超媒体系统在初始化阶段,分析用户在使用这样的系统之前的掌握程度,一般是通过一组或几组问题进行测试。如果测试的问题过多,用户对于系统的兴趣就会受到影响,因此大部分的系统在初始化测试时,所采用的问题一般非常有限,这样对于用户领域知识的初始化程度就无法很准确的评估。

(2)用户的浏览动作与知识掌握程度之间关系的不确定性。虽然系统能够精确记录下用户与超媒体系统交互的动作的时间,但是,对每一个用户而言,完成阅读每一个信息节点的“合适”的时间是无法确切衡量的。一种方法是通过其他途径获得每一个用户的阅读速度,但这不是所有系统能够获取的信息。

(3)用户的浏览动作和目标的联系的不确定性。认知心理学的研究成果表明,这种不确定尤其表现在用户初期使用系统的时候,出于好奇心理,尝试浏览可能和他本身不感兴趣的内容。而这些动作有可能对系统在预测用户的浏览目标时带来不利的影响。

2贝叶斯网络

贝叶斯网络是一个概率推理机制,它在概率论的基础上进行不确定推理。贝叶斯网络为在某一特定应用领域中描述随机变量之间的概率独立性提供了一个图形化的表达方式,以及利用这些独立进行复杂的概率推理的算法…。

2.1贝叶斯网络的定义

贝叶斯网络又称为信念网络,是一种图型化的模型,能够图形化地表示一组变量间的联合概率分布函数。一个贝叶斯网络包括了一个结构模型和与之相关的一组条件概率分布函数。结构模型是一个有向无环图,其中的节点表示了随机变量,是对于过程、事件、状态等实体的某特性的描述,边则表示变量间的概率依赖关系。图中的每个节点都有一个给定其父节点情况下该节点的条件概率分布函数。这样,一个贝叶斯网络就用图形化的形式表示了如何将与一系列节点相关的条件概率函数组合成为一个整体的联合概率分布函数J。具体定义如下:

定义:设V={x,x2……X}是值域u上的n个随机变量,则值域U上的贝叶斯网络BN(B。,B),其中:

(1)B|=(V,E)是一个定义在V上的有向无环图(DAG),V是该DAG的节点集,E是该DAG的边集。如果存在一条节点Xi到节点X的有向边,则称Xi是Xi的父节点,Xi是Xi的子节点。记Xi的所有父节点为诚。

(2)Bp={P()(il)6-[0,1]}lxi∈V,对于V中的每个节点,定义了一组条件概率分布函数P(Xl)∈[0,1]。

由贝叶斯网络,利用贝叶斯公式,我们很容易得到X的全概率分布函数:

P(x)=P(x。,x2……XⅡ)=liP(Xl),诚是Xi的所有父节点。

2.2贝叶斯网络的优化

贝叶斯网络的主要用途是进行概率推理。在已知网络中某些节点概率值的情况下,利用贝叶斯网络计算可以获得其它节点的条件概率。这种推理可以形象的称为条件概率的“传播”。然而,一般的贝叶斯网络推理都存在一个“NP—Hard”问题J。当贝叶斯网络中不存在无向环的结构时,可以找到多项式时间算法,为了将一般的贝叶斯网络改造为不含无向环的贝叶斯网络,通常采用以下两种方法。

(1)聚簇。如图l所示,将图中的节点B和C合并成一个节点,从而消除图l(a)中的有向环,这种方法称作聚簇。

(2)条件分割。设变量A的取值范围为:A。,A2,…,,则将原来的贝叶斯网络分割成n个网络,分别是A=A。,A=A2,…,A:。这种方法称作分割,如图2所示。

(3)贝叶斯网络举例。图3显示了一个贝叶斯网络的例子,它模型化了下述的二进制变量:变量a表示病人的年龄大于75岁,变量b表示病人需要戴眼镜,变量c表示病人眼中出现晶状体,变量v表示病人的视力由于眯眼而有所提高,变量s表示病人抱怨视力差,变量r表示病人的视网膜反射可察觉。在这个贝叶斯网络中,变量a与b之间的弧表明相对于其它变量,a与g是直接依赖的。变量a与s之间没有弧相连,它们是通过变量b与C而发生依赖关系。

变量间依赖的强弱由条件概率分布函数Bp量化。例如,当a为真,b为真的概率为P(b=TIa=T)=0.75。当给定了变量的父节点的值后,该变量为假的条件概率可以从此变量为真的条件概率中推导出来,在此就没有给出。

3自适应超媒体系统中贝叶斯网络的构造

一个贝叶斯网络由网络结构表示其定性部分,由条件概率分布函数表示其定量部分。这两部分必须加以指明以构成一个贝叶斯网络,之后在一个系统中被用作推导引擎。在超媒体系统中,构造贝叶斯网络分为四个阶段。

(1)定义域变量。在某一领域,确定需要哪些变量描述该领域的各个部分,以及每个变量的确切含义。

(2)确定网络结构。由专家确定各个变量之间的依赖关系,从而获得该领域内的网络结构。在确定网络结构时必须注意要防止出现有向环。

(3)确定条件概率分布函数。通过由专家确定的网络结构中每个变量的条件概率分布函数,量化变量之间的依赖关系。

(4)应用到实际系统。运用到实际系统中,利用系统搜集的数据,经过计算和分析,调整贝叶斯网络的网络结构和各变量的条件概率分布函数,对贝叶斯网络进行优化。

在实际应用中,在每一个阶段之后,都要进行评估,考察前面的阶段是否被成功地执行。每当发现前面阶段所得的结论不充分时,前一个阶段将被再次执行,否则,前进到下一阶段。每个阶段发生的错误应被及时更正,在早期产生的错误若在后期加以更正将比在早期更正花费更大的代价。我们称重复经历某个阶段并进行评估的过程为建立一测试期(budd—textcycle),据此,我们构建了自适应超媒体系统贝叶斯网络构造生命周期图,如图4所示。

在某一特定领域构造贝叶斯网络是一件非常困难并且也费时的工作。这种困难一方面来自于某些领域过于复杂,即使该领域的专家也无法完全正确的描述该领域的因果关系,这影响了贝叶斯网络的网络结构的构造;而另一方面,人们擅长于描述定性的关系,而不擅长描述定量的关系,这直接造成了在确定条件概率分布函数时的困难。

在线咨询