计算机视觉论文15篇

计算机视觉论文:计算机视觉下食品工业论文

1计算机视觉技术概述

1.1自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析，可以进行整体识别、增强对目标识别的性。

1.2实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像，而不需要直接接触，可以减少对所检测食品的伤害。

1.3稳定的检测精度

设计的运行程序确定后，计算机视觉技术的识别功能就会具有统一的识别标准，具有稳定的检测精度，避免了人工识别和检测时主观因素所造成的差异。

2计算机视觉技术在食品检测中的应用

20世纪70年代初，学者开始研究计算机视觉技术在食品工业中的应用，近几十年电子技术得到快速发展，计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态（如形状、重量、外观损伤、色泽等）的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代，比国外发达国家晚20多年，但是发展很快。

2.1计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛，从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等［4］采用分割水果的拍摄图像和新的计算机算法计算水果的半径，进而得出果蔬的较大直径。研究表明，该算法不仅降低了计算量而且提高了计算精度，此方法用于水果分级的误差不超过2mm，高于国际水果分级标准所规定的5mm分类标准差，可在工业生产中很好应用。李庆中［5］也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用，结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等［6］以苹果色泽特征比率的变化规律为理论基础，结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域，检测不仅快速而且结果。刘禾等［7］通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测，计算机视觉技术还可以将苹果按照检测结果进行分级，把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一，应义斌等［8］通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄，其识别率达到90%。杨秀坤等［9］综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统，实现了具有度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等［10］采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况，初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等［11］通过计算机视觉技术对水果图像的边缘进行检测，然后确定水果的大小用以水果分级。试验表明，该方法比传统的检测方法速度快、率高，适用于计算机视觉的实时检测。朱伟［12］在模糊颜色的基础上，分析西红柿损伤部分和完好部分模糊颜色的差别，用分割方法对西红柿的缺陷进行分割，结果显示率高达96%。曹乐平等［13］人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性，然而根据相关性，样品检测的正确识别率分别只有约74%和67%。刘刚等［14］从垂直和水平两个方向获取苹果的图像，并通过计算机自动分析图像数据，对苹果的外径、体积、以及圆形度等参数进行处理，与人工检测相比，计算机视觉技术具有检测效率高，检测标准统一性好等优点。Blasco.J［15］通过计算机视觉技术分析柑橘果皮的缺陷，进而对其在线分级，正确率约为95%。赵广华等［16］人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统，研制出一款适于实时监测、品质动态的智能分级系统，能够很好地实现苹果分级。王江枫等［17］建立了芒果重量与摄影图像的相互关系，应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤，按重量分级其率均为92%，按果面损伤分级的率分别为76%和80%。

2.2计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中，产品的分级、品质检测主要采用人工方法，不仅需要大量的物力人力，而且存在劳动强度大、人为误差大、工作效率低等缺点，计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等［18］利用计算机视觉技术来检测鸡蛋蛋壳裂纹，利用摄像机获取鸡蛋图像后，采用fisher、同态滤波和BET算法等优化后的图像处理技术，获得裂纹形状并判断，试验结果表明，计算机视觉技术对鸡蛋蛋壳裂纹的检测率高达98%。汪俊德等［19］以计算机视觉技术为基础，设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征，和设计的数学模型对比来实现双黄鸡蛋的检测和识别，检测率高达95%。郑丽敏等［20］人通过高分辨率的数字摄像头获取鸡蛋图像，根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期，结果表明，计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果率为94%。潘磊庆等［21］通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋，其检测率达到98%。MertensK等［22］人基于计算机视觉技术研发了鸡蛋的分级检测系统，该系统识别带污渍鸡蛋的正确率高达99%。

2.3计算机视觉技术在检测食品中微生物含量的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展，在微生物快速检测中的应用也越来越多，主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主，并在个体细胞的研究上取得了一定的进展。殷涌光等［23］以颜色特征分辨技术为基础，设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统，该系统检测结果与传统方法的检测结果具有很好的相关性，但与传统方法相比，可以节省5d时间，检测时间在18h以内，并且能够有效提高产品品质。Lawless等［24］人等时间段测定培养基上的细胞密度，然后通过计算机技术建立时间和细胞密度之间的动态关联，利用该关联可以预测和自动检测微生物的生长情况，如通过计算机控制自动定量采集检测对象，然后分析菌落的边缘形态，根据菌落的边缘形态计算机可以显示被检测菌落的具体位置，并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等［25］人对计算机视觉技术用于猪肉的分级进行了研究，结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关，该技术可以有效地计算微生物的数量。Bayraktar.B等［26］人采用计算机视觉技术、光散射技术（BARDOT）和模式识别技术相结合的方法来快速检测李斯特菌，在获取该菌菌落中的形态特征有，对图像进行分析处理达到对该菌的分类识别。殷涌光等［27］人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术，用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果，并结合新的图像处理算法，对细菌形态学的8个特征参数进行检测，检测结果与传统检测结果显著相关（相关系数R=0.9987），和传统检测方法相比该方法具有操作简单、快速、结果、适合现场快速检测等特点。鲁静［28］和刘侃［29］利用显微镜和图像采集仪器，获取乳制品的扫描图像，然后微生物的图像特征和微生物数量进行识别，并以此作为衡量乳制品质量是否达标的依据，并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等［30］通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征，对照数学模型，采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估，并通过实例详细阐述了该技术的实现方法，证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草［31］。晁德起等［32］通过x射线照射获取毛叶枣的透视图像后，运用计算机视觉技术对图像进行分析评估，毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47％，因此得出结论：计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等［33-34］通过对薯片制作过程中图像像素的变化来研究薯片的褐变率，通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系，结果显示两项参数相关性为0.989，从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量，该方法可以在加热食品行业中得到广泛应用。韩仲志等［35］人拍摄和扫描11类花生籽粒，每类100颗不同等级的花生籽粒的正反面图像，利用计算机视觉技术对花生内部和外部采集图像，并通过图像对其外在品质和内在品质进行分析，并建立相应的数学模型，该技术在对待检样品进行分级检测时的正确率高达92%。另外，郭培源等［36］人以国家标准为依据，通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3展望

新技术的研究与应用必然伴随着坎坷，从70年代初计算机视觉技术在食品工业中进行应用开始，就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果，但以同一食品的多个指标共同作为分级标准进行检测分级，则分级结果误差较大［37］。例如，Davenel等［38］通过计算机视觉对苹果的大小、重量、外观损伤进行分析，但研究结果显示，系统会把花萼和果梗标记为缺陷，还由于苹果表面碰压伤等缺陷情况复杂，造成分级误差很大，分级正确率只有69%。Nozer［39-40］等以计算机视觉为主要技术手段，获取水果的图像，进而通过分析图像来确定水果的形状、大小、颜色和重量，并进行分级，其正确率仅为85.1%。

3.2兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著，但是，同一套系统和设备很难用于其它种类的果蔬，甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等［41］利用计算机视觉检查杏和桃的损伤程度，发现其检测桃子的率显著高于杏的。Majumdar.S等［42］利用计算机视觉技术区分不同种类的麦粒，小麦、燕麦、大麦的识别正确率有明显差异。

3.3检测性能受环境制约

现阶段的计算机视觉技术和配套的数学模型适用于简单的环境，在复杂环境下工作时会产生较大的误差。Plebe等［43］利用计算机视觉技术对果树上的水果进行识别定位，但研究发现由于光照条件以及周边环境的影响，水果的识别和定位精度不高，不能满足实际生产的需要。综上所述，可看出国内外学者对计算机视觉技术在食品工业中的应用进行了大量的研究，有些研究从单一方面入手，有些研究综合了多个学科，在研究和应用的过程中，取得了较大的经济效益，也遇到了很多问题，在新的形势下，计算机视觉技术和数码拍摄、图像处理、人工神经网络，数学模型建设、微生物快速计量等高新技术相融合的综合技术逐渐成为了各个领域学者的研究热点，以计算机视觉为基础的综合技术也将在食品工业中发挥更加重要的作用。

作者：姚瑞玲单位：四川工商职业技术学院

计算机视觉论文:双目计算机视觉的自适应识别算法及其监控应用

摘要:双目计算机视觉是利用仿生学原理,通过标定后的双摄像头来得到同步曝光图像,然后计算获取的2维图像像素点的第3维深度信息。为了对不同环境场景进行监控提出了一种新的基于双目计算机视觉的自适应识别算法。该算法首先利用像素点的深度信息对场景进行识别判断,然后采用统计的方法为场景建模,并通过时间滤波克服光照渐变,以及通过深度算法特性克服光照突变。与单摄像头监控系统相比,利用该算法实现的视频监控原型系统,可应用于更多场合,并利用深度信息设置报警级别,来降低误检率。

关键词:双目计算机视觉深度信息自适应光照变化视频监控

1、引言

面对日益复杂的社会和政治环境,国家安全、社会安全、个人人生安全和财产安全等都面临着不同程度的威胁,都需要各种安全保护措施,在众多场所建立切实有效的安保措施,成为一个迫切的课题。本文提出了一种基于双目计算机视觉的自适应识别算法,将该算法应用于现有的监控系统,并赋予监控终端智能性,不仅使其脱离人而具有独立智能、自主判断的能力,而且使得视频监控系统在安防方面的作用大大提高。

在现有的背景建模方法中,大多对于背景象素点的亮度值,例如最小亮度值、较大亮度值和较大亮度差值[ 1 ] ,或是对颜色信息进行建模[ 2 ] 。对于背景的更新,一般使用自适应滤波器对像素的统计特性进行递归更新,为了考虑到噪声的影响,文献[ 3 ]提出了Kalman滤波器的方法,该文认为系统的信息可通过估计获得。考虑到环境的动态缓慢改变,文献[ 4 ]利用统计模型给背景建模,即由一个时域滤波器保留着一个序列均值和一个标准偏差,并通过滤波过程统计值随时间改变来反映环境的动态特性。另外有一些方法解决了光照渐变等影响[ 5~7 ] ,但计算较复杂。

2、双目计算机视觉深度算法

基于实际应用考虑,摄像头的数量关系着成本和计算量,所以选择支持双摄像头(双目视觉)的算法是最合适的。在支持双目视觉的算法中,Princeton NEC research institute 基于较大流算法(maximum2flow)的计算机视觉算法( Stereo2MF)在深度效果平滑性上做得较好[ 8, 9 ] ,适用于监控区域深度计算的应用背景。但原有算法所需的计算量和计算过程中的暂存数据量是较大的,虽然支持计算量的削减,但只是机械地在一块区域中选择中心点来进行计算,这样计算的结果会因选择的机械性,而出现大量的“伪点”,这些伪点错误地表现了该区域的平均深度信息。本文采用统计平均值选取计算点,通过距离因子的Gauss分布将块内其他点的值融合计算,从而使得计算出的值较的代表了这一块内的大致深度分布。

m, n分别是图像的长和宽所包含的像素点个数,M、N 表示像素点的横纵坐标, .d 是块内深度统计平均值, dM, N为计算点的深度值, q为距离因子, dB是计算所得的块深度代表值。图1为改进后双目视觉深度算法与原算法识别效果比较。由图1可以明显看出,修改后的算法效果在细节表现、平滑性、伪点减少上均有明显改善,而且深度计算度能够满足视频

图1 改进后双目视觉深度算法与原算法识别效果比较Fig. 1Effect comparison after algorithm modification

度计算度能够满足视频监控应用的需要。

3、自适应识别算法

对于一个固定的场景,场景各像素点的深度值是符合一个随机概率分布。以某一均值为基线,在其附近做不超过某一偏差的随机振荡,这种情况下的场景称之为背景。而场景环境往往是动态变化的,如环境自然光的缓变,灯光的突然熄灭或点亮,以及运动对象的出现、运动和消失等。如果能识别出场景中的动态变化,就能自适应的更新背景值,将光照的改变融合到背景值中。本文采取了用统计模型的方式给每个像素点建模,而以像素点变化的分布情况来确定光照突变引起的深度突变,并结合深度计算本身特性,解决光照缓变突变引起的误判问题,以及判别场景中对象的主次性。

3. 1 背景象素点的深度值建模

由于双目计算机视觉算法得到的深度值,已经是块融合的,可以根据精度要求,来加大块面积, 减少数据量。本文获得的数据量只有原像素点的( k, l分别是块的长和宽所包含的像素点个数) 。以统计的方法给每个像素点的深度值建模, 设为第u帧图像的某个像素点的深度值, 其中u代表第u帧图像, i, j分别代表像素点的横坐标和纵坐标。由一个时间滤波器来保持该像素点深度值的序列均值和时间偏差

其中,α是一个可调增益参数, 其与采样频率有关。通过滤波过程,来得到每个像素点的深度值基于时间的统计特性,由于这些统计特性反映了环境的动态特性,据此可以了解到是环境的光照发生了突变,还是有运动对象的运动。

3. 2 背景更新与场景识别

通过上述滤波过程,就可以将光照缓变融入到背景中去,实现背景的自适应更新。而对于光照突变,此时几乎所有的象素点的亮度值会同时增大或减小,但根据较大流算法的特性,同方向的变化对流量差不会引起太大变化, 而对深度计算结果只会引起较小的同方向变化。这种全局的等量变化, 可以认为是光照突变引起的。

其中, a、b和c是3个可调节系数,他们的取值可依据场景的情况及检测光照突变的速度与误差来进行选取。s, t分别是深度图像的长和宽所包含的像素点个数。Q是符合式( 9)的像素点个数。一旦检测到环境光照发生了突变, 就把背景点像素的深度序列均值,全部以当前帧像素点的深度值的测量

值代替,而j以0取代,从而实现背景的及时更新。

如果式(10)式(12)中任意一个不成立的话,则认为像素块深度值的变化并非由光照突变引起, 而是场景中有运动对象出现。

4、算法分析与实验

4. 1 算法复杂度

对于光照突变检测,若有突变的话,则会立即检测出来,当有运动对象出现时, 并且式( 10)式( 12)都接近满足时,处理会较慢,因为需要处理突变检测和运动对象两个过程。当b取25% s ×t时的处理速度与变化点比例关系如图2所示。

相对于一般的光强、灰度的识别检测算法,本算法的优势在于不仅可以利用深度特性更容易地检测到光照的渐变与突变, 而且可以判断出现的多个运动对象的主次性。

4. 2 算法误检率

由于光照直接对于像素点的光强、灰度等产生影响,所以深度算法的噪声容限更大,这样可降低了误检率,多组实验后得到的误检率对比图如图3所示。但是由于深度算法本身对于反光或者阴暗面会产生伪点,所以,某些时候由于光照突变中光源的位置变化而会误检为运动对象,为此算法还需进一步改进能判别伪点的出现, 除去它在光照突变检测中的影响。另外,公式中可调系数a, b, c的选取也会对不同场景产生影响。

笔者在实验室环境下做了不同光照角度、不同环境光强度、不同运动物体的多组实验,发现在反光面或是阴暗面较多的情况下,光照突变检测不是很灵敏,而且会出错,但是在增加系数a, c的值后, 误检率有所降低(如图3所示) 。

5、基于算法的监控系统

我们利用该算法实现了视频监控原型系统。计算机视觉算法对于摄像头的同步曝光要求很高,所以本系统终端用一块单独的MCU (micro control unit)控制同步曝光。核心算法用DSP处理。系统结构如图4所示。实际系统原型图如图5所示。

6、结论

利用深度信息做智能场景识别,是一种新的尝试,有其优势。将这种方法应用到智能视频监控中,能起到很好的效果,克服了其他方法较难处理的光照渐变和突变等问题。对比单摄像头监控系统,该系统可应用于更多场合。后续研发准备在系统上加上更多功能,以适用于更多的环境,并与其他保安类监控系统互联,以组成一整套功能强大、达到国内外水平的安防系统。

计算机视觉论文:基于计算机视觉的虚实场景合成方法研究与应用

论文关键词：虚拟现实混合现实计算机视觉

论文摘要：开发了一种虚拟场景与实时视频之间的合成技术，成功地将该技术应用于虚拟规划系统中，详细介绍了系统所采用的基于计算机视觉的标识识别和实时、自动摄像机位置、姿态跟踪算法，并给出了系统运行结果。

0 引言

虚拟现实技术的最终目的是使用户沉浸在一个由计算机生成的虚拟环境中，该技术已经被成功地应用到军事、教育、娱乐等众多领域。随着应用的增多，虚拟现实技术的缺陷也逐渐暴露出来，主要表现在如下两个方面：(1)虚拟现实中的场景由计算机生成，随着绘制场景真实程度的提高，对系统硬件配置的要求也相应提高，从而形成了绘制效果和实时性两个同等重要又难以同时解决的问题。(2)交互方式受限．鼠标、键盘等传统输入设备并没有提供给用户一种直观自然的交互方式，而数据手套等较为昂贵的外围设备不仅使用起来不方便，而且对工作范围也有一定的限制。

混合现实技术的出现很大程度上解决了以上两个问题，它将计算机生成的虚拟场景、提示信息实时叠加到用户所能观察到的真实世界当中，并以此来增强用户视觉感受。在混合现实环境中用户所能观察到的主体是来源于真实世界的图像信息，虚拟场景只起到辅助、提示作用，因此不需要真实感图形绘制所需的高端的硬件配置。另一方面，由于图像信息来源于真实世界，这就使得用户本身能够很自然地融合到整个系统中，并且能够以一种自然、直观的方式与系统交互，而不必添加额外的硬件设备。正是由于以上特性，混合现实技术已经被应用到众多领域当中，而且能够比虚拟现实更好地完成某些任务，如交互式规划、动态虚拟展示等。

一个实用的混合现实系统所必须具备的特性之一是几何一致性，即系统必须实时地判断摄像机相对于真实世界的位置和姿态．以便将虚拟场景正确地叠加到真实世界的具体位置上，使得用户从感官上认为虚拟场景确实是真实世界的一部分。传统的方法是利用硬件设备(电磁式、机械式跟踪系统)来获取摄像头位置信息，但这些方法不仅工作范围受限，而且求得的结果也不够。本文采用当前流行的基于计算机视觉的方法来获取位置信息，事实证明该方法是有效、可行的。

系统结构及工作流程

笔者构建了一个如图 1所示的混合现实原型系统，主要由如下几个部分组成：(1)平面标识块：一个带有黑色边框的正方形．尺寸、内部图案由用户定义，主要功能是使系统能够根据实际图像中标识的变形来计算虚实配准所需的位置、姿态信息，同时还可以用不同的内部图案代表不同的虚拟场景，以增强系统的实用性。(2)图像采集设备(摄像机)：主要完成实时视频采集功能。(3)图形渲染系统：生成与视频合成所需的虚拟场景。(4)虚实合成：利用摄像机位置、姿态信息将视频与虚拟场景相融合。(5)显示设备：包括头盔式显示器以及桌面台式显示器，用以将虚实合成的影像展现给使用者。

系统运行过程中，首先将采集到的一帧彩色图像转换成一幅二值(黑白)图像，然后对该二值图像进行连通域分析，找出其中所有的四边形区域作为候选匹配区域，将每一候选区域与模板库中的模板进行匹配，如果产生匹配，则认为找到了一个标识，在生成与该标识对应的虚拟场景的同时利用该标识区域的变形来计算摄像机相对于已知标识的位置和姿态，根据得到的变换矩阵实现虚实之间的无缝融合。

2 标识识别与摄像机位置、姿态跟踪算法

由上一节可知，构建该系统有两个关键问题需要解决，即如何识别标识内部的不同图案以生成与之对应的虚拟场景以及如何利用标识的变形计算虚实配准所需的坐标变换关系。以下分别介绍以上两个问题的解决方法。

2．1标识识别

本系统所采用的标识识别方法可以分为以下几步。

2．1．1图像二值化

首先对采集到的彩色图像进行二值化，处理成黑白(0，1)图像，如图 2(b)。具体方法为：设定一个阈值，对图像进行遍历，根据该阈值，对图像重新赋值。为了克服光照对识别结果造成的影响，同时采用了自适应阈值法来提高系统稳定性，设定当前阈值为上一帧图像中标识投影区域像素灰度的平均值，实验证明该方法对改善系统性能有较为明显的效果。

2．1．2连通域分析

连通域分析的目的是从复杂背景中提取标识的投影区域。分析过程为：查找所有像素值为 1的连通区域，首先根据大小约束对区域进行预筛选，然后利用最小二乘直线拟合法筛选出所有四边形区域，结果见图 2(c)。

2．1．3 区域规则化与模板匹配

区域规则化是将图像中经过投影变换的标识区域变换到标准模板空间，本文利用仿射变换将标识经过投影变形后的区域直接映射到一个 64×64大小的正方形模板，效果见图2(d)。接下来的工作是将规则化图像与模板库中的模板进行匹配，以返回代表不同虚拟场景的 id值。本文采用相关系数法来完成匹配工作，方法如下：

首先利用以下四式计算规则化图像 i和标准模板图像 p各自的均值和方差。

然后计算两幅图像的相关系数 p，本文选择所有模板中与规则化图像具有较大相关系数 p且 p>0．5的模板作为当前匹配结果，并返回与之对应的 id值

2．2摄像机位置、姿态估计

首先给出系统的坐标变换关系如图 3所示。规定平面标识在世界坐标系中的位置为已知，摄像机位置、姿态计算问题转化为摄像机坐标系与世界坐标系之间三维变换矩阵的求解。

世界坐标系与摄像机坐标系间的变换关系可以用式(5)表示。其中 w为世界坐标系下某点坐标，c为该点在摄像机坐标系中的位置，t ：[r r r：t] 为待求三维变换矩阵，包含三个旋转分量和一个平移分量。

c=t w (5)

由于规定平面标识与世界坐标系下的z：0平面重合，则由式 (5)可得，平面标识上的某点在世界坐标系下的坐标 wi=(x ，y wi，0，1) 与其在摄像机坐标系下坐标 c；：(x y z i，1) 之间的关系可以表示为式(6)。

有 8个待定系数，由标识的四个角点可得如下方程组，则可以求取以上 8个未知数。

通过上述计算可以确定变换矩阵中的 r ，r ，t，三个分量，由变换矩阵旋转分量的正交性可以求得r ：r ×r ，需要对所求得的结果作归一化操作以消除比例因子 t 对计算结果的影响，方法是将(1 r l+l r 1)／2去除以上各分量。

事实上由于不可能避免成像畸变以及图像处理过程中的误差，上述方法求得的变换矩阵 t 是不够的。解决方法是利用上述方法求取及时帧图像对应的 t ，在后续计算过程中采用非线性最小二乘法求取后续帧的对应的变换矩阵。误差逼近计算公式见式 (1 1)。

式中(文 i)(i=0，1，2，3)为根据上一帧t 求得的标识四个角点在像平面坐标系下的位置，(x i，y ；)(i=0，1，2，3)为实时检测到的标识角点在图像中的位置。本文利用勒温伯格一马阔特方法求解式(11)。

3 应用实例——基于混合现实的小区规划系统

传统的住宅小区规划方法之一是制作规划方案模型，但是制作实体模型不仅费时费力，而且修改起来也极为不便。近年来，基于虚拟现实技术的小区规划方法已经逐渐为设计者所接受，它一定程度上解决了实体模型规划方法的缺点，但是由于缺乏高效、自然的人机交互方式，使得规划效果大打折扣。混合现实技术的出现为小区规划提供了新的契机，它既继承了虚拟现实技术的三维表现能力，又具有虚实结合的特点，能够在真实的规划场景中整合设计要素，给设计者和方案评估者以直观的感受。

笔者利用本文方法开发了一套基于混合现实技术的虚拟小区规划系统。系统中不同的标识对应不同的虚拟建筑模型，用户可以在视线范围内随意移动模型．从而实现不同的规划方案。运行效果如图4该系统满足了小区规划对虚实交互、人机交互的要求，充分体现出混合现实技术在小区规划应用中的优势。

4 结束语

本文设计了一种基于计算机视觉的虚实场景合成方法，具有实时性好、可用性高等特点，当前系统中存在的主要问题是虚拟场景与真实场景之间还没有遮挡和碰撞关系，从而影响了系统的真实感，下一步的工作是对虚实之问的遮挡和碰撞检测问题展开研究。

计算机视觉论文:计算机视觉技术在科学教育的作用

摘要近年来，人们对技术科学教育问题产生了很大的困扰，因为正确的科学技术的传承影响着祖国下一代科技的发展。正在此时，一种类似研究如何使系统从图像或多维数据中“感知”的科学，即计算机视觉技术迅速崛起，并被广泛地应用于各个领域。其中最重要的是一个基于BSD许可（开源）发行的跨平台计算机视觉库OpenCV，本文主要介绍的就是通过利用OpenCV中的相关算法，能够带来的巨大价值以及此项技术在现代科学教育方面所发挥的重要作用。

关键词OpenCV；科学教育；推广价值

1、OpenCV库简介

OpenCV是由Intel微处理器研究实验室的视觉交互组开发的一个跨平台计算机视觉库，它的代码都是开源的而且都经过非常好的优化，并且具有很好的移植性，可以根据需求导入到合适的环境中使用。它可以实现有关图像识别与处理和计算机视觉技术方面的很多通用算法。它的优势是可以运行在当代社会使用热门的各大操作系统上，适用性强，还可以脱离外部库而独立运行。OpenCV的C和C++都是经过优化的开源代码，采用灵活的接口，提升计算机的运行速度。其中包含的函数就有500多个，包括的种类有C和C++等。OpenCV因为免费面向市场，已经被社会各界广泛使用。现已应用于人机互动、图像识别、图像分割、目标追踪、3D重建、机器视觉、结构分析等数个领域。OpenCV主要包括以下几个部分：①cxcore:核心功能模块，包含一些基本函数，运用于各种数据类型的计算。②cv:图像处理和计算机视觉功能。③ml:机器学习模块，主要内容是分类器。④cvaux:包括大部分实验性的函数，例如ViewMorph-ing、三维跟踪、PCA、HMM等。⑤Highgui:图像界面接口，支持摄像头的读取和转换。

2、OpenCV处理图像的功能

OpenCV中有很多的函数，可以实现很多不同的功能，其中具有学习价值的部分就是图像处理。处理图像主要分为三部分：加载图像，显示图像，处理图像。

2.1加载图像

不同类型的图像有着不同的内部结构。我们需要根据图像的结构采用合适的方法将图像文件中的数据读入内存。OpenCV中的cvLoadImage()函数，可以加载图像数据。而且图像的格式不影响加载的效果，加载后它以一个指向IplImage结构体的指针形式返回，大大方便了后续处理的过程。2.2显示图像加载图像后需要通过函数使其显示。cvNamedWindow()函数由HighGUI库提供，它可以在屏幕上创建一个窗口，将图像显示出来。cvShowImage()函数的作用是在这个创建的窗口中显示出加载过后的图像。观察图像时经常用到的重要函数还有可以使程序暂停的函数cvWaitKey()，以及用于释放内存的函数cvReleaseImage()和cvDestoryWindow()，掌握并运用这些函数，就可以轻松的实现观察图像的功能。

2.3处理图像

OpenCV中包含的多种函数，可以达到图像处理技术方面的很多效果，包括图像灰度化函数cvtColor（），边缘检测函数Sobel（）、Laplacian（）、Canny（），其中Canny算子只能处理8位灰度图，其余两种8位32位都可以，合并梯度函数addWeighted（），放大缩小函数resize（），阈值化操作函数imshow（）等等。适当选用合适的函数并加以运用即可达到目标所需。

3、OpenCV的推广价值体现

OpenCV可以应用在社会的各个领域，价值就体现在每个科学的产物当中。举个近在身边的例子，随着社会的发展，生活质量的提高，人们的居住环境也在逐渐改善，楼层越盖越高，无数摩天大楼，商业大厦群起而立，电梯已经成为了我们日常生活中必不可少的工具。尽管现在电梯的功能、质量不断地提升，但是仍然存在些许不足，当我们在学校的教学楼内等电梯时发现了一个问题，那就是在电梯使用的高峰期时，比如在上下课时段，有很多人都在同一楼层等电梯。但是此时只有一台离该楼层最近的电梯会过来，而其余的电梯都会自动向其它叫梯楼层运行或是闲置。可是此时这一台电梯只能容纳有限数量的人，时常不能使所有人坐上电梯，这样就无法满足全部人的需求，由此就导致了有部分人无法及时地坐上电梯，需要继续等候，而闲置的电梯又不能及时地被利用。这样不仅不能合理地利用资源，反而浪费了许多不必要的时间。因此，我们想到可以通过利用图像识别与处理的方法来弥补这个不足，首先通过硬件设备连接拍照捕获候梯人像，后台运行判断出候梯人数，然后运用语言编程来确定调动电梯的个数，从而来达到实现自动控制每个电梯的运行的目的，使所有人都能在及时时间乘坐电梯。而上文中提到的OpenCV就可以完成这项艰巨的任务。我们将OpenCV导入编程环境，其次修改电梯工作系统的运行程序，将软件与硬件设备相连通，这样通过调度程序，就可以轻松高效地解决这个问题。使用这种方法，不仅可以节约人们的候梯时间，方便学生、老师上课，而且可以合理有效地调度电梯，使电梯的价值得到较大化。见微知著，OpenCV可以应用在每个领域，对各界的发展起到推动作用，造福社会的科技发展，方便人们的生活。

4、科学教育存在的问题

在历年的教学模式中，老师们往往会强调理论知识的重要性，但却忽略了对学生使用动手能力的培养，学生不能独立完成实践性的技术操作，也就是说教学模式缺乏实践性。只有将理论与实践相结合，才能实现知识价值的较大化，因此，应当在教学中配合着实践课程，举一反三，让学生们更加深刻地学习和了解所学到的知识。而如今虽然一部分学校也开设了实践课程，但也只是浅尝辄止，并没有过多地讲授计算机技术实践方面的知识，学生们也没有真正拥有动手实践能力，这使学生们的技术知识十分受限。虽然现在多数学生对计算机略懂一二，但是实际上仅仅会使用类似Word等简单的软件，而技术要求较高的一些软件及工具却全然不知，甚至对自己所学过的课程软件的使用也是马马虎虎，这对于未来工作所需的能力来讲，实在是九牛一毛。目前中学生使用电脑的重心更多放在了社交软件和游戏上，很少有人利用计算机学习更多的技能，这对青少年的发展实在是利大于弊的，而且这样也失去了计算机的正向价值。因此，我们应该改变现有的教学模式，一边教授理论知识，一边配合指导学生动手操作，将理论与实践相结合，也能让学生更好地消化和吸收所学到的知识，并且引导学生正确使用计算机，发挥计算机的价值，让学生们都能够在计算机中获得更多的知识。

5OpenCV开源算法库在各个领域的实例化体现

OpenCV在医学领域、军事领域、安全防护领域等都有很大的重要意义。在医学领域中，由于有了这个开源算法库，我们可以尽可能地调用它，从而来进行图像处理、对象检测，让医生更好更快速观测人体结构，及时发现病症。在军事领域中，大多数无人操作的机器运作，比如无人机飞行、水下无人驾驶仪、无人驾驶汽车等等，都需要用到OpenCV来对图像进行处理，并进行分析，并且可以检测出人眼看不到的事物，这是OpenCV能够带来人类的巨大的进步。在安全防护领域中，我们现实生活中常见的汽车的安全驾驶，房屋入侵的检测、自动监视报警系统等等,正是由于这些技术，让我们的环境更加安全，这都是我们生活中息息相关不可缺少的。现如今，国家的科学技术飞速发展，日益强盛，OpenCV的成绩有目共睹，未来的发展需要科学技术的不断推进，才能为祖国未来的其他事业提供强有力的后盾。

6OpenCV在科学教育中的作用

在文化改革的大背景下，文盲的概念早已从没有文化转变成了不会使用计算机。因为随着科技的进步，计算机的使用已经越来越广泛，计算机已经逐步取代了以往人工可以完成的许多工作，比如在超市生成的结账单、用计算机控制动力系统的运行、人造卫星轨迹的计算等等，这些都依赖于计算机强大的功能。计算机的推广证明着我国科技的发展和人类文明的进步，由此可见，计算机技术知识的掌握对现代人来说是十分重要的。如果想要成为一个真正有技术、有能力的人才，就务必要熟练掌握计算机技术的使用。但是目前当代社会的教育在计算机技术方面的内容还不够丰富。减压政策开放以来，教育课时被压缩，技术知识的传输也相应减少，学生们的能力也因此日益下降。而科学教育，顾名思义，是使科学技术在教育过程中得以传承。想要科学地教育学生，就必须要多多讲授科学技术方面有关的知识。说到科学技术，它的重点自然是计算机技术，而OpenCV作为计算机视觉技术的核心，可以说也是计算机技术甚至科学教育中的一个重要部分。在教育中普及并传承这个技术无疑可以提高学生们的技术水平。但是，相信有大多数的人在此之前从未听说过计算机视觉技术，也并不了解OpenCV库，更加不会学习到与之有关的技术知识。在这样严峻的形势下，我们更应该将类似OpenCV方面技术有关的知识通过教育传递下去。各大高校应积极开展有关计算机的活动，开设与计算机技术有关的课程。这样才能根据社会的需求来培养更多的综合性人才。如果可以将其投入到现代教育当中，定会使现在的教育事业更加辉煌，也能使祖国的未来更加璀璨。

计算机视觉论文:计算机视觉艺术在数字媒体的应用

摘要：现阶段，随着社会经济水平的快速稳定发展，人们不能够满足物质方面的一些满足，开始追求精神层面的追求。当生活与科技紧密的联系时，设计以及艺术应该发展成为一个主流的趋势，属于有效满足精神追求的一个关键环节。在本文中，简单分析了计算机视觉原理，主要分析了数字媒体当中视觉艺术的实际应用，更好的让人们感受到科技以及艺术所具有的魅力。

关键词：视觉原理；计算机视觉艺术；数字媒体；应用

利用计算机所具有的视觉艺术，大众仅仅利用需要实施身体动作来直接性的操作以及控制，根本就不需要学习就能够启动以及进行一定的操作，这样更加方便老年人以及儿童的实际操作。在数字媒体当中，应该对计算机视觉艺术进行充分利用，更加方便人们的实际操作，同时还能够保障其更好的感受艺术方面所具有的魅力，让群众在足够放松的时刻能够对创作者的实际思想以及意图进行充分的了解以及掌握，对艺术价值进行充分发挥，进而来有效提升艺术人文的实际价值。

1对计算机视觉原理进行分析

通常来讲，计算机视觉还称为机械视觉，属于是机械来对人类视觉进行一定的模仿的光学识别系统，利用光学系统、感应器、光源等来实现物体定位、动作的追踪以及视线的判断等相关的功能。一般情况下，工程技术所运用的基本都是计算机视觉，当有着一定的环境以及模式时，计算机视觉在进行持续性的工作时，能够有效保障持续工作有着非常高的正确性以及性，还能够对人工不可以完成的任务进行很好的完成。当计算机视觉在进行实际的工作过程中，最为基本的条件是先对映像进行处理，之后输入模拟讯号，对数字影像进行一定的处理以及分析。实际的工作流程是：影像在摄入之后，应该对其进行一定的强化，除去噪声，之后对图像特征进行一定的压缩以及获取。在对数据库样本进行一定的对比之后，对程序进行有效的分析以及判断，做出有效的指令。

2对数字媒体当中计算机视觉艺术的实际应用进行分析

2.1艺术与计算机进行一定的融合时，应该对动画、声音以及图像等因素进行有效结合，在对艺术语言表现形式进行丰富的同时，应该提高作品的感染力

在有些结合视觉艺术以及数字媒体时，应该保障在对画面进行观看时，应该有效的欣赏画面，还可以有效的感受到声色等。利用高度仿真的听觉、触觉以及视觉，保障大众在进行玩游戏时，可以对虚拟世界进行真实的感受，还能够利用动作以及肢体语言等来和计算机实现有效的交流。保障大众不是对电影单独的进行欣赏，还应该更好的参与到其中，体会艺术的表演。

2.2在数字媒体当中运用计算机视觉艺术能够对艺术的实际表达形式进行有效的丰富

随着交互技术的逐渐成熟以及发展，让该技术得到了有效的拓展以及广泛的运用。运用交互技术，应该让人们不受到被动的欣赏，应该积极的参与到视觉艺术当中，保障大众的积极参与以及做出判断，同能够利用各种选择来呈现出过程以及解决，对观众的兴趣进行充分的调动，进而来有效提高大众的参与积极性。

2.3在电子游戏当中，运用计算机视觉艺术，应该在相对比较大型的电子游戏当中进行计算机视觉技术的运用

在实际的游戏过程当中，大部分的玩家基本上不再是仅仅运用键盘以及鼠标来实施游戏，大部分都是利用身体行动来移动。通常情况下，机器利用摄像机部来对玩家的具体身体动作进行一定的捕捉，玩家能够与机器相连接的手枪进行有效的操作，射中屏幕当中的对象。同时，手机上的相对比较小型的电子游戏，仅仅需要手指来滑动屏幕，就能够实现实物的运动以及跳跃等，进而来躲避障碍。除此之外，仅仅需要稍微的倾斜一些收集，就能够实现人物两侧的奔跑，同时还能够保障声光效果，实现互动，具有非常大的震撼力，会在很大程度上促进大众参与的积极性。

2.4分析数字媒体中计算机视觉技术的应用，保障数字媒体技术有效表现艺术

同时在实用艺术以及纯艺术当中，也会运用到数字媒体，该技术能够让相对比较单纯的个人视觉实现有效的创造，同时还能够把艺术箱社会性视觉产品进行转化，并得到一定的经济效益。同时，大众能够通过剪切以及拷贝等相关的方式来有效获取视觉技术，之后有效的转化艺术资源，有效奠定了创作视觉艺术的基础。现阶段，大众对于个性化以及独特性有着逐渐提高的需求，在对相对比较独特的视觉技术进行追求时，在一定程度上提高了评价视觉作品的标准。在数字媒体当中运用计算机视觉技术，会在很大程度上提高大众对美的享受，保障大众能够充分感受到舒适以及愉快的感觉，同时还能够得到审美方面的评价，在该过程当中，不能够参杂任何的因素，应该让计算机视觉因素仅仅对视觉美感以及视觉形式进行充分的追求，可以有效体现艺术的本质。同时，数字媒体有着美方面的品格，有效结合计算机视觉艺术，保障数字媒体艺术的美以及真。这个实际的运用过程能够有效提升审美方面的机制，更好的领悟视觉艺术当中所存在的美。

3结语

综上所述，在数字媒体当中，计算机视觉技术的运用，应该有效结合图像、动画、声音以及文本等多个因素，在对语言表现的具体形式进行一定的丰富时，应该让作品具有更大的感染力。除此之外，还应该保障视觉技术有何足够的光声效果，利用一定的互动，会具有非常大的震撼能力，积极促进大众的参与程度。还可以在很大程度上满足大众对于美方面的追求，进而对其所具有的艺术价值进行充分发挥，有效提升艺术所具有的人文价值。

计算机视觉论文:计算机视觉下图像检索技术分析

从某种角度来说，在计算机视觉领域，这类目标图像检索的研究是具有一定的挑战与现实意义。它以计算机模拟人的视觉为基础，对其中相关图像的内容予以描述。在此基础上，以描述的特点为参照，在众多图像中寻找那些感兴趣的目标图像。随着计算机网络技术不断发展，它的应用范围逐渐扩大。比如，网络图像检索、医学图像的挖掘、不良图像的过滤。但就当下计算机视觉下目标图像检索技术研究的现状来看，并不乐观，还有很长的路要走。可见，对计算机视觉下的目标图像检索技术予以分析是非常必要的。

1计算机视觉概述

1.1计算机视觉学概述

从某种意义上说，计算机视觉学是一门在20世纪60年代兴起的新学科。它是一门边缘学科，融入了很多学科的特点，具有很强的工程性特征。比如，图像处理、应用数学、光电技术。换个角度来说，计算机视觉同属于工程领域、科学领域。

1.2计算机视觉的应用

计算机视觉的应用能够使计算机具有和人一样的视觉功能。在生活和生产过程中，照片资料、视频资料的处理是计算机视觉应用的主要方面。比如，在航空事业方面，对卫星照片的翻译；在医学领域中，主要用于辅助性方面的诊断；在工业生产方面，由于各种复杂因素的影响，计算机视觉在这方面的应用显得特别简单，有利于相关系统的实际构成。

2目标图像检索存在的问题

从某种角度来说，目标图像检索需要分为特征匹配、特征提取两个方面。它们表达了不同的含义。对于特征提取来说，它是图像进行检索的及时步，其提取结果会对进一步的研究造成直接的影响。而对于特征匹配来说，其匹配的度会直接影响图像检索系统的返回结果。但在目标图像检索完善的过程中，遇到一些问题阻碍了这两个方面的完善。因此，本文作者对其中的一些予以了相关的探讨。

2.1环境因素不断变化

对于目标图像来说，环境因素是影响其率的重要因素。同时，在复杂混乱的环境中，由于受到众多干扰物的影响，加上部分目标图像区域被遮盖，致使目标图像信息不够，使目标物体特征的提取难度进一步加大。

2.2图像噪声的影响

子为了更好地模仿生活中的图像检索，数据库中的图像也会随之发生一系列的变化。比如，尺度、角度、光照。而其中图像噪音的影响会使目标物体的外观发生对应的变化。在此基础上，严重降低了目标图像信息获取的度。

2.3目标图像检索训练数据的自动标注

由于处于网络中的图像资源信息过于繁多，需要采用手工的方式对它们进行标注。但这种方法非常浪费时间，率也比较低。很显然，这就需要目标检索图像能够具有自动标注的能力。实际上，图像检索方法过分依赖人工标注信息。而这些信息很多收到来自各方面因素的影响。比如，认识差异因素、个人经验。以至于对图像产生误解。

3基于计算机视觉下的目标图像检索技术

3.1以多尺度视觉为纽带的目标图像检索方法

该种目标检索技术的应用主要是为了提高目标图像检索的率，能够实现目标图像训练数据的自动化标注。该类技术主要是用于那些没有遮挡，不需要进行监督的目标图像检索方面。具体来说，它需要经过一系列的训练。在训练的过程中，以统计学习为纽带，对相应多尺度的目标检测模型进行适当的训练。在此基础上，以该模型为基点，对图像中那些显著性的区域进行合理地提取。比如，该区域的亮度、颜色。，需要对用于该实验研究中的概率潜在语义分析模型进行合理地利用。总之，利用这种检索方法可以对图像中那些显著目标所处的区域自动进行检测。同时，对其中目标图像的显著性进行合理地排序，能够提高检索引擎所返回图像结果的度。

3.2以彩色LBP局部纹理特点为媒介的目标图像检索方法

这种目标图像检索方法能够有效地解决图像信息采集过程图像噪声以及其它相关因素对所提取纹理特征的影响，提高了图像目标的率。对于这种图像目标检索方法来说，它把图像彩色空间特征和简化的LBP特征有机地相融合。在此基础上，该类方法增加了光照的不变特性，却保留了LBP局部的旋转特点。在提高图像检索速度方面，主要是利用原来的LBP特征来丢失其中的彩色信息。以此，使其中的特征维度能够在一定程度上降低。同时，这种目标图像检索方法的应用可以使对应计算方法的难度得以降低，还能对角度等变化状态下的目标图像进行地识别以及检索。

3.3以视觉一致性为桥梁的目标图像检索方法

从某个角度来说，它的应用主要是为了提高图像搜索引擎的返回效果，使局部噪声图形具有更高的显著性特征。一是：站在客观的角度，对搜索引擎返回结果的目标显著图予以的计算。此外，还要对其中的目标显著系数进行适当地过滤。二是：以所有图像为基点，以显著目标为导向，采取视觉一致性的模式。三是：以视觉一致性为基础，对其中的不同目标图像信息进行客观地分类。这种以视觉一致性为核心的方法能够有效地提高图像检索结果的率。更重要的是，在提高图像搜索引擎检索性能的同时，能够及时为用户选出的图像信息。而这些信息资源和用户寻找的主题信息密切相关。

4结语

总而言之，在新时代下，基于计算机视觉下目标图像检索技术的研究与实践应用有着非常深远的意义。这些检索方法的应用能够有效地解决目标图像检索存在的问题。以此，使我国在该方面的研究不断完善，更好地发挥自身的实践价值。同时，在信息大爆炸的时代，成为人们及时而有效获取目标图像资源信息道路上重要的基石。，作者希望本文在丰富广大读者朋友们内心世界的同时，也能唤起他们对此的思考以及展望。

作者：单位：海口经济学院

计算机视觉论文:计算机视觉教学改革分析

人类从外界获取的信息中70-80%来源于视觉，因此，使计算机具备人类视觉的功能具有巨大的应用价值。近年来，计算机视觉技术市场前景明朗，需求日趋广泛，计算机视觉领域工程师人才供不应求。在此背景下，国内外高校大多都开设了这门课程，深受学生欢迎。传统计算机视觉课程根据Marr理论框架，围绕由2D图像获取3D信息的基础理论展开教学。通常，计算机视觉的目标设定为获取3D场景的有用信息，如深度、结构、运动、表面朝向等。经过多年工程硕士及本科教育发现，以工程应用能力培养为目标的工程师培养中，传统计算机视觉教学中尚存在如下问题：

（1）课程内容方面：工程应用价值较小的内容居多；具备工程应用价值的方法，如基于结构光的3D信息获取，在课程内容中却极少出现。

（2）课程定位方面：现有课程体系中未能体现近期研究成果，而掌握世界近期工程应用成果是工程师的基本要求之一。

（3）教学形式方面：传统计算机视觉课程侧重基本原理，尽管范例教学被引入到课堂教学中，在一定程度上帮助学生理解，但工程师培养目标是培养学生解决实际工程问题的能力。针对工程师培养目标，以及目前计算机视觉课程中存在的问题，本文提出工程应用导向型的课程内容、面向近期成果的课程定位、理论实例化与工程实践化的教学形式，以培养具有扎实理论基础及工程实践能力的工程师。

1工程应用导向型的课程内容传统计算机视觉课程围绕Marr理论框架展开教学，其中部分原理仅在理想状态或若干假设下成立，不能直接运用到工程实践中。近年来已具备工程应用基础的原理及方法，在传统课程内容中较少出现，如已在工业测量、视频监控、游戏娱乐等领域中应用的主动式三维数据获取方法等。我们对工程应用价值高的课程内容，增加课时，充分讲解其原理及算法，并进行工程实例分析；对工程应用价值较低内容，压缩课时，以介绍方法原理为主。例如，在教授3D信息获取部分时，课时主要投入到工程应用价值较大的内容，如立体视觉、运动恢复结构、基于结构光的3D信息获取等；而对于基于阴影的景物恢复等缺乏应用基础的内容主要介绍其基本原理，并引导学生进行其工程应用的可行性分析，培养学生缜密的思维习惯，训练学生辩证的分析能力。

2面向近期成果的课程定位计算机视觉近十年来发展迅速，新方法和新理论层出不穷，在现有课程体系中未能得以体现。跟进世界近期成果是工程师的基本要求之一，因此计算机视觉课程定位应当面向国际近期成果。为实现这一目标，我们主要从以下两方面入手。

（1）选用涵盖近期成果的教材。我们在教学中加入国际近期科研成果及应用范例，在教材选取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作为参考教材。该书是RichardSzeliski教授在多年MIT执教经验及微软多年计算机视觉领域工作经验基础上所著，涵盖计算机视觉领域的主要科研成果及应用范例，参考文献近期引用至2010年。这是目前近期的计算机视觉著作之一，条理清晰，深入浅出，特点在于对计算机视觉的基本原理介绍非常详尽，算法应用紧跟国际前沿。

（2）强化学生调研及自学能力。“授之以鱼”，不如“授之以渔”。在教授学生的同时，更重要的是培养学生调研、跟踪、学习并分析国际近期科研及工程应用成果的能力。为强化学生的知识结构，培养学生跟踪国际前沿的能力，我们在教学中加入10%的课外学时，指导每位学生完成最近三年本领域的国际近期文献调研及工程应用新技术调研，并撰写相关调研论文。同时，设置2学时课内学时，让每位学生介绍调研成果，并进行课堂讨论。在调研基础上，选择相关算法进行了实验证明，进一步强化学习成果。实践证明，由于学生能够根据自己的兴趣，选择本领域感兴趣的课题进行深入调研，极大地调动了学生的积极性，强化了学生调研、跟踪、学习并分析国际近期科研及工程应用成果的能力。

3工程实践化的教学形式我们在教学中提出工程实践化的教学形式，即以人类视觉功能为背景，由相应工程实例引出相关理论，并最终将理论运用到工程实例中的算法和方法传授给学生。

（1）工程实例化的理论讲解。在工程实例的系统功能基础上，提出教学内容的命题；在关键技术及难点基础上，讲解基本原理及方法。在教学过程中，不断穿插众所周知的实例。例如，讲解摄像机模型时，由“近大远小”的原理，解释青少年流行拍摄的“大头照”，从上而下俯拍容易拍出视觉更美的“锥子脸”；由过近拍照产生面部变形，解释镜头原理及畸变现象。科学研究发现，大学生课堂注意力平均为10-15分钟。课堂教学质量的优劣关键取决于教学效率，因此，抓住学生注意力至关重要。经过我们的教学实践发现，大量学生熟悉并感兴趣的实例引入后，学生的注意力会即时迅速提高，兴趣大大提升。

（2）理论的工程实践化。工程师培养的关键是利用所学算法与方法解决实际工程问题的能力。计算机视觉课程中介绍的方法大部分基于理想状况的假设。在工程实践中，生搬硬套将出现错误。因此，培养学生将理论进行工程实践，是工程师培养中必不可少的一个环节。该过程不仅可以锻炼学生的动手能力，更重要的是引导学生认识到理论知识与工程应用的距离，提炼并解决理论结合实际时需解决的关键问题。同时，工程应用中遇到的问题，往往不是一门课程内的知识可以解决的，需协同多门课程知识。这样，可培养学生通汇贯通课程及相关领域知识，解决问题的能力。我们依托计算机视觉与模式识别实验室多年来在该领域的研究基础与实验条件，对学生的工程实践能力进行配套培养。主要包括两个策略：利用10%的课内学时，选取相关经典工程实践实验，指导学生独立完成；利用10%的课外学时，指导学生调研近期科研成果，指导学生分组完成仿真实验。实践证明，该过程加深了学生对理论的理解，大大提高了学生的成就感、学习兴趣及工程实践能力。4结论本文提出的计算机视觉课程教学方法是经过多年工程型硕士及本科教学实践探索的经验所得，并在三个班次进行了教学实践。工程应用导向型的课程内容紧贴实际，所学即所用，极大地增强了学生的学习兴趣及动手乐趣；面向近期成果的课程定位紧跟计算机视觉的技术发展，培养学生调研、跟踪、学习并分析国际近期科研及工程应用成果，开阔学生眼界和思路；理论实例化与工程实践化的教学形式，注重理论联系实际的能力培养。教学实践表明，上述方法对培养具有扎实理论基础、理论结合实践的工程实践能力的工程师，起到了有别于传统计算机视觉教学的良好效果。

计算机视觉论文:计算机视觉在交通领域的运用

近年来，随着科技水平的提高，计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说，视觉能获得更多的信息。因此，在我国交通领域中，也对计算机视觉技术进行研究完善，将计算机视觉技术应用在交通领域各个方面中，并取得了显著的成效。

1计算机视觉的概述及基本体系结构

1.1计算机视觉概述

通过使用计算机和相关设备，对生物视觉进行模拟的方式，就是计算机视觉。对采集到的图片或视频进行相应的技术处理，从而获得相应的三维信息场景，是计算机视觉的主要任务。计算机视觉是一门学问，它就如何通过计算机和照相机的运用，使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说，就是让计算机通过人们给其安装上的“大脑”和“眼睛”，对周围环境进行感知。计算机视觉是一门综合性学科，在各个领域都有所作为，已经吸引了各个领域的研究者对其研究。同时，计算机视觉也是科学领域中一个具有重要挑战性的研究。

1.2计算机视觉领域基本体系结构

提出及时个较为完善的视觉系统框架的是Marr，他从信息处理系统角度出发，结合图像处理、心理物理学等多领域的研究成果，提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上，研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究，得出了计算机视觉系统的基本体系结构，如图1。

2计算机视觉在交通领域的应用

2.1牌照识别

车辆的身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中，车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中，虽然车牌识别技术相对成熟，但是由于受到拍摄角度、光照、天气等因素的影响，车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。

2.2车辆检测

目前，城市交通路口处红绿灯的间隔时间是固定不变的，但是受交通路口的位置不同、时间不同的影响，每个交通路口的交通流量也是持续变化的。此外，对于某些交通区域来说，公共资源的配备，比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术，对交通路口的不同时间、不同位置的交通情况进行分析计算，并对交通流量进行预测，有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。

2.3统计公交乘客人数

城市公共交通的核心内容是城市公交调度问题，一个城市如何合理的解决公交调度问题，是缓解城市运力和运量矛盾，缓解城市交通紧张的有效措施。城市公交调度问题，为公交公司与乘客的平衡利益，为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间，公交客流会存在不均衡性，高峰时段的公交乘客过多，平峰时段的公交乘客过少，造成了公交调度不均衡问题，使有限资源浪费严重。在计算机视觉智能公交系统中，自动乘客计数技术是其关键技术。自动乘客计数技术，是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据，从时间和地点两方面对客流分析，为城市公交调度进行合理的安排。

2.4对车道偏离程度和驾驶员工作状态判断

交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示，因车道偏离导致的交通事故在40%以上。其中，驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象，为减少交通事故的发生，计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率，利用计算机视觉对驾驶员面部进行图像处理和分析，再根据疲劳驾驶关注度与眨眼频率的关系，对驾驶员的工作状态进行判断。此外，根据道路识别技术，对车辆行驶状态进行检测，也是判断驾驶员工作状态的方法之一。这两种方法，是目前基于计算机视觉的基础上，检测驾驶员疲劳状态的有效方法。

2.5路面破损检测

最常见的路面损坏方式就是裂缝。利用计算机视觉，及时发现路面破损情况，并在其裂缝程度严重之前进行修补，有利于节省维护成本，也避免出现路面坍塌，车辆凹陷的情况发生。利用计算机视觉进行路面检测，相较于之前人工视觉检测相比，有效提高了视觉检测的效率，增强了自动化程度，提高了安全性，为市民的出行安全带来了更高保障。

3结论

本文从计算机视觉的概述，及计算机视觉基本体系结构，和计算机视觉在交通领域中的应用三面进行分析，可见计算机视觉在交通领域中的广泛应用，在交通领域中应用的有效性、显著性，以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟，交通领域的检测管理一定会加严格，更加安全。

作者:夏栋单位:同济大学软件学院

计算机视觉论文:计算机视觉交互技术在企业日常工作中的应用

摘要：在现代企业的新产品开发，市场调研数据分析报告等集体智力活动当中需要很多的可视化的展示与沟通工作。目前很多情况下企业往往是采用传统的PPT方式进行，这些PPT中大部分动画都是单向无实时交互的。随着现代计算机视觉识别和交互技术的发展，可以设计更好的交互展示系统，帮助企业改善复杂问题的沟通。

关键词：计算机技术；视觉识别技术；交互技术；会议展示；智能办公环境

在日常的企业办公管理活动中，有很多时候需要可视化地展示企业市场计划、新产品设计、数据分析报告等。尽管这些活动所需要的材料在事前可以经由办公自动化软件处理，但处理结果却很大程度上只能由静态的PPT展示和说明。但很多时候，这些展示和说明往往是多个部门不同专业背景的人员参与，于是展示材料制作的水平和质量就很大程度上影响到了参与者对所展示内容的理解和吸收程度。很多复杂的问题或者设计的展示，如果能采用互动交互的方式展示，在很大程度上能够帮助问题讨论的参与者对所讨论问题更好的理解。这一点在常规的教育过程中已经获得了充分的证实，相关的数据和结果可以从多媒体教学的优势的相关研究中得到。同样，企业中很多方案的讨论，数据分析报告的说明其实对于企业而言也是一个方案设计者或数据研究分析者对相关人员类似教学的过程。采用现有企业常规会议设备诸如投影仪、普通笔记本电脑、电脑摄像头配合相应的计算机视觉识别程序，我们可以将交互的投影演示引入到企业日常的展示讨论活动中，增强沟通效果，提高工作效率，并且在技术上同样的识别交互的程序配合上相应的员工面部特征的数据库，还能扩展延伸到考勤或门禁系统中提供更加智能化的办公环境。对于以展示沟通为主的教育培训企业，通过配合一般人脸数据特征，可以通过摄像头捕捉现场视频并识别其中人脸识别，记录现场关注展示内容的人员的数量，作为日后教学效果的自然客观的评估参考。

1目前办公信息化中存在的问题

1.1会议演示文稿展示时多人交互型差

目前主流的演示文稿制作及展示软件主要大多都集成在套装的办公软件中，其中主要常见的种类分别是MicrosoftOffice系列中的PowerPoint、MacOS系统下的KeyNote、基于Linux操作系统的Openoffice中的Impress。它们主要的功能都是对输入的文字、图片声音等多媒体进行编辑制作生成电脑上播放的多媒体幻灯片，尽管它们都具有强大的多媒体数据的处理能力，但最终制作的多媒体幻灯片在演示时都是“单向交互”的，即由播放者播放，而其中的内容及动画按预先设计好的模式显示。如果使用Adobe公司的Captivate或Authware这样的多媒体交互制作软件则会需要有专人进行操作，浪费大量的时间和精力，但如果是配置专门的多点触摸屏幕，则一来屏幕尺寸有所限制，二来费用相对较高容易造成设备的浪费。

1.2传统办公考勤与门禁系统的弱势

目前企业常规的门禁系统与日常考勤系统往往是分离的，两个系统使用了各自独立的软硬件环境，其中门禁系统使用的是摄像监控设备采集信息并通过专人24小时值班，其主要职能仅仅是监控办公环境的人员进出并记录下相应的影像资料。而企业日常的考勤系统则要么采用人工签到的方式，要么采用人工打卡或者指纹打卡方式。如果采用打卡方式管理则需要添置专门的打卡机，这些打卡机多数是独立工作，对于员工的考勤则需要人工根据卡片记录情况统计。无论是员工自身打卡或者是统计考勤都是人工完成，有时还会出现错误和疏漏，同时主要的问题还在于容易出现代人打卡等作假的情况。所以，在传统的办公考勤与门禁系统独立的情况下，两个系统各自记录各自的相关数据，同时投入两套不同的软硬件环境，有时这样的办公环境的信息化反而没有给人员带来便利，而是增加一项打卡签到的日常任务。

2对存在的部分问题的分析和讨论

2.1传统演示设备缺乏交互型功能

由于很长一段时间硬件以及软件的条件约束，电脑的键盘、鼠标完成了95%以上的数据输入工作，单一显示功能的显示器投影仪也成了最主要的信息输出设备。所以常规软件设计和开发时都是把键盘、鼠标、显示器/投影仪的输入输出组合当做几乎所有使用情况下的模式。但随着触摸屏与多点触控硬件的出现，多点触控、屏幕的直接交互输入输出操作成了未来发展的一个趋势，并且相对普通鼠标和单一显示功能的显示器用户交互体验明显提升，人机交互界面更友好直观。但是对于普通办公中使用的投影仪，由于其投影的目标位置情况多样，如果一体化的设计制造具有交互功能的互动投影仪其成本要比普通投影仪更高，对于解决互动操作的问题经济上不是的。而大面积的多点触控屏幕由于设备体积和重量的因素无法在需要灵活移动的新产品推广谈判等活动中使用，如果只是企业自身办公环境中做普通会议展示的效果改进，其投入产出的效率也不理想。

2.2基于传统输入输出设备的开发

由于长期以来人机交互都是以鼠标键盘为主，所以绝大多数程序开发设计都只考虑这种单一的输入方式。但对于目前多媒体数据增多的趋势，这样传统的输入输出模式就存在着很多弊端，其中最明显的是对于多媒体数据的采集就需要单独使用设备，采集后再人工处理。而为了简化系统设计的复杂度，很多管理信息系统的数据采集和录入主要基于键盘鼠标的录入，如果出现非键盘鼠标录入的数据则被要求人工进行数据格式的转换，所以从一个侧面也反映出一些企业排斥信息化，因为原本带来效率提升与管理便利的信息系统，反而由于一些数据格式的录入要求增加了人工劳动。如果直接使用现实当中的多媒体类的数据则系统又缺少相应转换的功能。因为系统在考虑使用键盘鼠标录入采集数据时已经默认了操作者来完成数据录入前的标准化工作。但是实际上随着现代计算机视觉以及人工智能、模式识别技术的发展和完善，过去无法识别的原始多媒体数据现在也可以由计算机识别并进行标准化的处理。

3运用计算机视觉技术改善人机交互

3.1低分辨率识别情况下改善会议演示交互效果

采用现代的计算机影像处理技术和方法，可以用普通的图像采集设备配合程序识别影像当中的特定颜色区域的移动轨迹，并对轨迹做出判断实现与计算机的交互。由于该识别只是需要识别图像中的特定颜色的区域的运动，而非具体的形状与细节，所以识别的难度相对不大，可以运用在会议的展示环境下，通过定位确定普通投影区域与特定颜色区域的位置关系，并通过图形图像的投影与变形运算，实现人与普通投影的交互。在环境背景比较清晰，图像采集设备分辨率与色彩分辨比较灵敏的情况下还能更进一步对人体肤色和手的几何特征进行识别，实现更加自然良好的人机互动交互，并且还能引入人工智能的模式识别算法，实现多人的互动交互，从而大大改善互动展示效果，实现更加人性化有效的沟通。特别在教育培训行业，在现有普通硬件条件下能够实现更加生动的教学讲解演示，提高学生的课堂体验激发更多兴趣，改善教学效果。

3.2运用计算机视觉与模式识别技术整合企业门禁与考勤系统

应用计算机视觉技术配合相对高分辨率的识别与人像数据库，企业可以采用现有的门禁系统的硬件设备配合相应的软件实现门禁与考勤系统的整合，以此提高企业办公环境的智能化人性化的效果，并对员工进行更加精细化的管理。重要的是，通过人机接口的改进改变以往服务信息系统的面貌，让人在自然的环境下工作提高系统的人性化程度。同时整合门禁与考勤系统可以通过识别企业内部员工与外来人员加强办公环境的管理，而且在硬件上可以利用现有的设备，软件方面可以与前面提到的交互演示系统共用相同的图形图像处理内核，减少代码的冗余降低系统复杂度提高性。就目前的人像识别技术而言，已经在个人电脑的安全保护上得到了应用，所以在技术上是可行的，并且也有了实际应用的例子。将该技术移植到普通的门禁管理系统与考勤系统中，只需要解决接口的数据交换就能实现，并且随着现代企业办公环境的要求，应用该技术能大大提高企业的办公环境的智能化程度，并且通过门禁系统提取的企业员工考勤信息更加自然和真实，能够更加地掌握和管理企业员工的日常工作情况提高管理精度。

3.3具体实现方法与原理

为了能充分利用企业现有的硬件设备，并使得附加的程序简单化，这里针对类似会议互动展示这样不需要细节识别的情况采用的是颜色识别的方法，即统计场景中的图像直方图，然后探测直方图上的变化，由于特定颜色的待识别区域的引入可以对整体直方图的特定区域产生峰值的变化，并且通过反向的直方图运算又可以确定特定区域的位置。而直方图的运算属于比较简单的图像运算处理所以能够在很多图像处理的开发工具中直接找到。并且对于细节识别要求比较高的人像的模式识别，采用以上的运算也能缩小待检测区域的大小，提高识别效率，并且人的面部特征采用色识别也能很快找到特征点（眼睛、鼻孔、嘴唇、头发以及头像边缘）。在前面通过色彩识别找到的检测区域中，识别出特征点，并测量特征点的位置关系比例，进而在和数据库中数据对比模式匹配找到最终结果。

4结语

在越南河内的机场，为了使乘客能在等待航班时有比较轻松的环境，在旅客的候机大厅专门安放了一台具有互动功能的投影仪，并将互动内容投影在地面，乘客可以在候机时与地面上的互动投影交互，缓解候机带来的单调乏味感。同样我们可以把它引入到日常企业办公会议或者是培训教育类企业的日常教学中，运用现有的投影屏幕和现有的设备实现多人的在投影屏幕上的互动交互讨论。而人像识别系统在单机上的应用也在很多商用笔记本电脑上得到了应用，在一些科研院所和高科技企业人像识别的门禁系统也被应用到了办公环境当中，提高了办公环境的智能化程度；将人像识别技术结合考勤系统则在教育行业能够实现更为方便的考勤管理防止目前比较严重的代签逃课等情况的发生。随着现在对数据挖掘技术的研究，从日常情况采集到的数据积累到一定程度还能为今后分析员工/学生行为做出数据的积累。这里所讨论和解决的问题主要只是集中在人机交互界面的一些改进，其实对于IT技术而言这只是一小部分，对于企业而言需要使用IT技术真正提高企业的工作效率还需要其他很多方面的配合和集成。

计算机视觉论文:基于计算机视觉的植物黑腐病病斑分析

摘要:给出一种基于图像处理和神经网络技术进行植物黑腐病病斑分析的方法,即利用图像处理技术提取病斑的几何特征和颜色特征,其中几何特征根据病斑形状提取,并基于HSV空间提取病斑颜色矩结合红绿颜色特征作为病斑的颜色特征,利用神经网络加以识别,从而判断病斑所处的生长周期｡给出系统的总体设计和实现方案,研究结果表明,该系统获得了较为理想的检测效果｡这一思路为植物病害检测和分析提供一种新的方法｡

关键词:计算机视觉;神经网络;病斑分析

1引言

基于计算机视觉的植物黑腐病病斑的检测与分析的研究内容和目标是提取植物叶片及黑腐病病斑的特征,分类并确定病害程度｡十字花科蔬菜黑腐病(Xanthomonas campestris pv.campestris (Pammel) Dowson)俗称“半边瘫”,是蔬菜生产重的主要病害之一[1]｡它是一种细菌引起的病害,症状是引起维管束坏死变黑｡细菌从叶缘入侵后,产生玉米粒大小的黄褐色坏死斑,再延叶脉蔓延,逐渐扩大成“V”字形或长条形斑块,周边伴有黄色退绿晕带｡进入致病末期,叶缘形成火烧似的卷缩烧边,致使大量外叶枯死｡因为植物病害等级判定的一些特性一般都可以由采集样本观察测量获得数据,即所选的性状都是可以直接观察到的,则相应的数字化图片上同样可以获得,所以我们利用计算机自动､高效､的特点,提出了基于计算机视觉的植物黑腐病病斑分析的概念,并对黑腐病病斑危害程度的确定进行了探索｡本文根据病斑的几何及颜色特征进行选择,并用人工神经网络的方法加以识别｡

2病斑的几何特征选择

由于黑腐病进入中后期后,病斑呈较为规则的“V”字形斑块,所以可以选择其几何特征作为其等级判断的依据｡通过多次试验,我们选择了以下几种较为具有代表性的几何特征[2]:

2.1病斑区域与叶片区域的面积比p

式中,s为叶片面积,S为病斑面积,叶片和病斑区域面积可以通过扫描图像,累加同一标记区域中象素的个数来表示｡

2.2病斑区域的圆形度C

圆形度C描述的是病斑形状接近圆形的程度,其计算公式为:式中,S表示的是病斑面积,L为病斑周长;C值的范围是0~1,当病斑区域为圆形时周长最短,C=1,病斑区域越偏离圆形,则C值越小｡

2.3病斑区域长､宽比E

E=min{宽度,高度}mx{宽度,高度}病斑区域越细长,E越小,当病斑区域为圆形时,E=1｡

2.4病斑形状复杂性e

式中,L表示周长,S表示面积,用离散指数e来描述单位面积图形的周长大小｡e越大,表示单位面积图形周长越大,即图形离散,为复杂图形｡

2.5从重心到轮廓线的长度的平均变动系数d

如果从病斑重心出发,每隔10°对病斑轮廓进行扫描,设重心到轮廓的距离分别为 n,其中n=0°,10°,…,350°,则平均变动系数:

3病斑的颜色特征选择

由于叶片的生长及病斑的蔓延存在很大的随机性,所以单一依靠病斑的几何特征无法对病斑做出而有效的判断｡鉴于此种情况,除几何特征外,我们提取病斑的颜色特征结合上述几何特征共同作为病斑的评判依据｡

3.1基于HSV空间的病斑颜色矩特征提取

为了处理彩色图像,首先要选取合适的颜色空间｡由于常用的RGB三色空间中,两点间的欧氏距离与颜色距离不成线性比例,也就是说颜色受亮度影响很大,RGB空间不具有进行彩色图像处理所要求的独立性和均匀性指标,所以我们在提取病斑颜色矩特征时采用了均匀性更好的HSV空间｡从RGB到HSV的转换公式为[3]:

由于颜色信息集中在图像颜色的低阶矩中,我们主要对每种颜色分量的一阶､二阶和三阶矩进行统计｡这三个颜色矩的数学定义如下[4]:式中:pij是第j个象素的第i个颜色分量的值;N是象素数量｡由于每幅图像有3个颜色分量,每个颜色分量包括3个颜色矩,这样就一共得到了9个特征向量｡

颜色矩的优点是特征描述比较紧凑,缺点是低阶颜色矩往往分辨率不够,所以除此之外我们又提出了基于统计的病斑红､绿象素特征特提取的方法｡

3.2基于统计的病斑红､绿象素特征提取病菌对叶片的侵蚀实际上是一种破坏植物叶绿素的过程｡经过实验发现,叶片致病后病斑部位与正常叶片相比,图像G通道平均数值相对R通道大幅降低,由原先G>R转变为G

图2正常叶片的R､G､B曲线图3早期黄色病斑的R､G､B曲线图4中后期褐色病斑的R､G､B曲线

基于此种情况,我们提取R通道和G通道的象素平均灰度值和的相对关系参数X和L作为病斑特征｡其中N是象素个数,Ri和Gi分别是R通道和G通道第i个象素的灰度值,式中X描述病斑由黄色转为褐色,R､G通道数值均减小的过程,L则表征伴随病情的加重,叶绿素的减少,G值相对R值变化的过程｡

4人工神经网络分类器设计

4.1神经网络的结构在本文中,我们利用bp算法进行人工神经网络分类器的设计[5],借助MATLAB2006Ra及其所带的神经网络工具箱系统进行系统的实现｡最终采用3层神经网络:16个输入节点,分别为文中上述提取的16种特征;30个隐含层节点;3个输出节点,分别代表病斑处于致病的早期,中期和晚期｡

4.2取样与神经网络的训练

由于实验室培育的黑腐病发病周期一般为6天,我们在2006年4月3日~2006年4月8日间,在温度为24~28℃,湿度为80%的广西大学生命科学院温室内,每天随机采取样本40枚,共计采取样本240枚｡将其扫描为图片后,从中挑选出75张图片作为训练样本｡其中发病头两天的25张,作为早期;发病3~4天的图片25张,作为中期;剩下25张作为末期｡经过大量实验,我们将中间层的传递函数和输出层的传递函数均设为S型的对数函数,即logsig/logsig,训练次数设为1000次,训练目标误差为0.001｡经过736次后训练后,网络收敛,目标误差达到要求｡

5实验结果

使用早期,中期,晚期图片各20张为测试样本(其中15张为新取样本,5张为已使用过的学习样本)对已学习好的神经网络进行测试,网络输出值大于等于0.85时算作1,当输出值小于等于0.15时算作0｡则表1为全部测试样本的判别结果:

6结论与展望

应用上述方案进行识别实验,bp训练网络全部收敛,而且收敛速度较快,15个学习样本全部正确识别｡从上表中可以看出,病斑危害程度的平均识别率达到了90%,其中晚期病斑识别率较高,达到了95%｡中期识别率较低,为85%,这可能是由于某些病斑发展较快或较慢导致中期特征并不明显,使得识别时出现偏差｡另外早期病斑的识别率偏低,这可能是由于有些早期病斑太小,感染初期病斑形状很不规则,所以出现误分｡如何在判别中增加早期病斑颜色判据的权重,增加晚期病斑形状判别的权重,使得分类更加合理,是下一步需要继续思考的问题｡

计算机视觉论文:计算机视觉在案例推理系统中的应用

摘要：本文结合案例推理的关键技术，从计算机视觉如何图像获取、如何图像预处理、如何图像特征抽取描述及案例如何进行检索，得出计算机视觉如何在案例推理系统应用，实现案例推理系统对产品实时质量检测、监控和故障诊断。

关键词：计算机视觉；案例推理；图像处理；图像描述

1 引言

基于案例推理(case-base reasoning)是人工智能中正不断发展的一项重要推理技术。基于案例推理与类比推理方法相似，案例推理将旧经验或教训转换为知识，出现新问题时，首先查找以前是否有相似的案例，并用相似案例解决新问题。如果没遇到相似案例的,经过推理后解决新问题的方法，又会成为新的案例或新经验，下一次再遇到相同问题时，就可以复用这些案例或经验。

这与人遇到问题时，首先会用经验思考解决问题的方式相似，这也是解决问题较好的方法。基于案例推理应用于工业产品检测或故障诊断时具有以下特点：

CBR智能化程度较高。利用案例中隐含的难以规则化的知识，以辅助规则推理的不足，提高故障诊断系统的智能化程度。

CBR较好解决“知识获取”的瓶颈。CBR知识表示以案例为基础，案例的获取比规则获取要容易，大大简化知识获取的过。

CBR求解效率较高。是对过去的求解结果进行复用，而不是再次从头开始推导，可以提高对新问题的求解效率。

CBR求解的质量较高。CBR以过去求解成功或失败的经历，可以指导当前求解时该怎样走向成功或避开失败。

CBR持续不断的学习能力，使得它可以适应于将来问题的解决。

所以基于案例推理方法正不断应用在产品质量检测和设备故障诊断方面，并取得较好的经济效益。为了产品检测和设备故障诊断中，更为智能化，更容易实现现场检测和诊断，计算机视觉技术起到很大的作用。

计算机视觉是研究用计算机来模拟人和生物的视觉系统功能的技术学科，使计算机具有感知周围视觉世界的能力。通过计算机视觉，进行图像的获取预处理、图像分割与特征抽取、识别与分类、三维信息理解、景物描述、图像解释，让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力，从而达到识别、理解的目的。

计算机视觉随着科学技术发展，特别计算机技术、通信技术、图像采集技术、传感器技术等，以及神经网络理论、模糊数学理论、小波的分析理论等计算机视觉理论的不断发展和日趋成熟，使计算机视觉从上世纪60年代开始兴起发展到现在，取得快速发展，已经从简单图像质量处理发展到围绕着纹理分析、图像编码、图像分割和滤波等研究。图像的分析与处理，也由静止转向运动，由二维转向三维，并主要着眼于对图像的识别和理解上，也使计算机视觉的应用领域更为广泛，为案例推理中运用计算机视觉打下基础。

2 案例推理系统的主要关键技术

（1）案例的表示与组织

案例的表示与组织即是如何抽取案例的特征变量，并以一定的结构在计算机中组织存储。如何将信息抽取出特征变量，选择什么语言描述案例和选择什么内容存放在案例中，案例按什么组织结构存放在存储器中，这关系到基于案例推理方法的效率，而且对于案例数量越来越多，结构十分复杂的案例库，尤其重要。

（2）案例的索引与检索

案例的索引与检索即是为了查找相似案例，如何建立案例索引和相似度算法，利用检索信息从案例库中检索并选择潜在可用相似案例。后面的工作能否发挥出应有的作用，很大程度上依赖于这一阶段得到的案例质量的高低，因此这一步非常关键。

（3）案例的复用和调整

案例的复用即是如何根据旧案例得出新解，涉及到找出案例与新问题之间的不同之处，案例中的哪些部分可以用于新问题，哪些部分不适合应用于新问题的解决。而复用还分案例的结果复用，案例的求解方法复用。

（4）案例的学习

案例的学习即是将新解添加到案例库中，扩充案例库的案例种类与数量，这过程也是知识获取。此过程涉及选取哪些信息保留，以及如何把新案例有机集成到案例库中，包括如何存储，如何建立索引等等。

针对案例推理的关键技术，根据检测和故障诊断系统的特点，计算机视觉主要解决如何将产品图像输入系统，如何将产品图像特征进行抽取和描述，如何区别产品不同之处。以便案例推理系统进行案例建模，确立案例的表示形成和案例相似度的计算。本文主要从计算机视觉如何运用在案例推理系统进行探讨。

3 产品输入系统

产品输入系统在不同产品类型和生产环境可能有不同之处，主要应有传感器单元和图像采集单元。如图1。

图1 产品输入系统结构

传感器单元主要判断是否有产品存在，是否需要进行图像采集，是否继续下一个产品图像的采集。这简单传感器可使用光电开关，配合光源，当产品经过时，产品遮挡住光源，使光电开关产生一个0值，而没有产品经过时，光电开关产生相反的1值，系统通过判断光电开关的值，从而判断是否有产品。

图像采集单元简单地说是将产品拍摄并形成数字化图像，主要包括光源、反射镜、CCD相机和图像采集卡等组成。光源和反射镜作用主要使图像中的物体和背景之间有较大灰度。CCD相机主要是拍摄设备。图像采集卡主要是将图像数字化。通过传感器判断有产品后，光源发出的光均匀地照在被测件上，CCD相机拍摄，拍摄图像经过图像采集卡数字化后输入存储设备。存储设备即为计算机硬盘。存放原始图像、数据、处理结果等。

这是案例推理系统的原始数据,是图像处理、图像特征抽取描述的基础。

4 图像处理

在案例推理系统中，需要对案例的组织和案例建模，案例的组织即案例的表示，相对计算机而言，即图像特征的抽取，即某图像具有与其它图像不同之处，用于区别其它图像，具有性。同时，又能完整地表示该图像。所以案例的表示要体现案例的完整性、性、操作容易性。

图像中有颜色区别、又有物体大小之分以及图像由不同的物体组成。如何表示图像，或说图像内部包含表示的本质，即图像的描述。根据图像特点，确立图像案例的表示，以图像的像素、图像的数字化外观、图像物体的数字组成等属性。这需要对产品输入的原始图像进行处理。

在计算机视觉技术中，对原始图像主要进行图像增强、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后，输出图像的质量得到相当程度的改善，既改善了图像的视觉效果，又便于计算机对图像进行分析、处理和识别。具体工作流程如图2所示：

图2 计算机视觉的任务与工作流程

图像预处理是将产品的数字图像输入计算机后，首先要进行图像的预处理，主要完成对图像噪声的消除以及零件的边缘提取。预处理的步骤为：图像二值化处理；图像的平滑处理；图像的边缘提取。

图像二值化处理主将灰度图形二值化的关键是阈值的选取，由于物体与背景有明显的灰度差，可以选取根据灰度直方图中两峰之间的谷值作为阈值来分割目标和背景。

图像的平滑处理技术即图像的去噪声处理，主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真，提取有用信息。

图像边缘提取是为了将图像中有意义的对象与其背景分开，并使之具有某种指定的数学或符号表达形式，使计算机能够理解对象的具体含义，检测出边缘的图像就可以进行特征提取和形状分析了。可采用多种算法，如采用Sobel算子提取边缘。

图像预处理是为下一步的特征描述打基础，预处理的好坏直接影响案例推理的结果和检测诊断的效率。

特征提取是对图像进行描述，是案例建模关键，案例建模是根据案例组织要求抽取图像特征，是建立案例索引和检索的关键。如果图像没有特征，就谈不上进行检索。图像特征可通过图像边界、图像分割、图像的纹理等方法，确定图像特征，包括是什么产品、产品形状大小、产品颜色，产品有什么缺陷、产品缺陷在什么位置等特征，根据这些图像特征进行描述，形成计算机中属性值，并从数据库查找相应信息资料，从而确定产品之间的关系，相似度，也就是案例推理的方向。

5 系统的检索

根据案例推理原理和相应算法，建立案例推理系统模型，如图3所示。

图3 案例推理系统

对话系统：完成人机交互、问题描述、结果显示和系统总控制。

案例库系统：由案例库及案例库管理系统组成。

数据析取系统：对各种已有的源数据库的数据通过转换而形成所需的数据。

多库协同器：根据问题求解的需要，按照一定的数据抽取策略，完成问题求解过程中对模型库系统、方法库系统、知识库系统和数据库系统等资源的调度与协调。

知识库系统：由产生式规则组成，这些知识包括专家经验和以规则形式表示的有关知识，也可以是数据挖掘结论，支持案例检索、案例分析、案例调整等。模型库系统：由模型库、算法库、模型库管理系统组成。完成模型识别和调用，并把结果综合，送入对话系统显示，作为补充信息供案例检索、调整使用。

数据库系统：存放待决策支持的所有问题，并完成其维护与查询等功能。

由于系统主要应用产品的现场实时检测监控或故障诊断，所以系统的检索时，也必须输入检索值，即输入现场产品的图像，在通过产品预处理、图像的二值化、分割和边界处理后，进行图像特征描述，根据图像描述进行分类识别。根据案例推理的算法检索案例库中，是否有相似的案例。即确定相似度。相似度确定主要由案例推理的算法确定，如贴近分析法。确定相似度较大作为结果，并将案例的解输出，给相关控制系统进行决策。如产品质量检测，确定产品质量是否合格，是否有不合格产品，不合格产品是什么原因造成，故障源是什么，如何解决和排除故障，等等。

6 结论

案例推理方法有效地解决计算机视觉技术中图像检索问题。对提高图像检索的效率和度提供了平台。

计算机视觉技术也为案例推理系统实现产品现场实时检测、监控、诊断提供技术支持。计算机视觉技术现场的数据采集、处理为案例推理打好基础。

两者的结合设计的系统适用范围很广，只要产品需要进行质量检测、监控，或设备需要进行故障诊断和维护，都可以适用。

系统提供的实时检测、监控和诊断功能，提高企业的生产效益，降低了生产成本。

计算机视觉论文:计算机视觉技术在交通工程测量中的应用

一、引言

随着科技的发展,计算机替代人的视觉与思维已经成为现实,这也是计算机视觉的突出显现。那么在物体图像中识别物体并作进一步处理,是客观世界的主观反应。在数字化图像中,我们可以探寻出较为固定的数字联系,在物体特征搜集并处理时做到二次实现。这既是对物体特征的外在显现与描绘,更是对其定量信息的标定。从交通工程领域的角度来看,该种技术一般应用在交管及安全方面。监控交通流、识别车况及高速收费都是属于交通管理的范畴;而对交通重大事件的勘察及甄别则是交通安全所属。在这个基础上,笔者对计算机视觉系统的组成及原理进行了分析,并形成视觉处理相关技术研究。

二、设计计算机视觉系统构成

计算机视觉处理技术的应用是建立在视觉系统的建立基础上的。其内部主要的构成是计算机光源、光电转换相关器件及图像采集卡等元件。

(一)照明条件的设计。在测量物体的表征时,环境的创设是图像分析处理的前提,其主要通过光线反射将影像投射到光电传感器上。故而要想获得清晰图像离不开照明条件的选择。在设计照明条件时,我们通常会视具体而不同处理,不过总的目标是一定的,那就是要利于处理图像及对其进行提取分析。在照明条件的设定中,主动视觉系统结构光是较为典型的范例。

(二)数据采集的处理。如今电耦合器件(CCD)中,摄像机及光电传感器较为常见。它们输出形成的影像均为模拟化的电子信号。在此基础上,A模式与D模式的相互对接更能够让信号进入计算机并达到数字处理标准,再量化入计算机系统处理范围。客观物体色彩的不同,也就造就了色彩带给人信息的差异。一般地黑白图像是单色摄像机输入的结果;彩色图像则需要彩色相机来实现。其过程为:彩色模拟信号解码为RGB单独信号,并单独A/D转换,输出后借助色彩查找表来显示相应色彩。每幅图像一旦经过数字处理就会形成点阵,并将n个信息浓缩于每点中。彩色获得的图像在16比特,而黑白所获黑白灰图像则仅有8比特。故而从信息采集量上来看,彩色的图像采集分析更为繁复些。不过黑白跟灰度图像也基本适应于基础信息的特征分析。相机数量及研究技法的角度,则有三个分类:“单目视觉”、“双目”及“三目”立体视觉。

三、研究与应用计算机视觉处理技术

从对图像进行编辑的过程可以看出,计算机视觉处理技术在物体成像及计算后会在灰度阵列中参杂无效信息群,使得信息存在遗失风险。成像的噪声在一定程度上也对获取有效信息造成了干扰。故而,处理图像必须要有前提地预设分析,还原图像本相,从而消去噪音。边缘增强在特定的图像变化程度中,其起到的是对特征方法的削减。基于二值化,分割图像才能够进一步开展。对于物体的检测多借助某个范围来达到目的。识别和测算物体一般总是靠对特征的甄别来完成的。

四、分析处理三维物体技术

物体外轮扩线及表面对应位置的限定下,物体性质的外在表现则是其形状。三维物体从内含性质上来看也有体现,如通过其内含性质所变现出来的表层构造及边界划定等等。故而在确定图像特征方面,物体的三维形态是最常用的处理技术。检测三维物体形状及分析距离从计算机视觉技术角度来看,渠道很多,其原理主要是借助光源特性在图像输入时的显现来实现的。其类别有主动与被动两类。借助自然光照来对图像获取并挖掘深入信息的技术叫做被动测距;主动测距的光源条件则是利用人为设置的,其信息也是图像在经过测算分析时得到的。被动测距的主要用途体现在军工业保密及限制环境中,而普通建筑行业则主要利用主动测距。特别是较小尺寸物体的测算,以及拥有抗干扰及其他非接触测距环境。

(一)主动测距技术。主动测距,主要是指光源条件是在人为创设环境中满足的,且从景物外像得到相关点化信息,可以适当显示图像大概并进行初步分析处理,以对计算适应功率及信息测算程度形成水平提高。从技术种类上说,主动测距技术可分为雷达取像、几何光学聚焦、图像干扰及衍射等。除了结构光法外的测量方法均为基于物理成像,并搜集所成图像,并得到特殊物理特征图像。从不同的研究环境到条件所涉,以结构光法测量作为主要技术的工程需求较为普遍,其原理为:首先在光源的设计上由人为来进行环境考虑测算,再从其中获取较为的离散点化信息。在离散处理后,此类图像已经形成了较多的物体真是特征表象。在此基础上,信息需要不断简化与甄别、压缩。如果分析整个物体特征信息链,则后期主要体现在对于数据的简化分析。如今人们已经把研究的目光转向了结构光测量方法的应用,体现在物体形状检测等方面。

(二)被动测距技术。被动测距,对光照条件的选择具有局限性,其主要通过对于自然光的覆盖得以实现。它在图像原始信息处理及分析匹配方面技术指向较为突出。也通过此三维物体之形状及周围环境深度均被显露。在图像原始信息基础上的应用计算,其与结构光等相比繁杂程度较高。分析物体三维特性,着重从立体视觉内涵入手,适应物体自身特点而存在。不过相对来说获得图像特征才是其适应匹配的条件保障。点、线、区域及结构纹理等是物象特征的主体形式。其中物特较为基础与原始的特征是前两个特征,同时它们也是其他相关表征的前提。计算机系统技术测量基本原理为对摄像机进行构建分析,并对其图像表征进行特征匹配,以得到图像不同区间的视觉差异。

五、结束语

通过对计算机视觉技术的研究,悉知其主要的应用领域及技术组成。在系统使用的基础上深入设计,对系统主要构成环节进行分析。从而将三维复杂形态原理、算法及测量理论上升到实际应用。随着社会对于计算机的倚赖程度增加,相信该技术在建筑或者其他领域会有更加深入的研究及应用。

计算机视觉论文:计算机视觉技术及其在自动化中的应用

摘要：随着社会的发展，科技的进步，计算机的应用范围也越来越广，人们开始试图建立利用计算机来代替人类进行自动识别的人工智能系统，而要想建成这种系统一项必不可少的技术就是计算机视觉技术。为了进一步促进计算机视觉技术的发展，使计算机视觉技术得到更广泛的推广与应用，本文概述了计算机视觉技术的基本概念、工作原理与理论框架，并重点分析了计算机视觉技术在农业自动化、工业自动化以及医学自动化中的应用，以期为计算机视觉技术的推广与发展贡献自己的绵薄之力。

关键词：计算机；视觉技术；应用；分析

计算机人工智能技术中的一项重要技术就是计算机视觉技术，这种技术主要是让计算机利用图像来实现认知环境信息的目的，这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展，计算机视觉技术也得到了较快发展，并且在实际生产与生活中的应用也越来越广泛。

1 计算机视觉技术概述

1.1 基本概念

计算机视觉技术主要研究计算机认知能力的一门技术，其具体主要是通过用摄像机代替人的眼睛，用电脑代替人的大脑，最终使计算机具备类似于人类的识别、判断以及记忆目标的功能，代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术，通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说，计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上，利用计算机来分析、处理视觉信息的技术，它是现代社会新兴起的一门高新技术。

1.2 工作原理

在亮度满足要求的情况下，首先使用摄像机对具体事物的图像信息进行采集，利用网络把采集到的图像信息向计算机内部输送，然后在计算机系统内部处理加工图像信息会把事物的原始图像得到，随后利用图像处理技术进一步处理原始图像，获得优化质量效果之后的图像，分类与整理图像中有特征价值的信息，通过智能识别技术识别与描述提取到的图像信息特征，把得到的高层次的抽象信息存储起来，在进行识别事务时分析对比这些储存信息就可以实现事物的识别，这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示：

1.3理论框架

人类研究视觉技术虽然起步比较早，但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了，视觉技术是一项特别复杂的信息处理过程，要想对视觉的本质完整的理解，必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为：计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术，我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。

所以，可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程，其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次，可大致把计算机视觉技术划分为：低层视觉处理、中层视觉处理、高层视觉处理三个层次。

2 计算机视觉技术在自动化中的应用

2.1 农业自动化中计算机视觉技术的应用

在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况，便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量，例如可以应用计算机监测技术来监测大多数蔬菜的质量，传统的人工检测蔬菜质量的方法，不仅费时费力，而且检测结果的性也不能很好的保障，在实际人工检测过程中还容易伤害蔬菜，可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小，然后和质量达标蔬菜的光线能量大小进行对比，根据这些对比结果可以把蔬菜质量的好坏判断出来，在蔬菜质量检测过程中应用计算机视觉技术，把传统的蔬菜检测方法颠覆了，极大的方便了农产品的质量检测，由此可见，计算机视觉技术在农业生产中有很高的使用与推广价值。

2.2 在工业自动化中计算机视觉技术的应用

计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸，其测量与被测对象的原理如图2所示。

光学系统、计算机处理系统以及CCD摄像头，是计算机检测系统的主要组成，被测物体由光源发出的平行光束进行照射，利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上，然后再通过计算机处理这些图像，进而把被测部位的轮廓位置信息获取下来，若被测对象是出现位移时，可通过两次重复测量，利用两次测量的位置差就可以得出，被测物体的位移量。

此外计算机视觉技术还可以应用于逆向工程中，应用3D数字化测量仪可以快速的测出现有工件轮廓的坐标值，同时还能构建曲面，保存成CAD或CAM图像，把这些图像送入CNC制作中心加工，便可制作出产品，这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现，最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸，获得各部位数据，进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现，器具体轮廓结构示意图如下图3所示。

这种测量方法的工作原理为：利用激光穿越平行、等距的振幅光栅组件，或直接采用干涉仪发出的干涉条纹，形成平面条纹结构光，再向物体表面投射，由于物体各表面的深度与曲率的不同，条纹会自动出现变化，然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中，把图像信号转化为模拟信号，再转化为数字信号，然后经过传送再还原信号到图形处理系统，就得到三维轮廓图像。

在工业自动化中计算机视觉技术的深入广泛应用，不但使工业产品的生产质量得到了保障，而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量，封口质量以及印刷质量等等，如我国重点指定的印刷造币机器的南京造币厂，由于货币制造印刷是由印刷造币机器来实现的，所以要严格要求其生产工艺，一丝一毫的生产差错都不允许存在，为了保障印刷制造出来的造币机器质量达标，必须严格检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术，随着计算机视觉技术的不断进步，计算机视觉技术已经对印刷造币机器的需求满足了，实际的应用效果也非常理想，印刷造币机器在实际生产的过程中，南京造币厂把计算机视觉技术应用在了每个应刷造币机器的生产工序上，硬币受到重力下落的瞬间，计算机视觉技术可以瞬间采集图像的信息，拍摄硬币在下落过程中的图像，通过高速光纤传感器可以把硬币图像向计算机系统快速传输，利用计算机系统处理信息与识别信息的超强能力，可以及时识别硬币质量，经大量实践研究得出，在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生，由此可知，在工业自动化中计算机视觉技术的应用不但可行，而且发展空间还很大。

2.3 在医学自动化中计算机视觉技术的应用

在医学领域计算机视觉技术也得到了广泛应用，如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术，这些技术的广泛应用很大程度上方便了医生判断病人病情，另外，在生产药品的过程中，应用计算机视觉技术可以高效检测药品包装的合格与否，其基本流程是：传送装置先运输药品到指定位置，传送装置自身又可分为检测与分离两个区域，在传送药品的过程中药品的图像信息会被特定的摄像机采集，采集完成后向计算机系统传递采集信息，然后计算机系统会分析与处理这些信息，把没有包装好的药品自动识别出来，并且向分离区传递识别信息，分离区的自动装置会依据传输的分离信息，隔离开没有包装好的药品，这样就可以有效分类包装好的药品与没有包装好的药品，在药品包装检测方面应用计算机视觉技术代替传统人工检测，不但可以实现药品无误的检测，而且还可以大大提高检测药品包装质量的效率，完善了药品生产的自动化，由此可见，在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。

3 结束语

总之，计算机视觉技术是一门研究计算机识别能力的高新技术，它涵盖了很多其他技术，具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用，我们必须在明白其基本概念、工作原理以及理论框架的基础上，结合实际生产情况，不断进行深入研究，只有这样才能使计算机视觉技术得到更好地推广与应用，才能使这项现代化的高新技术更好的服务于社会，服务于人类。

计算机视觉论文:浅议高校计算机视觉课程教学的创新

摘要：计算机视觉是利用计算机及相关设备来模仿生物视觉的技术，计算机视觉课程的建立对学生的学习和互联网的发展有着重要的意义。基于此，本文将着重探讨计算机视觉课程的特点和高校计算机视觉课程教学的创新策略，主要包括教学内容的选取和工程实例的选取，以期为当前计算机视觉课程的教学提供一些指导意见。

关键词：计算机视觉；课程创新；教学改革

计算机视觉课程是人工智能学科的分支学科，对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁，越来越多的学生对这一领域产生了浓厚的兴趣，计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣，如何培养学生的专业能力和实践能力，是当前高校应该考虑的问题。经过近几年的教学实践后，很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法，在满足学生对计算机视觉应用需求的同时，加深了学生对理论知识的理解，这已经成为了当前高校计算机视觉课程教学的重要模式。

一、计算机视觉课程的特点

近年来，随着计算机网络的飞速发展，计算机视觉的应用也越来越广泛，成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域，包括人工智能与模式识别、应用数学等，其覆盖范围广，综合性较强。具体来说，计算机视觉课程有以下几个特点：一是内容广泛，理论抽象。计算机视觉是一门新技术，随着时代的变迁，互联网新技术的更新日新月异，这就使得课程内容的更新过快，内容广泛，教师很难在及时时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域，并且所涉及的领域知识内容复杂，表达抽象，这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域，操作性极强，学生只有在具有一定的工程项目综合能力后，才能进行计算机视觉应用和操作。

二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别

1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列，其输入资料主要来自usb摄像头或是相机。经过处理后，计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解，在这一方面，计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成，每个多边性有三个顶点，输出的是二维像素数组。在增强现实的应用中，人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率，还需要用到计算机图形学对虚拟三维物体的叠加方法。

2.计算机视觉与数字图像处理的联系和区别。首先，计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础，而计算机视觉的研究成果也可以作为数字处理的素材。其次，计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位，而图像则不仅包括图形，有时还包括来自现实世界的信号，并且图形的处理不是一种简单的堆积，计算机视觉的处理要从图像中找到一些统计数据和信息，并做进一步的数据分析。

三、高校计算机视觉课程教学的创新策略

1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作，因此，在对学生进行培养时，高校一方面要考虑到学生的知识接受度，另一方面要设置以工程应用为导向的课程内容，帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时，首先要创新课程教材，摒弃以往枯燥的理论书籍，多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性，高校应该选择以下两本书作为学生的专用教材：一本是我国著名教授贾云得编纂的《机器学习》，这部教材深刻体现了时展的教学要求，书中不仅详细讲述了计算机视觉中的一些基本知识，包括计算机视觉的基本概念、算法及其应用，还有一些经典的数字图像处理方法和视觉应用分析，对学生了解基础知识和实践内容有着重要的意义；另外一本是国内外十分推崇的计算机视觉著作，它是美国教授Richard Szeliski教授的作品。该书在2010年出版，获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授，也是微软研究院交互视觉与多媒体的主任，他对计算机视觉的发展和未来走向十分清楚，也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此，这本教材面向应用，与当今近期的科技成果紧密相连，综合论述了计算机视觉在各个领域的发展，展示了计算机视觉的近期研究成果和未来的发展趋势。此外，本书中还有详细的国外研究案例和更加深入的应用案例，适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则，对学生开放性思维的培养有着重要的意义。

2.面向科技近期成果的课程定位。计算机视觉是一门新技术，科技创新是其发展的原动力，因此，高校在进行课程安排时，应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技近期成果定位计算机视觉课程，高校要做到以下两个方面：（1）选取涵盖近期成果的教材。考虑到不同学生的数字图像处理基础不一的问题，学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时，计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容，主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识，包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容，其课时可占总课时的二分之一。其次，视觉部分是近几年来计算机视觉的近期科技成果，内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域，视觉部分将会是该课程后期的重点内容，与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用，学生会更多的涉及到实践操作，更好的培养学生的实践能力。（2）强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一，高校可以在课程项目中引入新技术的探究，在使课程在具有基础性、研究性的同时，具有一定的前沿性，还能让学生在及时时间了解到近期的科技成果和互联网应用技术。在课程调研和实践中，高校必须要强化学生的自学和调研能力，在调研时给每一个小组安排一位高年级研究生作为指导，每组学生独立完成任务，高年级研究生只做引导和辅助的作用。学生在自我设置调研程序，查找资料，理解和熟悉相关程序的时候，能够更加掌握近期科技成果的内容，同时还提高了学生的自学能力和团队协作能力。

3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一，因此在计算机视觉课程的教学过程中，培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法：（1）选取适当的工程实例。对于信息专业的学生而言，计算机视觉课程各个独立的算法和方法较多，彼此没有过多的联系。这对学生来说过于抽象，不易理解，因此教师不应当仅仅限于知识的传授，还应该选取一些适当的工程实例，将知识体系串联在一起，加深学会对教学内容的理解，从而达到良好的教学效果。例如，在教学过程中，教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品，用手机举例更加贴近学生的生活，教师可以详细介绍手机键盘和主板的制造过程，并在这一过程中将所学的算法和理论融合进去，加深学生对知识的理解。其次，教师在手机讲解时，还可以引导学生思考类似的产品制造，从而引出数码相机的制造原理，和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习，还可以让学生拓宽思路，发散思维，不断创新计算机视觉领域。（2）选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科，因此，为了学生更好的学习，教师要将理论工程实践化，选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房，给学生上一堂别开生面的实践课，详细介绍每个制造流程，并向学生不断抛出与课程有关的问题，引发学生的思考，比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中，对学科知识的了解也会逐步加深。其次，高校可以建立专门的实训基地，学生可以在基地里实践操作，将理论转化为实物，亲自尝试做出模型，这种做法可以极大地提高学生的实践能力，使学生更快的将理论转化为实际。

四、结语

在新形势下，高校应不断创新计算机视觉课程的教学模式，并以此展开教学活动，培养学生的实践能力和创新精神。将工程应用和科技近期成果结合的教学模式，有利于解决理论和实践相脱节的问题，在增强学生学习兴趣、提高学生独立分析能力的同时，还使学生接触了国际近期的研究成果，拓宽了学生的思路，这对学生未来的发展有着重要的意义。

计算机视觉论文