时间:2024-05-04
杨子涵
摘要
图像在人们的信息获取过程中发挥着重要的作用。视觉感官系统是人们获取图像所反映的信息的重要载体。近年来,对于计算机视觉、图像识别等方向的研究越来越受到各界学者的重视,相关的研究成果也层出不穷。人们对图像内容的认知过程其实是人们对现有的知识经验进行应用的过程,相比之下,利用计算机进行图像识别则是一个相对更加复杂的问题,其核心问题在于两个方面,首先是对于图像中主体内容的识别与定位,其次是巨大的运算量需要更加合适的识别算法。本文将主要对第二个问题进行讨论,对基于灰度编码的彩色图像识别方法进行了讨论。基于灰度化编码的彩色图像识别方法可以有效降低图片信息量并且保留大部分有效图片信息,另一方Hamming网络可以加快图像识别速度。
【关键词】计算机视觉 彩色图像识别 灰度转化编码 Hamming网络
随着计算机技术的发展,人们对于计算机的应用愈加广泛。其中计算机视觉是近年来研究的重要热点之一,因为其具有广泛的应用场景,如图像识别、视频识别,以及VR建模等。计算机视觉技术的核心是基于人体视觉感官系统的,视觉感官系统在人们的日常生活中发挥着重要的作用。图像认知是人们获取信息的重要途径。出于图像认知的需要,人们开始利用计算机技术模拟自身认识图像和理解图像的能力。其中基于计算机视觉的彩色图像识别技术主要有两个步骤,首先是将彩色图像进行灰度转化,将冗余的色度信息正则化成单一的灰度信息,可以在保留大部分图片信息的基础上降低图片运算量;第二步是将图片主体信息进行识别和定位,识别问题往往是分类问题,分类算法的研究目标则是提高识别准确率并减少运算时间。基于灰度化编码的彩色图像识别方法的研究工作的开展,可以为人工神经网络技术的发展提供一定的保障。
1 图像识别的简要概述
1.1 主要组成
图像是一种重要的信息来源,人类获取的信息大约75%来自视觉。图像识别技术是指借助计算机技术将待识别对象分配至各自的模式类别之中。图像识别技术应用场景广泛,除了对彩色图片中内容进行识别和分类外,图像识别还可以应用到文字识别之中。文字识别主要指的是对数字与符号的识别,如印刷体文字识别与手写体文字识别。另一方面,图像识别技术可以应用于图片的时序序列,即视频识别,对关键帧的定位现在成为了重要的计算机视觉研究方向之一。
图像往往可以带给人们一种语言文字难以达到的直观感觉。一般情况下,图像可以分为直观视觉图像和间接转换图像两种类型,现实生活中常见的图片和文字可以纳入到直观视觉图像范畴之中,语言、声音等内容可以纳入到间接转换图像之中。另外,根据颜色和灰度值等信息,人们可以将图像分为二值图像、灰度图像、索引图像和真彩色RGB图像等多种图像。
1.2 常用技术
图像数字化技术、图像存储技术和图像识别技术是图像领域或者计算机视觉领域中的常用技术。图像数字化技术具有将图像模拟信号采样为数字图像的作用,从而便于编辑和计算。图像存储技术建立在图像编码技术基础之上,有效的无损压缩或有损压缩,可以使使图像体积缩小,从而方便存储于传输。图像识别技术则是指通过主成分分析(PCA)和神经网络(NT)等算法,识别、分类图片信息的技术,目前该技术与机器学习的发展息息相关。
2 颜色空间
2.1 RGB颜色空间
作为最常见的颜色空间,RGB是指通过红(Red)、绿(Green)、蓝(Blue)三原色对图像颜色进行描述,通过对三种不同颜色的叠加,RGB颜色空间展现出不同颜色显示。根据人眼识别到的颜色,RGB三个颜色信道分别分为256个等级,即[0,255],共计16777216种颜色组合。
2.2 HSI颜色空间
HIS是由色度(Hue)、饱和度(Saturation)和亮度(Intensity)组成。色度定义了颜色的属性和波长,饱和度定义了颜色的深浅,而亮度定义了颜色的强度。由于人对亮度的敏感程度高于对色度的明暗程度,故而相比RGB,HIS颜色空间更符合人们描述和解释颜色的方式,也更适用于人的视觉系统。
在彩色图像处理中,常见的做法之一就是颜色空间的转换,下列公式即为RGB向HSI坐标转换的公式。
3 彩色图像灰度化
3.1 经验公式
彩色图像承载的信息是充足,但往往也存在着冗余,图像中许多关键信息即使失去了颜色,也可以被正确的表达出,丧失一些色彩的完整性不意味着关键信息的丢失。另一方面,從理论上讲一个彩色像素点需要24位字节来表示,而灰度图像只需要8位,如果可以在保证图像关键信息不丢失的情况下,将彩色图像转化为灰度图像,那么将有2/3的图像尺寸会被减少,这就意味着每张图像将占用更小的存储空间以及拥有更快速的处理速度。
这种将彩色图像转化为灰度图像的有损压缩方式主要基于三个基础。首先,灰度图像需要保留原有彩色图像的重要特征;其次,图像的主要压缩成分应该是原有彩色图像中冗余信息的部分,而并非关键信息部分;第三灰度图像中的图像信息主要是由像素点量度决定。
基于图像灰度化原理和大量实验经验,RGB颜色空间下的彩色图像灰度化经验公式为Y=0.2998+0.5876+0.114B,其中Y表示图像的亮度信息,取值[0,255]共256个等级。由公式可以明显得出,彩色图像的灰度化是个不可逆过程,即仅知灰度图像信息是无法将其还原成彩色图像的。
3.2 LAB模型
除此之外,RGB图像向灰度的转变可以通过LAB模型,LAB模型在灰度转化过程中发挥着转化中介的作用。所谓的LAB色彩空间是国际照明委员会制定的一种色彩模式,其中L表示的内容为亮度、A表示的内容为红色至绿色的范围;B表示的内容为黄色至蓝色的范围。LAB颜色空间拥有着宽阔的色域和丰富的色彩,它不仅包含了RGB的所有色域,还能表现出更多的色彩。通常来说,人的肉眼能感知的所有色彩,都可以通过LAB模型表现出来。同时,在实际应用过程中表现出来的不依赖设备的色彩特性的优势,也是灰度转换以LAB为转换中介的主要原因。
通过LAB模型将RGB图像灰度化主要分为五个步骤,首先是将RGB图像转换成三刺激值XYZ;再将XYZ转化为LAB模型;在LAB模型中将A,B两元素归零,只保留L的值;将此时的LAB模型返回成RGB模型并生成一个等值的RGB灰阶;最后根据该灰阶生成相应的灰度K。
其中r,g,b为彩色图像的三个通道,取值为[0,255],gamma函数不唯一,主要是用于对图像进行非线性色调编辑,目的是调高图像对比度。之后利用转换矩阵进行XYZ转换,其中转换矩阵通常为
其中X0,Y0,Z0的默认值分别为95.047,100.0,108.883。
在不同的RGB空间,所用的灰阶计算公式不同,常见的RGB空间有简化sRGB,Adobe RGB,Apple RGB等。
图1展示的是RGB颜色空间下经各方法处理后的灰度谱,通过图片我们可以发现经验公式带来的灰度化会导致颜色在纯色部分相对较暗混色部分相对较凉,而LAB模型下的灰度化更加均匀,更加贴近人类视觉。
现阶段图像灰度化转换已经成为了图像处理研究领域的基础环节,在图像分割、图像特征提取和模式识别等图像处理工作开始之前,人们通常需要将原始图像转化为灰度图像。
4 Hamming网络识别图像
人工神经网络,亦称为神经网络,是由大量处理单元广泛互连而成的网络,是模拟人类实际神经网络的数学方法。目前常见的神经网络模型有几十种,比如MP模型,Perceptron,自适应线性元件网络,Hopfield,Hamming等。其中MP模型是一种将神经元视为二值开关元件的逻辑神经元模型,通过二值开关元件的不同组合方式完成多种逻辑运算;Perceptron网络系统为感知机系统;自适应线性元件网络系统为神经元只有一个线性激活函数的神经网络模型;而Hopfield和Hamming较适于图像的识别。Hamming网络的结构简单,并能识别带有干扰信号的模式。而且对于同样的输入模式,Hamming网络与Hopfield网络相比,网络内的连接要少得多。Hamming网络的另一个优点是在识别时通常不会没有结果,而Hopfield网络却常常会识别不出结果。鉴于Hamming网络的诸多優点和本文的灰度化编码方式,本文采用Hamming网络进行彩色图像识别。图2所示的内容为Hamming网络的拓扑结构。
Hamming网络的拓扑结构层可以分为上、中、下三层,最下层为输入层,中层为节点层,上层为输出层。X1,X2,…,XN表示的内容为输入值,Y1,Y2,…,YN表示的内容为输出值。
Hamming网络工作过程分为学习(训练)阶段和识别阶段,学习阶段可以在用户输入所要识别的模式的全集以后,让网络认识并记忆此类样本。Hamming网络的具体算法如下。假定图像有N个像素点,待识别图像的数量为M,此时可以得出以下关系:
其中xij为输入第j幅图像时,第i个节点的输出值。在输入未知值时,我们计算
其中,xi为输入未知模式时第i个节点的输入值,Uj(0)表示第j个节点在。时刻的输出值。之后将Uj(t+1)迭代计算至只有一个输出值为正,即
迭代结束时,如果Uj为正,则输入的未知模式将被识别为第j个样本模式。
Hamming网络在识别未知输入模式中发挥着重要的作用,因此基于Hamming网络的Hamming码同时可以应用在自动检测及对计算机存储或移动数据过程中出现的现行错误纠正中。自20世纪50年代以来,Hamming码在系统可靠性提升过程中得到了较为广泛的应用。从Hamming码的特点来看,它也对奇偶校验位概念进行了应用。基于Hamming码的系统可以通过在数据位后面增加一些位的方式,对数据的有效性进行验证。在验证数据有效性的同时,Hamming码也可以在数据出错的情况下,对错误位置进行明确。
5 实验分析
图3所示的内容为图像识别系统的用例视图。
预处理阶段和Hamming网络工作阶段是图像识别系统中的两大重要阶段。预处理阶段是人们借助CDI+技术对原始图像进行压缩处理的阶段。GDI+是基于C++类的面向对象的应用程序编程接口,主要任务是通过调用函数处理图像信息。在压缩处理工作完成以后,人们需要在保留有包含有色度信息的彩色图像灰度化编码的基础上,对图像进行灰度化处理,并要在对图像模糊处理结果进行分析的基础上,完成训练样本的确定,以便借助Hamming网络体系对样本信息进行识别。
5.1 建立彩色图像数据库
出于实验需要,实验过程中所使用的图像均来源于人脸图像识别信息库,实验过程中使用的最小的图片为116X156的图片,最大的图片为201X311的图片。图4所示的内容为实验过程中使用的样张。
5.2 图像预处理
图像预处理环节主要分成三部分,图像压缩,图像灰度化以及图像平滑。如图5所示,先将图像通过GDI+中的函数进行压缩,统一成24X18的图像集合。之后将压缩好的图像按照上文中介绍的灰度化方法进行灰度化处理。最后利用9点平滑法和25点平滑法对灰度化后的图像进行模糊处理。9点平滑法是指以每个像素点为中心,建立3X3矩阵为平滑模板,以模板的平均灰度值代替原像素点的灰度值进行模糊处理,同理,25点平滑法选用的平滑模板为5X5矩阵。
5.3 识别样本
识别样本的过程是根据两个像素点之间的各个颜色分量的亮度差异对灰度化以后的图像进行模糊处理的过程。在Hamming网络技术应用于样本识别以后,人们可以在对训练样本进行有效识别的基础上,确定去除边缘像素点以后的22X16灰度值矩阵。
5.4 实验结果
在对基于Hamming网络的灰度值训练集识别率识别结果与传统方法进行分析时候,我们可以发现,本文中所涉及到的识别方法的训练集识别率可以达到100%。在保证亮度不变的情况下,对图片内容进行色度变换,此时原始样本识别方法的错误接受率达到了100%,本文中所论述的方法的错误接受率为0%,这一实验结果验证了本文所论述的结论。
6 结束语
彩色图像的处理和识别的应用场景广泛,同时涵盖了多个学科,一直以来是计算机领域研究的重点话题。本文结合了图像灰度化和Hamming网络理论,提出了彩色图片的识别方法。灰度转化过程是RGB图像向灰度图像转变的过程,其中LAB模式在灰度转化过程中发挥着转化中介的作用,灰度化可以有效地保留彩色图片亮度信息从而减小图像尺寸加快处理速度。除此之外,Hamming网络可以在图像识别中提供一个简单有效的识别模型,实验结果也证明,这种图像识别方法可以有效的达到预期效果。不过这种彩色图像识别方法还存在着一些局限性,当利用上文提到的灰度化方法处理彩色图片时,彩色图片的色彩信息会全部丢失,换言之,针对一些非轮廓识别或色彩识别问题时,这种灰度化处理就很难达到预期的效果,以及当图像尺寸不一致时,识别难度也会大大提高。因此,稳定且可在多种应用场景下使用的彩色图像识别方法,乃是我们研究一直努力的方向。
参考文献
[1]贾永红.数字图像处理[M].武汉大学出版社,2003.
[2]贺炜.多维彩色图像特征快速抽取方法仿真研究[J].计算机仿真,2017,34(02):389-392.
[3]王燦灿.视频关键帧提取及人脸表情识别[D].济南大学,2014.
[4]LinanFeng,BirBhanu,JohnHeraty.A software system for automatedidentification and retrieval of mothimages based on wing attributes [J].Pattern Recognition,2016(51).
[5]MCCULLOCH,W.S.A logicalcalculus of ideas imminent innervous activity[J].Biol MathBiophys,1943(05).
[6]Rosenblatt F.The perceptron:Aprobabilistic model for informationstorage and organization in thebrain.[Ml.Neurocomputing:foundationsof research.MIT Press,1988:386-408.
[7]Widrow B,Hoff M E.Adaptive switchingcircuits[M].Neurocomputing:foundations of research.MIT Press,1988.
[8]HOPFIELD,J.J.Neural Computation ofDecision in Optimization Problems[J].Biological Cybernetics,1985,52.
[9]Chong C C,Jia J C.Assessments ofneural network classifier outputcodings using variability of Hammingdistance[J].Pattern RecognitionLetters,1996,17(08):811-818.
[10]LinanFeng,BirBhanu,JohnHeraty.A software system for automatedidentification and retrieval of mothimages based on wing attributes [J].Pattern Recognition,2016,51.
[11]人脸图像识别库[DB/OL].http://www.cbsr.ia.ac.cn/IrisDatabase.htm.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!