时间:2024-08-31
顾晓峰, 朱宏擎
(华东理工大学信息科学与工程学院,上海 200237)
一种基于二维匹配滤波器的掌纹识别算法
顾晓峰, 朱宏擎
(华东理工大学信息科学与工程学院,上海 200237)
在掌纹识别算法中,基于Gabor滤波器和方向编码方法得到了广泛的研究和应用,但是此类方法一般使用Gabor滤波器提取特征,易受噪声和散焦等外界因素的影响。针对此问题,本文提出了一种基于匹配滤波器的算法。该算法使用二维匹配滤波器提取图像特征,采用双方向编码(DOC)匹配方法表征特征之间的相似度。实验结果表明,该算法对于噪声、散焦和平移等干扰都具有很好的鲁棒性,验证了该算法的可行性。
二维匹配滤波; 双方向编码; 掌纹识别
生物识别技术是根据人的生理和行为特点进行身份认证的技术,掌纹识别是近年来新兴的生物识别技术,相对于指纹而言,掌纹面积更大,包含的信息也更多;相对于虹膜而言,采集设备更为低廉,采集方式更为简单。因此,掌纹识别近年来得到了广泛的关注[1]。目前,掌纹特征的提取方法主要包括基于结构的方法[2]、基于子空间的方法[3]和基于方向编码的方法。由于掌纹包含有大量的线条和纹理特征,所以其包含有丰富的方向性特征,使得基于方向编码的方法成为了目前研究的一大热点。
基于方向编码的方法最早由Dangman[4]提出并用于虹膜识别,Zhang 等[5]将其直接应用于掌纹识别中,将图像与2D Gabor滤波器作卷积,根据结果的实部和虚部的正负进行编码,正数为1,负数为0,使用归一化汉明距离作为表征相似程度的标准,该方法计算简单,但是只使用一个45°的Gabor滤波器,可能使得不同的手掌得到相似的滤波结果,从而降低识别效果。为了解决这一问题,Kong等[6]提出了融合码的方法,将图像与6个方向的Gabor滤波器作卷积,在每个像素点处选取6个卷积结果中的最大值作为该点的方向信息,然后利用该点的幅度响应将得到的方向信息量化到4个区间,该方法取得了较好的识别效果。Lunke 等[7]针对文献[5]只提取最大响应从而对于噪声和旋转鲁棒性差的缺点,提出了双方向编码(Double- Orientation Code,DOC)的方法,同时使用最大和次大两个响应,并使用非线性匹配的方法匹配图像得到了较高的鲁棒性。上述方法在编码之前,都采用Gabor滤波器提取方向信息,该滤波器是一种用于边缘检测的线性滤波器,其在空间域和频率域都具有最优的局部化特性,可以很好地描述尺度、空间位置和方向等特征,因此在图像识别和机器视觉中得到了广泛的应用。掌纹不同于一般图像,具有对比度低、亮度低、线条曲率小且变化不大等特点,同时由于采集方式的特点,易受到噪声和散焦等因素的影响,而Gabor滤波器并不是根据最优准则设计的,其输出的信噪比较小,所以对于噪声不具备较好的鲁棒性。
本文针对上述问题,使用匹配滤波器来提取掌纹图像中的方向信息,并使用DOC编码方式进行编码识别。匹配滤波器是基于最大信噪比准则的最佳线性滤波器,当输入信号被加性噪声污染时,该滤波器具有输出信号信噪比最大的特点,从而提高系统的抗噪性能。实验结果也表明,本文提出的算法对于噪声具有很好的鲁棒性。
掌纹图像散焦是一种退化的过程,可以看作是原始图像和退化函数的卷积,再受到各种噪声影响的结果,其一般的模型如图1所示。对于具有空间移不变性质的退化函数而言,其退化过程可以表示为
(1)
其中:f(i,j)为清晰的原始图像;h(i,j)为退化函数;n(i,j)为加性噪声;*表示卷积符号。
图1 掌纹图像退化模型
从式(1)和图1可以看出,在图像散焦的过程中,退化函数起着主导作用。文献[8]给出了多种退化函数,其中具有较强理论基础、并能很好地描述大多数散焦情况的是高斯散焦退化模型(Gaussian Defocus Degradation Model,GDMM),其表达式为
(2)
其中,σ为滤波器的采样长度,用以调节图像散焦的程度,σ越大,滤波器的采样长度越大,图像越模糊。图2为不同σ的散焦掌纹图像。
图2 不同σ的散焦掌纹图像
首先考虑一维信号的情况,对于受加性高斯噪声n0污染的输入信号s(t),通过滤波器H(w)后,其输出信号so(t)为
(3)
其中:S(w)是输入信号s(t)的傅里叶变换;η(w)为噪声的频谱;H(w)为系统频率响应。对于平稳信号而言,其输出信号也是平稳的,其功率谱密度Po(w)等于输入信号的功率谱密度Pi(w)乘以系统频率响应的模的平方,即
(4)
将噪声no带入式(4),噪声的平均功率No为
(5)
因此,在抽样时刻t0上,输出信号的瞬时功率和噪声的平均功率之比为
(6)
为了求出r0的最大值,使用以下施瓦茨不等式:
(7)
当f(x)=g(x)时,式(7)中等号成立,即H(W)=S*(W)e-jwt0,h(t)=s(t0-t)时输出信号的瞬时功率和噪声的平均功率比值最大。本文算法中,因为没有传输带来的延时,即t0=0,所有使用的最佳滤波器为h(t)=s(-t)。
对于二维图像信号,s(t)推广为s(x,y),s(x,y)表示待处理的掌纹图像,(x,y)为像素点坐标。掌纹图像具有类似于二维高斯函数的特点,离中心点距离越大,掌纹线越浅,线条也越细,因此可以使用高斯核函数来描述掌纹,即
(8)
其中:d表示像素点与中心的欧氏距离;δ表示该点亮度。
在一般的通信系统中,如果要传送多个不同的信号si(t),i=1,2,…,n,那么首先要将接收到的信号通过n个匹配滤波器,如果第j个滤波器得到的响应最大,则可以认为发送的是sj(t)。本文中,滤波器响应最大等价于输出信噪比最大。由上述可知,为使输出信噪比最大,匹配滤波器必须和输入信号有着相同的波形。对于掌纹图像,决定其波形的主要因素是其宽度和方向,但是每个人的掌纹宽度基本一样,区分度很小,所以可以认为方向能唯一确定其波形。匹配滤波器只有在与掌纹方向垂直时才能取得峰值,所以需要旋转滤波器,从而确定掌纹的方向。旋转矩阵为
(9)
其中:θ表示旋转的角度;i表示第i次旋转。本文中,每15°旋转一次滤波器,因为在每个采样的小区间内,可以认为掌纹是中心对称的,所以只需要在半个圆周内旋转滤波器就可以扫描到360°的所有可能方向,因此本文共选取12个不同方向的滤波器。
(10)
(11)
其中A为邻域N中的像素点数。图3~图4分别给出了45°和90°的匹配滤波器。
图3 45°的匹配滤波器
此外,邻域N的大小对于提取出的特征有着重大的影响,图5给出了3组邻域的提取效果。
比较3组图片可以看到,图5中第1行的3张图的效果都比较差,图5(a)只能模糊地看到3条主要的掌纹,周围较细的纹理都丢失了,而且边缘部分已经变成黑色的边框;图5(b)更为模糊,主要纹理之外的其他纹理信息完全丢失,纹理不太能分辨出来;图5(c)则3条主要的纹理都丢失了,显然不能作为特征图像使用。第2行的3张图的效果比第1行要好,图5(d)中3条主要纹理较为清晰,但是和周围较细的纹理区分度较小;图5(e)效果已经比较好了,主要纹理清晰,与周围细节的区分度也较好。图5(f)效果要稍微差一些,主要纹理差别不大,周围的小细节稍微模糊一些。第3行的3张图的效果比第2行差,3张图都不能提取出3条主要纹理,特别是图5(i)中主要纹理已经难以和背景区分开来了。所以本文使用δ=2,L=8来提取特征,此时提取出的特征最为清晰(图5(e))。
图4 90°的匹配滤波器
图5 不同参数条件下匹配滤波器所提取的特征
目前的编码方法大多使用Gabor滤波器最大的响应,这样虽然可以较好地得到掌纹的方向,但是在提取掌纹图像的过程中,不可避免地会受到各种各样噪声的影响,从而影响滤波器的响应。本文使用的匹配滤波器也会受到同样的影响,如图6所示。
图6 噪声对滤波器响应的影响
当无噪声影响时,滤波器得出的响应如图6(a)所示,得到的最大响应方向为0°;当加入E=0,D=0.5的高斯噪声后,最大响应方向变成了45°,即只采用最大响应方向时,结果对噪声十分敏感。
然而,噪声的影响并不是无规律的,一般总是在原来方向两侧不大的范围内变化,又因为常用的编码方法每15°~20°选取一个滤波器,所以选取最大和次大两个方向进行编码便可以有效地解决噪声问题。本文使用的编码公式如下:
a,b=p,s
(12)
其中:Op,Os分别为最大和次大响应;n为滤波器总方向数;i,j分别是测试图像和训练图像。
其次,最大响应和次大响应对于最后的比较结果影响程度是不一样的,离最大响应方向越近,权重应该越大,所以使用指数函数来得到非线性的权重。
(13)
其中k是由滤波器的方向总数决定的常数,当n=6时,k=1.6;当n=12时,k=1。
由测试图像和样本图像一共可以得到4个编码值,将其分成两组,两张图的最大响应分成一组,次大的分成另一组,将其权重值相加,得到的两组编码值分别为
p1_score=score(code_pp)+score(code_ss)
(14)
p2_score=score(code_ps)+score(code_sp)
(15)
然后选取两个编码值中较大的值作为两张图像相似程度的评价依据,
score_final=max(p1_score,p2_score)
(16)
最后需要归一化结果提高图像对光照变化的鲁棒性:
M,N=size(score_final)
(17)
式中match_score就是最终的相似程度,match_score∈[0,1],该数值越高相似程度越高,当match_score≥0.5时可以认为两张图片属于同一个人;当match_score=1时,两张图片完美匹配。
本文使用标准掌纹数据库PolyU(v2)进行实验,该数据库包括386人的手掌图片,每人20张,总计7 752张,分成两组,两次采样的间隔时间为2个月,两次采样的光照条件有所不用。从两组图像中各取出一张图作为训练集,剩下的全部作为测试集,每张测试图和所有的训练图片只做计算相似程度,相似度最高的图所属的组就是识别出的结果,如果测试图像与第n组的训练样本相似度最高,那么识别结果就是该测试图像属于第n组,如果其本来就是第n组的图则识别结果正确,否则就是错误。
首先在无噪声的情况下,比较文献[7]、文献[9]和本文算法的正确识别率,3种算法都取得了90%以上的识别率,其中本文算法的正确识别率最高,比较结果见表1。
表1 无噪声时的识别率
另外,为测试算法对于散焦的鲁棒性,对图1中不同散焦程度的图像进行测试,表2示出了各算法的识别率。
表2 散焦图像的识别率
从表2可以看出,文献[9]的鲁棒性相对较差,当σ=4时识别率已经下降到80.6%,不能有效地实现识别。文献[7]和本文算法由于都使用了DOC编码方法,在图像散焦程度增加时,识别率下降程度较小,特别是本文算法,在σ=10时,对于散焦严重、模糊不清的图像依然能达到94%以上的识别率。
最后,为测试算法对于噪声的鲁棒性,分别对图像加入高斯和胡椒噪声。表3示出了图像被不同浓度的胡椒噪声污染时,各算法的识别率。表4则示出了图像被不同的高斯噪声污染时各算法的识别率。
从表3和表4可以看出,文献[9]算法对于高斯和胡椒噪声都很敏感,加入1%的胡椒噪声时识别率下降到89.0%,而加入E=0,D=0.005的高斯噪声时识别率更是下降到只有53.2%,可见其抗噪性能较差。文献[7]算法在噪声不大时能得到可以接受的识别率,但随着噪声强度的增加,识别率迅速下降。当加入E=0,D=0.05的高斯噪声时,识别率大幅度下降,只略高于80%。文献[7]的方法虽然较文献[9]有所提高,但其抗噪性能依然不尽人意。相对而言,本文算法有着较好的抗噪声性能,在加入E=0,D=0.05的高斯噪声时,其他算法的识别率已经下降到80%以下,本文算法依然能保持92.0%的识别率,可见其良好的抗噪性能。图7、图8分别示出了不同算法在胡椒和高斯噪声的鲁棒性表现。
表3 图像被胡椒噪声(浓度%)污染时的识别率
表4 图像被高斯噪声(方差σ2)污染时的识别率
图7 胡椒噪声时的鲁棒性
图8 高斯噪声时的鲁棒性
最后,为测试平移变换时的鲁棒性,本文将图像向上下左右分别平移5个像素点,表5列出了各算法在平移变换时的识别率。
表5 像素点平移时的识别率
从表5可以看出,由于仅仅平移5个像素点,各算法的识别率都还在可接受的范围内。文献[9]算法的效果比文献[7]要好,在上下平移的情况下,识别率下降的不多,而左右平移时则下降明显,这是因为所使用的掌纹图像是纵向的,左右平移时只是掌纹的位置有所变化,其形态没有变化,而上下平移时则会改变掌纹的形态,所以识别率有所不同。值得注意的是本文算法几乎不受平移的影响,上下平移和左右平移时识别率最多只下降了0.4%,可以认为本文算法有着不错的抗平移攻击性能。
一种有效的掌纹识别算法不但要有良好的识别率和鲁棒性,运算量也要尽可能小,以满足实时性要求。本文在3.4GHZCPU,16GB内存的台式机,Matlab2014a实验平台进行仿真实验,各算法识别一张图像所需的计算时间见表6。
表6 各算法的计算复杂度
表6表明,文献[9]的方法具有最小的计算量,识别一张图像平均需要0.5 s左右;本文算法虽然略好于文献[7],但是平均2.7s以上的处理时间较文献[9]要多。
本文提出了一种基于二维匹配滤波器的掌纹识别算法,该算法使用更适合于掌纹特点的匹配滤波器,提取出信噪比最大的方向特征;使用双方向编码的方法,解决了传统方法因为只使用滤波器的最大响应方向作为特征,从而易受到诸如噪声和平移的影响,导致识别率降低的问题。实验结果表明,本文算法不但在无噪声情况下有着高于其他算法的识别率,对于高斯和胡椒噪声也有着十分良好的抗噪性能。但本文的计算量相较于其他算法有所增加,如何降低计算量将是下一步的研究重点。
[1]岳峰,左旺孟,张大鹏.掌纹识别算法综述[J].自动化学报,2010,36(3):353-363.
[2]SHU W,ZHANG D.Palmprint verification:An implementation of biometric technology[C]//Proceedings of the 14th International Conference on Pattern Recognition.Brisbane,Australia:IEEE,1998:219-222.
[3]林森,苑玮琦.离焦状态下的模糊掌纹识别[J].光学精密工程,2013,21(3):734-741.
[4]DAUGMAN J G.High confidence visual recognition of persons by a test of statistical independence[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1993,15(11):1148-1161.
[5]ZHANG D,KONG W K,YOU J,etal.Online palmprint identification[J].IEEE Transactions on Pattern Anal,2003,25(9):1041-1050.
[6]KONG A,ZONG D,KAMEL M.Palmprint identification using feature-level fusion[J].Pattern Recognition,2006,39(3):478-487.
[7]LUNKE F,YONG X,TANG W.Double-orientation code and nonlinear matching scheme for palmprint recognition[J].Pattern Recognition,2016,49:89-101.
[8]曹茂永,孙农亮,郁道银.离焦模糊图像清晰度评价函数的研究[J].仪器仪表学报,2001,22(Z2):259-268.
[9]洪丹枫,潘振宽,苏健,等.VO图像分解模型的模糊掌纹识别方法[J].计算机辅助设计和图形学学报,2014,26(10):1737-1746.
Palmprint Recognition Based on Two-Dimensional Matched Filter
GU Xiao-feng, ZHU Hong-qing
(School of Information Science and Engineering,East China University of Science and Technology,Shanghai 200237,China)
As one of the palmprint recognition algorithms,the Gabor filter and orientation code based method has obtained widely researches and applications.However,this class of method is easily influenced by noise and defocus.Aiming at the above shortcoming,this paper proposes a 2D matched filter based method,which firstly uses the match filter to extract features and then,employs the double-orientations code (DOC) scheme to encode the result of filter and measure the similarity of palmprint.The experimental results show that the proposed method is robust against noise,defocus and translation,which verifies the effectiveness of the proposed method.
2D matched filtered; double-orientations code; palmprint recognition
1006-3080(2017)01-0090-07
10.14135/j.cnki.1006-3080.2017.01.015
2016-04-25
国家自然科学基金(61371150)
顾晓峰(1989-),男,上海人,硕士生,研究方向为图像处理与模式识别。E-mail:505682879@qq.com
朱宏擎,E-mail:hqzhu@ecust.edu.cn
TP391.4
A
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!