时间:2024-09-03
陈海霞,崔 茜
(1.通化师范学院物理学院,吉林 通化 134002;2.国家知识产权局专利局专利审查协作天津中心,天津 300304)
基于Gabor小波和PCA的人脸识别
陈海霞1,崔 茜2
(1.通化师范学院物理学院,吉林 通化 134002;2.国家知识产权局专利局专利审查协作天津中心,天津 300304)
针对人脸识别中采集到的图像由于受光照、表情变化、脸部部分遮挡等因素影响而导致识别率低的问题,将Gabor小波多尺度、多方向的滤波特性和主成分分析(PCA)的降维特性相结合,提出一种对脸部整体特征进行提取的GPCA算法.通过将该算法应用于ORL人脸库、Yale人脸库和AR人脸库中的人脸识别,证明了该方法的有效性.
人脸识别;Gabor小波;PCA;GPCA
人脸识别作为生物特征识别技术(指纹识别、掌纹识别、语音识别、虹膜识别等)之一,以其可采集性高、易于接受等特点被广泛应用于国家安防、身份鉴定和人机交互等系统中[1-2].
20世纪90年代以来,人脸识别技术迅速发展,涌现了一批人脸识别代表算法和可供评测的标准人脸库.这些识别算法大致可分为两类[1,3]:
(1) 基于几何特征的识别方法.其基本思想是提取人脸面部的关键部位如眉毛、眼睛、鼻子、嘴巴等形状和几何关系作为特征进行识别[4].
(2) 基于代数特征的识别方法.将人脸看成一个整体,即一幅灰度图像可以视为二维模式,通过数学上的统计方法找到最佳匹配.
其中比较典型的算法有基于特征脸的PCA方法、基于Fisher脸的线性判别分析(LDA)方法以及独立元分析(ICA)方法等.
PCA方法是人脸识别中最基本也是最常见的方法,目前很多的人脸识别算法都是对这种方法的改进或与其他方法的综合.在人脸识别过程中,这种方法考虑的是样本整体特征,通过抽取人脸的主要成分,构建特征脸空间,对比人脸图像进行识别.由于其降维和特征提取方面的有效性,在人脸识别领域得到广泛应用.
受采集人脸图像时环境光照等因素影响,传统的代数方法很难达到较高识别率[4-5].Gabor小波变换呈现为频率和方向的多尺度变换,并且与人类视觉感受野剖面非常相似[2,6],因此Gabor滤波器被用于提取图像局部纹理特征或对整体图像进行卷积得到Gabor滤波后的图像[7-10].将Gabor统计纹理特征用于人脸识别,可以很好地消除外界环境对识别正确率的影响,具有更强的鲁棒性[4].本文将Gabor小波和PCA方法结合起来,对人脸图像进行一组Gabor小波卷积,然后通过PCA降维,完成人脸识别过程.
1946年,Gabor提出了一维的Gabor函数,此后为了进一步描述哺乳动物视觉神经元感受野,Dogmas于20世纪80年代提出了一组具有不同参数的2D Gabor 滤波器[10],这组滤波器从频率和方向更接近人类视觉感受野[1].Gabor小波能够很好地解决由于光照强度和人脸表情等变化引起的图像问题,因此在人脸识别领域获得了广泛的应用.
2D Gabor小波定义为
(1)
其中:μ和ν分别表示Gabor滤波器的方向和尺度;z=(x,y)为图像某一像素点坐标;‖·‖表示范数[14];σ为高斯包络;kμ,ν控制高斯窗的宽度、震荡部分波长以及方向,定义为
kμ,ν=kνeiφμ.
(2)
其中:kν=kmax/fυ为滤波器采样频率,kmax为最大频率,fυ为限制频域中核函数距离的间隔因子.
在图像处理中,图像的Gabor小波表达方法为某一图像与公式(1)定义的Gabor核的卷积,表示为
Iμ,ν(z)=I(z)×Ψμ,ν(z).
(3)
其中:Iμ,ν(z)表示卷积后的结果;I(z)表示原图像;Ψμ,ν(z)表示Gabor核幅值特性.为了使Gabor变换包含不同频率、方向的信息,定义Iγ为特征矢量,那么原图像与Gabor核卷积后的矢量可以表示为
Iγ=((I0,0)T(I0,1)T…(I4,7)T)T.
(4)
对5个不同尺度和8个方向Gabor核幅值变化与图像分别卷积,得到40个不同参数的Gabor小波图像,将这40个矢量通过公式(4)组合成新的矢量,然后进行PCA降维[8].图像与Gabor小波幅值特性卷积结果见图2.
图1 Gabor核幅值部分
图2 原图像与Gabor小波幅值卷积结果
PCA方法是统计学中一个重要的分析理论,也是被广泛使用的人脸识别方法之一[9].其方法主要是通过对协方差矩阵进行特征分解[12],以得到数据的主成分(即特征向量)与它们的权值(即特征值).将高维人脸图像经过PCA变换投影到特征子空间,使得数据在一个低维的特征空间里被处理,减少数据冗余的同时保留原始数据的绝大部分信息,解决了数据空间维数过高所产生的计算复杂度等问题[13].
将原始二维图像表示为一维矩阵的形式,即M个N阶矩阵(N为原图像的行乘以列),具体可以表示为:
xi=[p1…pN]T,i=1,…,M.
(5)
其中:M表示图像个数,xi表示一维矩阵,pj表示某一像素点的值.运用PCA进行人脸识别可以分为训练和识别过程,训练过程流程图如图3所示.图3中:Ωi=wTdi(i=1,2,…,r),w=(u1,u2,…,ur),r为特征值个数(降维后维数);A=(d1,d2,……,dM).
测试过程中,按照训练步骤将待识别图像投影到特征脸空间,并按照欧氏距离判别特征空间中待识别样本与训练样本的相似度.
GPCA人脸识别算法是将每幅人脸图像分别进行5个尺度、8个方向的Gabor小波变换,即假设人脸图像可以表示为m×n维矩阵,那么对于一幅图像与40个Gabor幅值卷积的结果可以表示为一个m×n行40列的二维矩阵,将得到的矩阵当作PCA的输入,并按照PCA训练识别过程进行识别.本文选用ORL,Yale和AR 3个人脸库样本进行算法测试.GPCA算法流程图如图4所示.
图3 PCA训练流程
图4 GPCA算法流程图
本文基于OpenCV视觉库采用C++编程,对ORL人脸库(光照不变,姿态表情变化)、Yale人脸库(光照、姿态、表情都变化)和AR人脸库(表情、光照、姿态变化以及有遮挡、有老化)分别进行了PCA和GPCA算法的人脸识别.ORL库选用200个训练样本和200个测试样本,Yale库选用90个训练样本和75个测试样本,AR库选用280个训练样本和280个测试样本分别进行识别.识别结果如图5所示.
图5 3种方法识别结果
从实验结果可以看出,GPCA在特征维数为1的时候识别率低于PCA,但是随着特征维数增大GPCA的识别率已经明显好于PCA算法.可见,人脸识别中GPCA比PCA更有优势.
[1] 崔茜. 基于Gabor小波和主成分分析的人脸识别算法研究 [D]. 长春:东北师范大学,2014.
[2] SHEN LINLIN,BAI LI. Gabor feature based face recognition using kernel methods [C]//Proceedings of the Sixth IEEE International Conference on Automatic Face and Gesture Recognition,Seoul Korea:Browse Conference Publications,2004:170-176.
[3] JIAN HUANG LAI,YUEN P C,GUO CAN FENG. Face recognition using holistic fourier invariant features [J]. Pattern Recognition,2001,34:95-109.
[4] 余磊. Gabor小波变换在人脸识别中的应用研究[D]. 重庆:重庆大学,2009.
[5] 曾岳. 人脸识别方法的研究[D].西安:西安电子科技大学,2011.
[6] LEE T S. Image representation using 2D gabor wavelets [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(10):959-971.
[7] LADES MARTIN,VORBRUGGEN J C,JOACHIM M BUHMANN,et al. Distortion invariant object recognition in the dynamic link architecture [J]. IEEE Transactions on Computers,1993,42:300-311.
[8] WU HAIYUAN,YOSHIDA YUKIO,SHIOYAMA TADAYOSHI. Optimal gabor filters for high speed face identification [J]. Proc of Int Conf on Pattern Recognition,2002(1):107-110.
[9] NEEHARIKA GUDUR,VIJAYAN ASARI. Gabor wavelet based modular PCA approach for expression and illumination invariant face recognition [C]//35thApplied Imagery and Pattern Recognition Workshop IEEE,USA:Washington DC Publications,2006:11-13.
[10] LIU CHENGJUN,WECHSLER HARRY. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition [J]. IEEE Trans. Image Processing,2002,11(4):467-476.
[11] DAUGMAN J G. Two-dimensional spectral analysis of cortical receptive field profile [J]. Vision Research,1980,20:847-856.
[12] ABDI H,WILLIAMS L J. Principal component analysis [J]. Wiley Interdisciplinary Reviews:Computational Statistics,2010,2(4):433-459.
[13] 李文革. 基于主成分分析的人脸识别[D]. 济南:山东大学,2008.
[14] 任芳国,高莹. 随机矩阵的范数[J]. 东北师大学报:自然科学版,2012,44(1):28-29.
(责任编辑:石绍庆)
Face recognition of the Gabor wavelets and PCA
CHEN Hai-xia1,CUI Qian2
(1.College of Physics,Tonghua Normal University,Tonghua 134000,China;2.Patent Examination Cooperation Tianjin Center of the Patent Office,SIPO,Tianjin 300304,China)
Aiming at the problems that face recognition rate gets low because of the influence of light conditions,facial expression and partial occlusion during face images acquisition,a method (GPCA) combining the multi-scale and multi-direction characteristic of the Gabor wavelet filters with the dimension reduction characteristic of the Principal Component Analysis (PCA) is proposed to extract the global facial features for recognition. The effectiveness of the method is proven by being applied to recognize faces from ORL,Yale and OR databases.
face recognition;Gabor wavelets;PCA;GPCA
1000-1832(2014)04-0077-04
10.11672/dbsdzk2014-04-014
2014-06-18
吉林省科技发展重点支持项目(20100458).
陈海霞(1974—),女,副教授,主要从事模式识别与信号检测领域的理论与应用研究.
TP 391.1 [学科代码] 520·6040
A
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!