推广的PCA及其在人脸识别中的应用*

时间：2024-07-28

黄昉,刘金琨,张宝昌

（北京航空航天大学自动化与电气工程学院，北京100191）

人脸识别是模式识别研究领域的重要课题，也是一个目前非常活跃的研究方向[1,2]。它一般可描述为：给定一个静止或视频图像，利用已有的人脸数据库来确认图像中的一个或多个人。近年来，关于人脸图像线性鉴别分析方法的研究激起了人们的广泛兴趣，其焦点是如何抽取有效的鉴别特征和降维。特征抽取研究肩负两方面的使命：寻找针对模式的最具鉴别性的描述，以使此类模式的特征能最大程度地区别于彼类；在适当的情况下实现模式数据描述的维数压缩，当描述模式的原始数据空间对应较大维数时，这一点会非常有意义，甚至必不可缺[3]。

在人脸图像识别中，主成分分析PCA(Principal Component Analysis)[4]，又称 K-L变换，被认为是最成功的线性鉴别分析方法之一，目前仍然被广泛地应用在人脸等图像识别领域。本质上PCA方法的目的是在最小均方意义下寻找最能代表原始数据的投影。SIROVICH和KIRBY最初使用PCA有效地表示人脸[5]。由于人脸结构的相似性，他们认为可以收集一些人脸图像作为基图(特征图)，任何人脸图像可以近似地表示为该人脸样本的均值与部分基图的加权和。1991年，TURK和 PENDAND提出了著名的 “Eigenfaces”方法。1997年，BELHUMEAR P N、HESPANHA J P、KRIENGMAN D J在主成分分析的基础上又给出了“Fisherfaces”方法。

以上方法在处理人脸等图像识别问题时，遵循一个共同的过程，即首先将图像矩阵转化为图像向量，然后以该图像向量作为原始特征进行线性鉴别分析。由于图像矢量的维数一般较高，比如，分辨率为100×80的图像对应的图像向量的维数高达8 000，在如此高维的图像向量上进行线性鉴别分析不仅会遇到小样本问题，而且经常需要耗费大量的时间,有时还受研究条件的限制(比如机器内存小)，导致不可行。针对这个问题，人们相继提出不少解决问题的方法。概括起来，这些方法可分为以下两类：从模式样本出发，在模式识别之前，通过降低模式样本特征向量的维数达到消除奇异性的目的,可以降低图像的分辨率实现降维；从算法本身入手，通过发展直接针对于小样本问题的算法来解决问题[6,7]。

本文基于主成分分析的思想，从原始数字图像出发，在模式识别之前，先对整个图像训练矩阵集进行分块，该块中的图像尽可能具有同样的性质，从而更接近于高斯分布;再用PCA方法对每个分块得到的子图像训练矩阵进行分析，得到多个变换矩阵，通过这些变换矩阵将训练图片向量和测试图片向量投影到特征空间进行鉴别。这样做主要基于如下考虑:在传统的PCA算法中，要求训练集符合高斯分布，得到的结果才是理想的，但是实际操作中训练样本由于光照、表情、姿态等因素远离高斯分布，而改进的PCA算法通过对其进行归类训练子训练集(由于影响因素较小，更接近于高斯分布)提取主元，同时该方法可以增加主元的维数，能提供更多的有效特征。在著名的FERET人脸库上的试验结果表明，本文提出的方法在识别性能上明显优于传统的PCA方法，识别率有显著提高。

1 传统PCA方法

1.1 传统PCA思想与最优投影矩阵

主成分分析是寻求有效的线性变换的经典方法之一，其目的是在最小均方意义下寻找最能代表原始数据的投影方向，从而达到对特征空间进行降维的目的。为下面行文方便，首先介绍向量化矩阵的概念。

定义：若 A∈Rm×n，则 Vec(A)∈Rmn×1。

这是把矩阵A按列向量依次排成的向量，通常把这个程序叫矩阵A的向量化。

设人脸灰度图像的分辨率为m×n，则该图像构成一个m×n的图像矩阵，可以将图像矩阵向量化为mn维的图像向量 ξ,即 ξ=Vec(A)∈Rmn×1。

设训练样本的类别有C个。第i类有训练样本图像M 个：ξi1,ξi2,…,ξiM，每个样本都是 mn×1 向量，N=C×M 为训练样本的总数。

将训练样本图像组成训练矩阵集：定义：对训练样本矩阵X_sample减去平均列向量得到标准训练样本矩阵集：

对 XTX 求降序的特征值矩阵 V=[λ1,λ2,…,λn],其中λ1>λ2…>λn，与之对应的特征向量 P=[p1,p2,…,pmn]。此时的P称为最优投影向量组，其物理意义是图像向量在P方向上投影后得到的特征向量的总体分布散度最大。P的列向量P=[p1,p2,…,pmn]就是新坐标系中的基向量。

1.2 特征抽取

原始图像的维数较大，不利于直接用于分类，必须对原始数据进行降维。如何找出能代表原始图像的低维数据是进行分类的关键。

最优投影向量组的前 d个列向量 Pd=[p1,p2,…,pd]可用于特征抽取，对于向量化的图像矩阵ξ，利用公式：

其中Yd∈Rd×1是在特征空间中的坐标。这样，就能够将原始mn维的数据降维到d维的数据。

1.3 分类

通过前文的特征抽取过程，每个训练图像向量ξij对应一个特征向量Yij=PdTξij,对每一个测试图像向量 ξx对应一个特征向量Yx=PdTξx。利用余弦分类器计算：

如果 d(Yij,Yx)=max d(Yij,Yx),则 ξx∈ξi,i是类别序号。

2 推广的PCA方法

2.1 思想与最优投影矩阵

传统PCA的模型中存在诸多的假设条件，决定了它存在一定的限制，在有些场合可能会效果不好甚至失效。传统的PCA算法要求标准训练样本矩阵符合高斯分布，也就是说，如果考察的数据的概率分布并不满足高斯分布或是指数型的概率分布，那么PCA将会失效。在这种模型下，不能使用方差和协方差来很好地描述噪音和冗余，对教化之后的协方差矩阵并不能得到很合适的结果。

2.2 特征抽取

对[P1,P2,…,Pk]中的每一个变换矩阵都可以抽取前dn个列向量，重新组成新的变换矩阵[P1d1,P2d2,…,Pkdk]，通过公式：

可进行对特征空间的投影，Yd是在ξ特征空间中的坐标。

2.3 分类

推广的PCA分类与传统的PCA分类类似,只是将传统的变换矩阵 PdT转换为[P1d1,P2d2,…,Pkdk]T，在新的特征空间中对特征向量利用余弦分类器进行分类。

3 实验结果与分析

实验是在FERET人脸库上进行的。FERET人脸库由200个人、每人7幅图组成：第1幅图是人脸的正面照，第 2～5幅图是人脸角度的变换，第6幅图表情的变换，第7幅图是亮度的变化。每幅图的分辨率是80×80。图1是FERET人脸库的某一人的7幅图像。

FERET数据库中每张图片都有一个类别标号，代表其不同因素下采集的图片，比如标号00012_930831_fa_a，其中 00012表示类别 ID，930831表示样本生成时间，fa表示人脸偏转角度，a表示光照强度。本文的实验就是根据不同的图像标号来划分数据集合，从而达到外在因素较少的情况下，数据尽可能地满足简单的高斯分布。

将每类的前4幅图作为训练样本，后3幅图作为测试样本，这样训练样本总数为800，测试样本为 600。首先，利用传统的PCA算法，即不对标准训练样本矩阵集进行分块，计算出不同能量系数下的识别率。再利用推广的PCA算法，分别实验两种情况：(1)将各个类训练样本的前两幅图组合为训练样本矩阵1，将各个类的训练样本的第3、4幅图组合为训练样本矩阵 2，这样就将传统PCA中的训练矩阵集分为两个子训练矩阵集。对这两个子训练矩阵集进行计算得到变换矩阵[P1,P2]。再将测试样本和训练样本通过[P1,P2]投影到特征空间，对不同能量系数的情况计算得到识别率。(2)将每类的4个训练样本图片分别组合为四子训练矩阵集，然后用同样的方法计算识别率。得到的实验结果如图2所示。

本文分别采用余弦分类器进行分辨率的计算。从图中可以看出，对推广的PCA的具体应用其识别率均优于传统的PCA方法。进一步分析其原因：推广的PCA通过对标准训练样本矩阵集进行分块，对每一个子训练矩阵集抽取主元，虽然单个子训练集抽取的主元维数可能比较低，但是由于有多个子训练矩阵集，所以总体看来其抽取的主元维数还是较传统的PCA主元维数多，因此能提高识别的精度。表1为当能量系数为0.9时不同方法抽取的主元维数。

表1 不同方法抽取的主元维数

本文提出了推广的PCA的人脸识别方法，其本质是通过对标准训练样本矩阵集做分块，并对其子块分别作PCA，抽取子块的主元。这样做是为了使影响因素较小，更接近于高斯分布，并且提高了主元的维数，在分类器进行分类时能够更好地减少误差，便于模式识别。本实验使用环境为 Microsoft Windows XP,硬件配置为Petium4，3.0 GHz CPU的计算机,优化算法采用Matlab编写。

在试验中发现，对同一数据库，对样本矩阵采用不同的分块，获得的最高识别率一般不同，如何寻求最佳分块方式有待进一步研究。

[1]ZHAO W,CHELLAPPA R,PHILLIPS P J,et al.Face recognition:A literature survey[J].Acm Computing Surveys,2003,35(4):399-459.

[2]TURK M,PENTLAND A.Face recognition using eigenfaces[A].Proc.IEEE Conference on Computer Vision and Pattern Recognition[C].USA,Howaii,Maui:IEEE,1991:586-590.

[3]徐勇.几种线性与非线性特征抽取方法及人脸识别应用[D].南京：南京理工大学，2004.

[4]边肇祺，张学工.模式识别(第 2版)[M].北京：清华大学出版社，1999.

[5]陈伏兵.人脸识别中鉴别特征抽取若干方法研究[D].南京：南京理工大学，2006.

[6]TURK M,PENTLAND A.Eigenfaces for recognition[J].Journal of Cognitive Neurosciences,1991,3(1):77-86.

[7]ZHOU Ji Liu,ZHOU Ye.Research advances on the theory of face recognition[J].Journal of Computer Aided Design and Computer Graphics,1991,11(2):180-184.