基于多尺度核索引字典的飞机目标检测优化仿真

时间：2024-05-04

陈滨赵建军杨利斌王毅

(海军航空工程学院兵器科学与技术系山东烟台 264001)

陈滨赵建军杨利斌王毅

(海军航空工程学院兵器科学与技术系山东烟台 264001)

为进一步提高基于图像稀疏表示的飞机目标检测算法的时间性能与精确度，提出了基于多尺度核索引字典的飞机目标检测算法，分别从超完备字典结构、目标检测分类器结构两方面优化算法。首先引入基于高斯径向核函数的硬C聚类方法，构造核索引字典，在提升稀疏求解算法时间性能的同时，提高了索引字典原子聚类的准确度。接着基于核索引字典，构建多尺度分类器，进一步提高了算法的效率和精度。实验表明，在合理选择聚类数后，采用核索引字典有效降低了稀疏求解算法的时间开销，原子的聚类准确度有所提高；相对基于单尺度字典的飞机目标检测算法，基于多尺度核索引字典的算法在时间开销上平均降低至24.7%，在精度方面，误检率平均降低了20.3%，命中率平均提高了3.4%，满足实时应用要求。

飞机目标检测核聚类索引字典多尺度稀疏表示

0 引言

空中飞机目标识别系统的研究在国内起步较晚，尚处于探索阶段。目前已经开展的飞机识别方面的研究，主要是通过提取目标特征，建立相应的数据库，实现对目标的识别，集中在对遥感图像中的飞机目标进行识别。

文献[1]提出了可见光图像中飞机目标的5个典型识别特征的提取方法，并利用模糊识别方法对飞机目标进行识别。文献[2]采用融合奇异值分解与中值滤波的方法实现飞机目标图像的增强，并采用基于边缘检测与形态学修复的方法实现飞机目标检测。文献[3]提取了训练样本图像库中飞机图像特征量建立十类飞机目标的特征库，并分别用最小距离分类器、神经网络分类器和树分类器对样本图像库中的飞机目标进行分类。文献[4]提出一种基于图像熵和形状特征融合的飞机检测算法，采用图像熵获得飞机目标的疑似区域后，将目标的多特征加权融合成新的特征向量，并采用支持向量机来完成遥感图像中飞机目标的检测与识别。

在飞机目标识别的关键技术中，飞机目标检测是目标识别、跟踪等高级应用的基础[5]。由于飞机目标的高机动性以及天空背景的复杂性，背景差分法、帧差法等传统目标检测方法遇到了较大的挑战。近年来发展起来的稀疏表示理论为目标检测的研究提供了一种新的思路[6]。

文献[7]以局部图像块为样本，对不同的样本训练单独的字典使得每类样本对该类别字典的重构误差较小。在相同稀疏性约束下，分别采用各类别的字典将测试样本进行稀疏编码，并根据重构误差大小进行判别分类。文献[8]提出了稀疏表示分类器(SRC)，将所有类别的训练样本进行组合，得到单个字典，通过计算测试样本的稀疏系数向量在原字典上进行重构，并计算各类别下的重构误差，完成目标分类任务。基于上述两种思路，提升基于稀疏表示目标检测算法的性能成为了当前研究的热点。文献[9]采用最大相关熵准则赋予各像素以不同的权重，对其中遮挡或损毁的区域赋予小权重，降低这部分区域在检测识别过程中的作用，提高了SRC的鲁棒性。文献[10]对SRC进行改进，通过训练样本学习类别子字典来代替原始训练样本字典，利用了稀疏系数向量的Fisher准则减小稀疏系数向量的类内方差并增大类间方差，并利用两者差值构造代价函数，从而使得类别子字典更具判别性。

一些研究将稀疏表示理论应用于飞机目标检测中。文献[11] 将飞机图像识别问题转化为求解待识别飞机图像序列关于训练飞机图像序列的稀疏表示问题，利用稀疏表示系数对飞机目标识别。文献[12]构建飞机几何原子库并求解飞机轮廓几何逼近最优化方程，在稀疏表示原理框架下得到飞机轮廓几何部件的最优组合，并根据显著图定位出飞机。

本文对基于稀疏表示的飞机目标检测算法进行优化，旨在提升目标检测的时间性能及提高检测精度。在稀疏求解过程中引入核索引字典，优化字典结构，在提高OMP类算法求解效率的同时，提高索引字典构造的准确度；在图像块分类的过程中，通过构造多尺度分类器，减少稀疏求解次数，降低目标分类的总时间开销，同时利用多尺度的优势，提高目标检测的精度。

1 基于稀疏表示的目标检测

1.1 图像的稀疏表示

稀疏编码的本质是由少量的基向量线性逼近目标向量，其中，基向量空间具有一定的冗余性[13-15]。图像的稀疏表示以图像块为单位。假设图像块Ik按行展开形成列向量y∈RN，则Ik可以稀疏表示为：

(1)

其中D=[d1,d2,…,dM]∈RN×M为字典；α为稀疏系数向量，且α=[α1,α2,…,αM]∈RM。当N≼M时，字典D为超完备字典。图像的稀疏表示原理如图1所示。

图1 图像稀疏表示原理

在实际应用中，图像块Ik很可能受到环境等因素干扰，无法通过字典准确地线性表示，引入向量ε∈RN×1描述该误差，如公式所示：

y=Dα+ε

(2)

式(2)矩阵形式为：

y=[D,I][α,ε]T

(3)

其中I是二维单位矩阵，称为琐碎模板；ε称为琐碎模板系数或噪声系数。

1.2 目标检测流程

基于稀疏表示的目标检测算法一般框架如图2所示。在预处理过程中图像完成分块，作为稀疏求解的输入；图像块依据现有的学习字典进行稀疏求解，将计算得到的重构误差传入目标分类过程；分类器依据分类原则将图像块分别归入背景类或前景类中，从而完成图像中的目标检测任务，同时根据检测结果对字典进行更新。可见，要提升目标检测算法的性能，主要可以针对稀疏求解过程和目标分类过程进行优化。

图2 基于稀疏表示的目标检测算法一般框架

2 超完备字典优化

本文利用K-SVD[16]算法构造超完备字典。K-SVD利用较小的图像块学习超完备字典，具有很强的鲁棒性，但在字典的学习阶段需要提供大量的训练图像块。

2.1 索引字典原理

图像的稀疏字典一般表示为矩阵D=[d1,d2,…,dM]，列向量di为经过学习后得到的字典原子。在稀疏系数求解过程中，MP类贪婪算法以单个字典原子为对象，依次计算测试图像块与字典原子之间的误差，不断迭代得到图像块的稀疏表示。因此，每次迭代均要遍历整个字典，才能获得最佳匹配的原子，从而导致时间开销巨大。因此，优化字典结构，对于提升稀疏求解的时间性能具有巨大的意义。索引字典通过对字典原子进行聚类，并推选出每个类的代表作为该类的索引，将单层的字典结构改进为双层字典结构，如图3所示。

图3 索引字典原理图

在索引字典结构下，运用相应算法进行稀疏系数求解时，每次迭代过程先遍历索引原子集，在误差最小的索引原子所指向的组内进行遍历求解，最终得到最佳匹配字典原子，然后进入下一步迭代过程。

在索引字典的结构下进行稀疏求解，良好的聚类结果能够保证算法获得全局最优值。但是字典原子作为典型的高维数据，在所在空间中多为线性不可分。文献[17]直接将适用于低维数据的聚类方法应用在高维数据会导致其有效性大大降低。为此，本文引入核聚类方法构造索引字典，通过核函数将字典原子映射到更加线性可分的特征空间中。

2.2 基于RBF核的硬C均值聚类算法

硬C均值聚类算法(HCM)是一种基于误差平方和准则的动态聚类算法，将样本数据点到聚类中心的距离之和作为目标函数，对其进行优化，迭代求极值后将每个数据点分配到唯一的类别中。

高斯径向基核函数(RBF核)的具体形式如公式所示：

(4)

其中σ为尺度参数，其选取直接影响RBF核的性能：σ→0时，所有样本将属于同一类别；σ→∞时，RBF核也会将所有样本归入同一类别中。因此针对不同的训练样本，选择合适的σ，将得到更为准确的聚类结果，函数特性如图4所示。

图4 RBF核函数特性

RBF核是普适的核函数，经过合理的参数选择后可以适用于任意分布的样本，目前应用最为广泛。在先验知识缺乏的情况下，RBF核为最佳选择。

聚类的目标函数为：

(5)

其中‖φ(xi)-φ(cj)‖为特征空间上，数据点与聚类中心的像之间的距离，则有：

‖φ(xi)-φ(cj)‖2=Κ(xi,xi)+Κ(cj,cj)-2Κ(xi,cj)

(6)

由RBF核函数的定义可知Κ(xi,xi)=1，Κ(cj,cj)=1，代入式(6)可得：

‖φ(xi)-φ(cj)‖2=2-2Κ(xi,cj)

(7)

将式(7)代入式(5)，得到目标函数的等价形式：

(8)

由此可知，基于RBF核的HCM的聚类准则为：

(9)

其中：

(10)

(11)

由此可得：

(12)

2.3 基于RBF核聚类索引的OMP算法

将核聚类索引字典与OMP算法结合，主要的目的是降低OMP算法求解稀疏系数的时间复杂度，并且利用核聚类的特性，增加字典索引化过程中原子分类的准确性。

结合HCM算法的聚类过程，基于RBF的HCM算法产生索引原子的流程如下：

3) 根据Κ(xi,xk)与式(12)更新得到Κ(t+1)(xi,cj)。

依据上述算法将字典原子{d1,d2,…,dN}进行聚类，并产生索引原子集。基于核索引字典的正交匹配跟踪算法(KIDOMP)流程如下：

1) 假设待测试图像块Iblock按行展开形成列向量yblock。

2) 初始化残差ri=yblock,i=0，逼近项初始值xi=0，迭代终止误差ε>0。

8) 置i=i+1，返回3)。

2.4 复杂度分析

假设字典大小为M×N，聚类算法将N个字典原子分配到了k个类中，且在类别j,1

(13)

3 目标检测分类器优化

3.1 多尺度字典学习

由于字典单元的维数等于图像块的行列数的乘积，随着图像分辨率的增大，检测图像的分块数量也激增，从而导致目标检测的时耗大大增加。另外，随着图像传感器捕获图像质量的提高，图像的细节更加清晰，为了有效表征输入的图像块，对于字典单元也有了更高的要求。因此，对高分辨图像进行稀疏表示及分类适合采用大尺度字典，但却会导致稀疏系数求解时间增加，无法满足实际应用要求。通过降低图像分辨率，采用低分辨率条件下学习得到的小尺度字典构造分类器，对目标进行检测能够有效减少时间复杂度，但是这种做法在一定程度上降低了目标检测精度，对后续应用造成不利影响。

2) 将Bhigh、Blow、A分别作为K-SVD的训练集，学习得到大尺度背景字典Dhigh、小尺度背景字典Dlow及飞机目标字典Dplane。

3) 将Dhigh、Dlow、Dplane索引化。

3.2 基于多尺度分类器的飞机目标检测

Dlow负责构建粗分类器，将低分辨率条件下的背景图像块筛除，获取包含前景区域的低分辨率图像块。Dhigh负责构造精分类器，将粗分类得到的前景图像块对应的超分辨率图像区域进行分块并分类，筛除超分辨率背景图像块，获得前景图像区域。背景的多尺度分类器，共同完成天空背景与前景的分割任务。Dplane构造的分类器对前景目标进行分类，确定目标是否属于飞机目标。

基于多尺度分类器的飞机目标检测算法流程如图5所示，具体描述如下：

1) 对测试图像进行隔点采样，降低分辨率，获得低分辨率测试图像，并对其进行分块。利用小尺度背景分类器进行分类，分别归入小尺度背景、前景两类。利用获取的小尺度背景图像块更新Dlow。

2) 计算1)中获取的小尺度前景图像块在超分辨率测试图像中对应的区域，再次进行分块。利用大尺度背景分类器，将新的图像块分别归入大尺度背景、前景两类。利用获取的大尺度图像块更新Dhigh。

3) 将2)中获取的大尺度背景图像块，通过飞机目标分类器进行分类，归入飞机目标、其他前景目标两类。根据飞机目标图像块更新Dplane。

图5 飞机目标检测流程

3.3 复杂度分析

作如下假设：

1) 测试图像分辨率为P×Q；

2) 大尺度图像块大小为Nhigh×Nhigh，小尺度图像块大小为Nlow×Nlow；

3) 大尺度字典单次稀疏系数求解时间为Thigh，小尺度字典单次稀疏求解时间为Tlow；

4) 降低图像分辨率时，进行隔M1点采样；超分辨率图像的行列均插值至测试图像的M2倍；

5) 低分辨率图像块中前景图像块所占比例为k1，对应超分辨率图像区域中前景图像块所占比例为k2。

基于多尺度分类器的飞机目标检测主要由三个过程构成：

因此，在多尺度分类器条件下，飞机目标检测的时复杂度为：

(14)

4 实验及结果

本文仿真环境具体如下：

操作系统为Windows XP，仿真软件为Matlab 2014b，处理器为Inter Core2 E7500，内存为2 GB。实验训练集及测试集均取自某型战机飞行视频。

为验证优化算法在时间性能和精度上的改进，设计实验如下：

实验1：基于核索引的超完备字典实验。以OMP算法的稀疏求解结果作为标准，计算基于不同核函数的索引字典稀疏求解结果，获得稀疏求解的准确度；计算基于核索引超完备字典的OMP的算法平均时间开销。

实验2：基于多尺度分类器的飞机目标检测实验。验证基于多尺度分类器的检测算法在时间开销方面的表现；通过计算检测命中率、误检率来评价算法在精度方面的表现。

4.1 实验1

由于OMP算法采用贪婪思想，在稀疏求解每次迭代时，需要遍历字典的每一个原子，将其作为MP类算法准确度的评判标准具有可行性。实验利用不同训练集学习得到两个不同字典D1、D2，冗余度为3，核函数的参数设置如表1所示。

表1 核函数参数设置表

实验结果如表2所示。

表2 索引准确度结果表

可见，在索引字典的结构下，基于RBF核构造的字典准确度最高，表明该核函数对图像块变换的高维向量有良好的聚类效果。

聚类类别数的选择对时间性能具有较大的影响，实验选择了100个测试图像块，分别作用于原始字典、类别数分别为2、5、20、100的核聚类索引字典，时间开销如图6所示。

图6 系数求解耗时图

可见，核索引字典对于提升稀疏求解算法的时间性能具有明显的作用，且聚类数K对改进效果有很大的影响。由于实验1结果中，当K=20时，算法时间开销最小，为此实验2中选择K=20构造索引字典。

4.2 实验2

实验测试集为某型战机飞行视频中的100帧连续图像，对图像中的飞机目标进行检测，部分检测结果如图7所示。

图7 飞机目标检测结果图

显然，基于多尺度分类器的飞机目标检测算法相比单尺度分类器，获得的飞机目标区域更为精确。

为量化评价算法的有效性，实验从时间性能、命中率和误检率三个方面，对下列两个条件下的算法性能进行了比较：

1) 原测试图像、单层字典、单尺度分类器。

2) 多分辨率测试图像、核索引字典、多尺度分类器。

命中率与误检率的定义如下：

实验结果分别如图8-图10所示。

图8 算法耗时图

图9 目标检测命中率

图10 目标检测误检率

由表3所示，基于多尺度核索引分类器的飞机目标检测算法在时间性能上较单尺度算法有了很大的提升，经过计算，单帧图像完成目标检测的平均时耗降低至24.7%；优化算法在精度上同样有了一定程度的改进：单帧图像的平均命中率提高了3.4%，平均误检率降低了20.3%。

表3 目标检测算法评价对比

5 结语

本文从优化字典结构、分类器结构两个方面对基于稀疏表示的飞机目标检测算法进行了优化，实验表明：

1) 在字典结构优化上，基于RBF核索引字典的OMP算法在时间性能上有了较大程度的提升，且基于RBF核的硬C均值聚类算法保证了字典原子聚类的准确度相比基于欧氏距离的算法有所提高。

2) 在分类器优化上，基于多尺度核索引分类器的飞机目标检测算法相比基于单尺度分类算法，时间性能及精度方面的表现均有了较大程度的提升。

[1] 王树国,黄勇杰,张生.可见光图像中飞机目标的特征选择及提取[J].哈尔滨工业大学学报,2010,42(7):1056-1059.

[2] 赵蓓蕾.空中飞机目标图像增强与辨识研究[D].西南科技大学,2014.

[3] 李科.自动识别遥感光学图像中飞机目标的研究[D].长沙:国防科技大学,2005.

[4] 高琪琪.遥感图像飞机目标检测与识别算法研究[D].南昌航空大学,2015.

[5] Liu G,Sun X,Fu K,et al.Aircraft recognition in high-resolution satellite images using coarse-to-fine shape prior[J].IEEE Geoscience and Emote Sensing Letters,2013,10(3):573-577.

[6] 高仕博,程咏梅,肖利平,等.面向目标检测的稀疏表示方法研究进展[J].电子学报,2015,43(2):320-332.

[7] Mairal J,Bach F,Ponce J,et al.Discriminative learned dictionaries for local image analysis[C]//Computer Vision and Pattern Recognition,2008.CVPR 2008.IEEE Conference on.IEEE,2008:1-8.

[8] Wright J,Yang A Y,Ganesh A,et al.Robust Face Recognition via Sparse Representation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2009,31(2):210-227.

[9] He R,Zheng W S,Hu B G.Maximum Correntropy Criterion for Robust Face Recognition[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2011,33(8):1561.

[10] Yang M,Zhang L,Feng X,et al.Fisher Discrimination Dictionary Learning for sparse representation[C]//IEEE International Conference on Computer Vision,ICCV 2011,Barcelona, Spain, November.DBLP,2011:543-550.

[11] 李萍,王乐,张波.改进稀疏表示的飞机目标识别算法[J].电光与控制,2016(7):50-54.

[12] 林煜东,和红杰,尹忠科,等.基于稀疏表示的可见光遥感图像飞机检测算法[J].光子学报,2014,43(9):196-201.

[13] Elad M.Sparse and redundant representations: from theory to applications in signal and image processing[M].Springer Publishing Company,Incorporated,2010.

[14] Skretting K,Engan K.Recursive least squares dictionary learning algorithm[J].IEEE Transactions on Signal Processing,2010,58(4):2121-2130.

[15] Mairal J,Bach F,Ponce J,et al.Online Learning for Matrix Factorization and Sparse Coding[J].Journal of Machine Learning Research,2010,11(1):19-60.

[16] Aharon M,Elad M,Bruckstein A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Transactions on Signal Processing,2006,54(11):4311-4322.

[17] Han Jiawei,Kamber M.数据挖掘:概念与技术[M].2版.范明,孟小峰,译.机械工业出版社,2007.

OPTIMIZATIONANDSIMULATIONOFAIRCRAFTTARGETDETECTIONBASEDONMULTI-SCALEKERNELINDEXDICTIONARY

Chen Bin Zhao Jianjun Yang Libin Wang Yi

(DepartmentofWeaponScienceandTechnology,NAEI,Yantai264001,Shandong,China)

In order to improve the time performance and accuracy of aircraft target detection algorithm, we propose an aircraft target detection algorithm based on multi-scale kernel index dictionary. The algorithm is optimized from the construction of dictionary and classifies of object detection. First, the RBF kernel was introduced into the HCM algorithm to construct the indexed dictionary. Time performance was improved as well as the accuracy of clustering. Then, the multi-scale classifier was constructed based on the kernel index dictionary to further improve the efficiency and accuracy of the algorithm. As experiments show, after choosing a reasonable number of clusters, kernel-based indexed dictionary has decreased the time consumption of sparse solution. The accuracy of clustering has increased at the same time. Compared with the single scale dictionary, the algorithm based on the multi-scale kernel index dictionary reduces the time cost to 24.7%. In the respect of accuracy, the false detection rate decreased by an average of 20.3%, and the average hit rate increased by 3.4%. In conclusion, the proposed algorithm can satisfy the requirement of real-time application.

Aircraft target detection Kernel-based clustering Indexed dictionary Multiscale Sparse representation

2016-12-14。陈滨，博士生，主研领域：目标检测与跟踪。赵建军，教授。杨利斌，讲师。王毅，讲师。

TP391.41

10.3969/j.issn.1000-386x.2017.11.037