当前位置:首页 期刊杂志

数据库样本缺失下的雷达辐射源识别*

时间:2024-07-28

李 蒙,朱卫纲

(装备学院 a.研究生管理大队;b光电装备系,北京 101416)



数据库样本缺失下的雷达辐射源识别*

李 蒙**a,朱卫纲b

(装备学院 a.研究生管理大队;b光电装备系,北京 101416)

目前,基于机器学习的雷达辐射源识别技术大多以训练集和测试集同分布为假设,当雷达数据库样本不足导致与信号真实分布存在偏差时,传统的分类方法效果不佳。为此,将迁移学习理论引入识别系统,设计了一种基于结构发现与再平衡的雷达辐射源信号识别方法。通过对数据库和待识别辐射源信号样本进行聚类分析发现数据结构信息,通过重采样处理修正其分布差异。将新采样数据输入支持向量机进行训练并对侦收样本进行识别。仿真实验表明,在新训练样本集上学习的模型对测试集的分类性能有了很大的提升。

雷达辐射源识别;迁移学习;结构发现;再平衡;支持向量机

1 引 言

雷达辐射源识别作为雷达侦察中的关键环节,在雷达对抗中具有十分重要的作用。其任务是基于雷达数据库中样本对侦察得到的雷达信号进行分析,从而确定该辐射源的体制、状态、用途、型号、威胁等级等信息[1]。

雷达辐射源识别问题可以归结为模式分类问题,即根据提取的特征参数结合雷达数据库信息的一个分类过程。机器学习(Machine Learning)作为一种智能的数据分析工具,可以模拟人类学习行为,使计算机程序随着经验的积累不断提高自身性能,受到了辐射源识别领域学者的广泛关注。自20世纪80年代英国海军将人工神经网络引入辐射源识别[2]以来,国内外学者不断探索机器学习在雷达辐射源识别领域的应用,并在神经网络[3]、支持向量机[4]以及集成学习[5]等方面取得了不错的效果。但是,这些实验都是基于训练集和测试集同分布实现的,在实际中,往往由于侦察的时间和条件有限导致侦收样本不足以反映信号的真实分布,使得识别效果大打折扣。

迁移学习(Transfer Learning)放宽了训练数据和测试数据服从独立同分布的假设,使得参与学习的领域或任务可以服从不同的边缘概率分布或条件概率分布,被认为是在最小监督代价下进行机器学习的一种崭新策略[6],已经广泛应用于文本分类[7]、视频识别[8]、自然语言处理[9]等领域。本文探索了迁移学习在雷达辐射源信号识别中的应用,针对雷达数据库样本缺失导致待识别信号与数据库样本分布存在偏差的情况,引入BRSD[10](Bias Reduction via Structure Discovery)迁移算法,设计了一种适用于数据库样本缺失的雷达辐射源识别方法,对多功能相控阵雷达信号工作状态进行了有效识别。

2 机器学习识别模型

图1 雷达辐射源识别原理框图Fig.1 Principle block diagram of radar emitter identification

3 基于结构发现与再平衡的雷达辐射源信号识别

3.1 理论分析

当待识别辐射源信号与雷达数据库数据存在偏差时,两者的联合分布是不相同的,即PS(x,y)≠PT(x,y)。由于数据库样本与待识别样本具有不同的分布,将基于DS学习的模型c′(x)应用到DT中就难以保证模型的可信度。基于结构发现与再平衡的迁移学习通过分析源领域与目标域的数据分布产生一个新的训练样本集用于训练分类器,以提高学习模型在目标数据集的泛化能力。

为了便于理解,用二维数据二分类的例子来演示本文方法的基本思路。如图2所示,训练样本用实心点表示,待识别样本用空心点表示,三角形和正方形分别表示不同类别。由图2(a)可以看出,当训练样本与待识别样本分布存在偏差时,由训练样本得到的学习模型对待识别样本的识别结果较差。通过对整个数据集进行聚类(图2(b))寻找结构信息,然后通过重采样过程从每个聚类簇中按相同比例选择一组与待分类样本分布偏差较小的新训练样本集(图2(c))进行训练,新训练的学习模型(图2(d))对待识别样本有了较好的分类结果。

图2 基于结构发现与再平衡的迁移学习示意图Fig.2 Schematic diagram of transfer learning based on structure discovery and re-balancing

对总数据集D=DS∪DN进行聚类处理来探求数据的结构信息,理论上可以采用任何具有良好性能的聚类算法。

假设聚类后得到NC个簇{C1,C2,…,CNC}。样本再平衡环节,综合考虑数据标记可信度和数据代表性,从每个簇Ci中按相同比例选择标记可信度高,且最能代表该簇分布的样本数据作为新训练样本数据。

数据标记可信度表示为

(1)

数据代表性表示为

(2)

当聚类簇包含样本较少时,假设内部数据分布是相同的。可以证明[12],从每个聚类簇中按照相同比例选取的新训练样本与总数据集的分布是一致无偏的。

3.2 算法实现

3.2.1BRSD算法

BRSD算法不需要直接估计域分布,且能够修正不同类型的域间差异。算法流程如下:

输入:标记数据集DS,未标记数据集DT,样本预测比例α。

输出:新的训练样本集S。

(1)令总数据集D=DS∪DT;

(2)对D进行聚类分析,生成NC个聚类簇{C1,C2,…,CNC}=C;

(3)基于式(1)和式(2)将Ci中样本按相同权重相加进行综合降序排列;

(4)按比例α从每个簇中选取新样本si;

(5)生成新的训练样本集S。

3.2.2 基于BRSD的雷达辐射源信号识别算法

通过提取雷达信号特征构建特征向量,使用BRSD算法可以有效修正数据库样本与待识别样本的分布偏差,实现侦收信号的有效识别。综合上述分析,设计算法如下:

输入:数据库样本XS,待识别样本XT。

输出:待识别样本XT的标签YT。

(1)对XS和XT进行归一化处理;

(2)执行BRSD算法,生成新训练样本S;

(3)将S输入到分类器中进行训练,得到学习模型M;

(4)用学习模型M对XT的类别进行预测;

(5)得到标签集合YT及相信辐射源信号工作状态信息。

经过改进的雷达辐射源识别系统如图3所示。

图3 改进后的雷达辐射源识别框图Fig.3 Block diagram of improved radar emitter identification

4 实验与结果分析

对于多功能雷达而言,要确定其威胁程度,单纯的型号识别是远远不够的。多功能雷达所展现的能力和威胁程度与其正在执行的任务和工作状态有关。因此,以某多功能相控阵雷达不同工作状态的信号为实验数据库,模拟数据库样本缺失时的雷达辐射源信号识别。信号各维特征参数信息如表1所示,其中搜索模式1、2、3分别表示近程搜索、中程搜索、远程搜索,RF表示载频,PRI表示脉冲重复间隔,PW表示脉冲宽度,PA表示脉冲幅度,IBW表示带宽。

表1 雷达信号特征参数Tab.1 Characteristic parameter of radar signal

根据信号统计特征仿真生成样本,按比例剔除部分样本后将剩余样本作为原始数据库,缺失率为剔除样本占总样本的比例。

利用经典的K-means和DBSCAN算法对本文数据集进行聚类。实验表明,K-means算法实验结果虽然是经过多次实验取的平均值,但实验结果还是存在较大起伏,聚类效果依赖于人为设置的子类个数。由于关于待识别辐射源信号聚类簇数量的先验信息较少,因此认为K-means算法不适合雷达辐射源信号的聚类。而DBSCAN算法是基于密度的聚类算法,不需要人为设置子类个数,并且可以自动丢弃识别为噪声的样本点,受离群点的影响较小,实验结果比较稳定。

以α=NS/(NS+NT)为比例重新采样实现样本再平衡,并与直接使用数据库样本作为训练集训练分类器的识别效果进行比较。实验进行10次仿真并取平均后的结果如表2所示,加粗数据为迁移算法处理后的识别结果。

表2 不同缺失和误差下分类识别率Tab.1 Identification rate under different missing and error

在4%误差条件下对比迁移算法处理前后的识别结果如图4所示。可以看出,当数据库样本存在缺失时,直接使用数据库样本训练的分类器识别率在缺失率大于30%后显著下降;而进行样本再平衡后训练的分类器识别率虽略有下降,但基本保持稳定,证明了方法的有效性。

图4 改进前后识别结果对比Fig.4 Comparison of identification result before and after improvement

固定数据库缺失70%的条件,检验所提方法对误差的敏感程度,识别结果如图5所示。可以看出,与直接使用数据库样本训练分类器进行识别的方法相比,在一定误差范围内,本文方法能够有效提高雷达信号的正确识别率。但是,当误差超过6%时,识别率会有明显下降;测量误差超过9%以后,正确识别率则会低于传统方法。这是由于不同类别信号在特征空间的距离较小,聚类过程受测量误差影响较大,造成识别效果迅速恶化。

图5 测量误差对识别效果的影响Fig.5 Effect of measurement error on identification effect

固定缺失和误差,探索重采样比例对识别效果的影响,实验结果如图6所示。可以看出,当重采样比例α>15%时,正确识别率基本趋于稳定,即当数据库样本数量大于总样本的15%时,NS/(NS+NT)能够满足重采样比例需求。

图6 重采样比例对识别效果的影响Fig.5 Effect of resampling ratio on identification effect

5 结 论

本文针对雷达数据库与信号真实分布存在偏差时分类效果不佳的问题,提出了一种基于迁移学习的雷达辐射源识别方法。该方法通过发现样本分布结构缩小训练集与待识别样本的分布偏差,有效解决了因侦收数据量不足等造成的训练样本缺失时的辐射源识别问题。为分析样本分布,该方法需要对信号进行聚类分析,导致测量误差较大时识别效果不佳,如何提高大误差条件下的识别率将是下一阶段研究的重点。

[1] 游屈波,吴耀云,哈章.辐射源识别系统中分类器设计及其应用[J].电子信息对抗技术,2011,26(3):20-24. YOU Qubo,WU Yaoyun,HA Zhang. Design and application of classifier for emitter recognition[J].Electronic Information Warfare Technology,2011,26(3):20-24.(in Chinese)

[2] ROE J,PUDNER A. The real-time implementation of emitter identification for ESM[J]//Proceedings of 1994 IEE Colloquium on Signal Processing in Electronic Warfare.London:IET,1994:1-6.

[3] ANDERSON J A,GATELY M T,PENZ P A,et al.Radar signal categorization using a neural network[J].Proceedings of the IEEE,1990,78(10):1646-1657.

[4] ZHANG G X,JIN W D,HU L Z. Radar emitter signal recognition based on support vector machines[C] //Proceedings of the 8th International Conference on Control,Automation,Robotics and Vision.Kunming:IEEE,2004:826-831.

[5] 方敏,王宝树.基于Boosting的模糊分类规则集成学习及应用[J].宇航学报,2005(5):640-643,675. FANG Min,WANG Baoshu.Ensemble learning and application of fuzzy classification rules based on boosting[J].Journal of Astronautics,2005(5):640-643,675.(in Chinese)

[6] 龙明盛.迁移学习问题与方法研究[D].北京:清华大学,2014. LONG Mingsheng. Transfer learning:problems and methods[D]. Beijing:Tsinghua University,2014.(in Chinese)

[7] ZHUANG F,LUO P,DU C.Triplex transfer learning: exploiting both shared and distinct concepts for text classification [J].IEEE Transactions on Cybernetics,2014,44(7):1911-1203.

[8] PATEL V M,GOPALAN R,RUONAN L.Visual domain adaptation:a survey of recent advances[J].IEEE Signal Processing Magazine,2015,32(3):53-69.

[9] MORI S.Domain adaptation in natural language processing(transfer of knowledge) [J].Journal of Japanese Society for Artificial Intelligence,2012,27(4):365-372.

[10] REN J T,SHI X X,FAN W. Type independent correction of sample selection bias via structural discovery and re-balancing[C]∥Proceedings of the SDM.Auckland:ACM,2008:565-576.

[11] PETER F. Machine learning: the art and science of algorithms that make sense of data[M].Cambridge: Cambridge University Press,2012.

[12] 刘 振,杨俊安,刘辉. 模糊近邻密度聚类与重采样的迁移学习算法[J].信号处理,2016,32(6):651-659. LIU Zhen,YANG Junan,LIU Hui.Transfer learning with fuzzy neighborhood density clustering and re-sampling[J]. Journal of Signal Processing,2016,32(6):651-659.(in Chinese)

[13] 王小川,史峰,郁磊. MATLAB神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

Radar Emitter Identification in Database Sample Missing Condition

LI Menga,ZHU Weigangb

(a.Department of Graduate Management;b.Department of Photoelectric Equipment,The Academy of Equipment,Beijing 101416,China)

Present radar emitter identification based on machine learning technology mostly assumes that training set and test set are same. When the radar database and the true distribution of the signals are biased,the traditional classification method is ineffective. Thus,the theory of transfer learning is introduced into the identification system,and a radar emitter signal identification method based on structural discovery and re-balancing is proposed. By means of database data and target data clustering analysis and resampling,the distribution is corrected and the new data is put to support vector machine(SVM) for training and identifying reconnaissance samples. The simulation results show that the classification performance of the support vector machine model in the new training sample set has been greatly improved.

radar emitter identification;transfer learning;structural discovery;re-balancing;support vector machine(SVM)

10.3969/j.issn.1001-893x.2017.07.009

李蒙,朱卫纲.数据库样本缺失下的雷达辐射源识别[J].电讯技术,2017,57(7):784-788.[LI Meng,ZHU Weigang.Radar emitter identification in database sample missing condition[J].Telecommunication Engineering,2017,57(7):784-788.]

2016-10-28;

2017-02-23 Received date:2016-10-28;Revised date:2017-02-23

TN971

A

1001-893X(2017)07-0784-05

李 蒙(1992—),男,山东无棣人,硕士研究生,主要研究方向为军事信息处理;

Email:wdyzlimeng@163.com

朱卫纲(1973—),女,陕西西安人,副教授、硕士生导师,主要研究方向为现代信号处理理论与应用。

**通信作者:wdyzlimeng@163.com Corresponding author:wdyzlimeng@163.com

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!