时间:2024-05-22
刘文贞,陈红岩,李孝禄,袁月峰,郭晶晶
(中国计量大学机电工程学院,杭州310018)
基于自适应变异粒子群算法的混合核ε-SVM在混合气体定量分析中的应用*
刘文贞,陈红岩*,李孝禄,袁月峰,郭晶晶
(中国计量大学机电工程学院,杭州310018)
针对利用不分光红外吸收法(NDIR)的多组分气体传感器对汽车尾气进行同时测量时,红外光谱特征吸收谱线重叠较为严重,所测气体浓度是交叉吸收干扰后的结果,造成测量误差大,分析精度低的问题,提出了一种自适应变异粒子群算法的混合核ε-SVM方法,建立三组分混合气体定量分析模型,已消除混合气体之间相互干扰产生的误差问题。实验中,采集CO2、CO、C3H8的浓度信号,作为模型输入,通过模型回归分析,得到对应的混合气体组分浓度,通过实验数据对模型性能进行分析,结果表明,该模型的平均误差相比于传统模型明显减低,取得较好的精度。
检测技术与自动化装置;气体定量分析;自适应变异粒子群算法;混合核函数;支持向量机;气体传感器
EEACC:7230doi:10.3969/j.issn.1004-1699.2016.09.028
机动车尾气中主要有CO、NO、CO2、HC化合物等,成为环境污染的重要因素。在混合气体定量分析方法中,气体传感器因其便利的安装及携带条件,近年来越来越受到广泛的应用,其中基于不分光红外吸收法(NDIR)的多组分气体传感器是根据单原子和同核分子组成的气体不吸收红外线能量,而异原子组成的气体(如尾气中的CO2、CO、C3H8等)能吸收特定波长的红外光能量原理建立的,其吸收强度用吸收系数反映。当一束平行的红外光穿过待测气体时,气体对红外波段中特征波长的红外光能量进行吸收,在其相应谱线处会发生红外光能量的衰减,衰减量与该待测气体浓度c、气体的厚度L以及该气体吸收系数k有关[1],关系服从朗伯—比尔(Lambert-Beer)定律[2]。但NDIR传感器对车辆尾气排放进行动态实时检测时,由于组分气体间吸收谱线相互重叠严重,造成交叉吸收干扰,以及温度的变化等因素,导致测量时误差较大,无法对汽车尾气排放进行有效的检测和监督,因此,需要后续的数据处理。
在涉及到非线性干扰问题时,国内外学者提出了很多用于重叠信号解析的方法,如偏最小二乘(PLS)回归分析、小波神经网络、支持向量机(SVM)等[3-7]。Manouchehrian Amin[5]等运用基于遗传算法寻优方法的支持向量机,建立回归模型,预测岩石的强度和可变性属性;刘建国[6]等人将RBF神经网络应用到可燃混合气体的分析中,克服了传感器阵列在混合气体检测中的交叉敏感现象;曲健[4]等利用自适应变异粒子群优化的SVM建立混合气体校正模型,对多组分气体传感器检测到的混合气体进行检测,有效的提高了混合气体的预测精度,降低了预测误差。目前,SVM算法在混合气体定量分析领域取得了一定的成果。但目前所采用的单核SVM仍存在泛化性能弱、学习能力差等弱点,因此,在此基础上,采取一种将径向基核函数和多项式核函数进行线性组合构建的混合核SVM[8],并采取自适应变异粒子群算法对混合核SVM校正模型进行优化,解决普通粒子群算法存在的后期震荡严重、趋同性强和极易陷入局部极小值等问题,以此来提高模型预测精度。
1.1ε-SVM
SVM算法是根据结构风险最小化原则设计的一种统计学习理论,具有小样本学习能力强、模型推广性能好以及高维数据处理能力强等优点。在SVM分类算法中引入式(1)所示的不敏感损失函数,选取合适的参数ε,可以构造成ε型支持向量回归算法(ε-SVM)来实现SVM的回归预测功能。
其中,ω为回归系数,φ(xi)为输入空间到特征空间的映射函数,b为阀值。
根据优化理论,选取适当的精度ε>0和惩罚参数C>0,将式(2)转换线性规划问题,在此引入松弛变量ξ,ξ*≥0来求解ω与b。
引入Lagrange函数求解式(3)和式(4),通过核函数k(xi,xj)将高维空间的内积运算转换在原二维空间计算,有:
经过求解,得到:
求得ω与b后,构造决策函数,即ε-SVM回归校正模型的回归函数:
式(6)中,若αi不为零或者不为零,表示此样本即为支持向量。
1.2混合核ε-SVM
ε-SVM进行预测之前首先要确定核函数的类型。SVM有4种常用的核函数,即径向基核函数(RBF)、Sigmoid核函数、高斯核函数和多项式核函数。选用不同的核函数可构造不同的支持向量机。鉴于局部性核函数在测试点附近小领域内对数据点的影响较大,具有学习能力强、泛化性能弱的特点,而全局性核函数泛化性能力强、学习能力弱,为了得到学习能力与泛化能力都较强的核函数,将这两类核函数混合起来。由于RBF核函数能较好的模拟光谱信号,是一个典型的局部性核函数,使用比较普遍,而多项式核函数是一个典型的全局性核函数,因此选择将两者线性组合,构造混合核函数[8]如式(10)所示:
1.3ε-SVM模型参数的影响分析
ε-SVM中影响预测精度的参数有回归函数中的惩罚参数C、损失函数中的ε,以及核函数中的权重因子σ和λ。①惩罚因子C控制着经验风险和VC维的平衡。为了减少误差以实现对训练样本的较好拟合,在相似预测效果的情况下,一般选择相对较小的C值以避免引起经验误差和VC维失去平衡而导致泛化能力弱。②ε控制着SVM对输入变量的敏感程度,ε值过大会使SVM反应迟钝,不能随着输入的变化迅速调整;而过小的ε则会使SVM对输入太过敏感,使得干扰对SVM影响过大,甚至导致学习失败。因此,选择合理的参数是保证ε-SVM实现准确预测的基础。③σ控制着误差的边界,理想的训练结果是使得尽量多的训练样本包含所有的预测样本,以实现预测误差的最小化。④权重因子λ可以改变混合核函数中原核函数的权重,λ∈(0.5,0.99).由上可知,如何寻找一个精确、快速、稳定的算法来实现对参数的优化对提高模型预测精度具有重要的意义。粒子群优化算法[7-8]PSO(Particle Swarm Optimization)是一种具有鲁棒性的群体智能的优化算法,其基本思想是通过群里中个体之间的信息传递及信息共享来寻找最优解,该算法克服了遗传算法具有收敛速度慢、早熟的缺陷。因此,为了能够对ε-SVM算法中的参数进行优化选取,改良传统的遍历优化方法,采用自适应变异粒子群AMPSO(Adaptive Mutation Particle Swarm Optimization)算法优化ε-SVM模型。
2.1PSO算法
PSO算法是一种基于速度-位置搜索的智能随机优化方法,模拟群鸟觅食种群,每个个体都被看作一个粒子,则鸟群可以被看成一个粒子群[9]。假设在一个D维的空间中,有n个粒子组成的种群X=(X1,X2,…,Xn),其中Xi=[xi1,xi2…,xiD]T为第i个粒子在D维搜索空间的位置,亦代表问题的一个潜在解。根据目标函数可以计算出每个粒子位置Xi对应的适应度值根据适应值的大小衡量其优劣。粒子个体经历过得最好位置,即个体极值为Pi=[Pi1,Pi2…,PiD]T,整个群体所有粒子经过的最好位置,即种群的全局极值为Pg=[Pg1,Pg2…,PgD]T。种群第i个粒子的速度为Vi=[Vi1,Vi2…,ViD]T。
在每一次迭代过程中,粒子通过个体极值和全局极值更新自己的速度和位置,更新公式为:
其中ω为惯性权重因子,其值非负,值的大小影响整体的寻优能力;i=1,2,…,n,n为群体中粒子总数;d=1,2,…,D,表示维数;k为当前迭代次数;Vid为粒子速度;Xid为粒子位置;c1和c2为加速度因子,通常在0~2之间取值,r1和r2为分布在[0,1]之间的随机数。
粒子群优化算法收敛快,但存在着容易早熟收敛、搜索精度较低、后期迭代效率不高等缺点。因此,提出了一种自适应变异的粒子群优化算法。
2.2AMPSO算法
AMPSO算法指通过一定的准则和判定条件对相应的粒子采取变异操作,产生新的粒子,引导种群向最优解方向收敛[10]。其具体的做法是粒子群优化算法的基本框架中增加随机变异算子pm,通过对粒子gbest的随机变异来提高粒子群算法跳出局部最优解的能力,让算法在发生早熟收敛时,能够进入解空间的其它区域继续进行搜索,直到最后找到全局最优解。设fi为第i个粒子的适应度(目标函数值),则整个群体n个粒子的平均适应度favg为:
粒子群归一化定标因子f为:
种群适应度方差σ2为:
对满足变异条件的gbest按一定的概率pm变异,pm的计算公式如下:
其中,μ可以取[0.1,0.3]之间的任意数值。假设粒子gbest在当前最优解为pg,在变异算子pm的作用下可能发现更好的位置:
2.3AMPSO算法优化ε-SVM
自适应变异操作拓展了在迭代中不断缩小的种群搜索空间,使粒子可以跳出之前搜索到的最优值位置,在更大的空间展开搜索,同时保持了种群的多样性,提高了算法寻找到最优质的可能性[11]。选择最小化式(18)所示的均方根误差函数Frmse为目标函数。
可选择适应度函数为:
AMPSO算法优化混合核ε-SVM的实现过程如下:
①初始化随机初始化SVM参数组合(C,σ,ε,λ)在解空间中的位置、粒子的初始速度和位置,设置粒子最大速度vmax、最大迭代次数、权重取值范围以及SVM各参数取值范围。若则若,则
②计算每个粒子的适应度设置每个粒子的个体极值为当前位置gbest。根据式(13)~式(15)更新适应度值Ffitness和种群适应度方差σ2,令pipresent=Ffitness。计算每个粒子的适应度值,取适应度值最优的粒子个体极值为最初的全局极值pgbest。
③更新粒子的速度和位置值,根据式(11)、式(12)更新粒子的速度和位置。
④根据式(16)计算变异概率pm。
⑤产生随机数r∈[0,1]如果r<Pm,按式(17)执行变异操作。
⑥比较当前粒子的个体最优极值pibest和当前适应度值pi。若pi>pgbest,则pgbest=pi。
⑦比较更新之后的pj和全局最优位置pgbest。若pj>pgbest,则pgbest=pj。
⑧判断是否满足迭代终止条件,满足则停止迭代,输出最优的SVM参数组合;不满足则转步骤②。当使得最优解的参数组合不唯一时,取C值最小的那组。
自适应变异粒子群优化混合核ε-SVM的流程如图1所示。
图1 自适应变异粒子群优化混合核ε-SVM的流程图
在已有的三组分气体传感器的条件下[12],采用HawkEye公司的IR55红外光源和PerkinElmer公司生产的TPS4339作探测器,对组成的三组分气体进行了实验。TPS4339探测器基于热电偶测温原理,为2×2矩阵规则排列的4通道探测器,每个通道根据气体对光谱的吸收特性,选择适于被测气体特征吸收光谱通过的滤光片,并在每个通道密封不同红外滤光片的透射窗口,相互之间没有信号干扰。通过对CO2、CO和C3H8吸收光谱分析,选择气体通道的滤光片滤波范围分别为:4.33 μm±40 nm、4.65 μm±0.015 nm、3.40 μm±50nm;参考通道滤波范围:3.93 μm±50 nm。每个通道检测对应气体吸收后剩余光强度与参考通道的输出作比后,经放大、滤波并转化为3组不同的电信号,通过上位机与MCU串口之间的通讯,按用户自定义协议对串口发送的A/D采样后的电压数据进行解析,上位机将电压数据存入数据库,并实时地显示各通道的电压波形,上位机对下位机发送来的数据进行分析、处理、拟合出相应待测气体的浓度,并能将数据导出到Excel表中进行保存,作为模型的输入。气体检测原理框图如图2所示。
图2 气体检测原理框图
将不同体积分数配比的28组混合气体的其中20组用于网络模型的训练,8组用于测试模型的准确度[13-14],以及验证误差是否达到理想,混合气体样本各单一气体体积分数控制在CO2为0~20%、CO为0~10%、C3H8为0~5%。选定好最优参数组合(C,ε,λ,σ)后,对训练集进行训练,建立SVM回归模型,之后对测试集进行回归分析,得到测试集的模型预测结果。
为提高模型预测精度,本实验针对不同组分气体采用独立建模的方法,因此在应用自适应变异粒子群优化算法对混合核ε-SVM的参数优选的过程中,应针对不同气体分别优化,在本实验中即分别优化CO2、CO和C3H8化合物的模型参数。仅以CO2气体分析模型参数优化为例,选取粒子群维数为2,种群数量20,粒子群优化迭代次数200代,惯性权重因子ω∈[0.4,09],Vmax=50,C∈(0,100],ε∈[0.001,10],λ∈[0.50,0.99],σ∈(0,10]。以F(Pgk)≤10-4作为全局收敛条件加速度因子即学习因子c1=1.5,c2=1.7。
实验是以CO2浓度误差为适应度函数,本文分别给出了适应度值即浓度误差随迭代次数的变化曲线,为了显示AMPSO算法优化的混合核ε-SVM模型具有优越性,对三种模型进行了对比分析。图3表示基于AMPSO的混合核ε-SVM模型参数的最优个体适应度的变化曲线,其最优个体适应度为0.000 37。
图3AMPSO-混合核ε-SVM参数优化过程曲线
图4表示基于AMPSO的单核ε-SVM参数算法的最优个体适应度的变化曲线,其最优个体适应度为0.001 32。
图5表示基于PSO的混合核ε-SVM参数算法的最优个体适应度的变化曲线,其最优个体适应度为0.001 48。其中,AMPSO-单核ε-SVM模型中采用的核函数为RBF核参数,该模型在优化过程中,需要优化的参数有惩罚参数c(选取范围0~100)和RBF核参数g(选取范围0~1 000),以及灵敏系数ε;PSO-混合核ε-SVM需要优化的参数为(C,ε,λ,σ)。
图4 AMPSO-单核ε-SVM参数优化过程曲线
图5 PSO-混合核ε-SVM参数优化过程曲线
由3种模型优化混合核ε-SVM参数结果看,基于AMPSO的混合核ε-SVM模型参数的最优个体适应度为0.000 37为最小,并且其在较小的进化代数适应度值即达到稳定。在针对CO2气体检测的三种模型中,优化后的最优参数、所需时间以及均方误差如表1所示。
表1 3种模型寻优结果对比表
如图6所示,为AMPSO-混合核ε-SVM模型参数寻优结果图。其中,横轴为优化代数,纵轴为适应度值,即模型训练样本计算结果的均方误差。
图6 AMPSO-混合核ε-SVM参数寻优结果图
将AMPSO算法优化的混合核ε-SVM得到的最优参数组合(C,ε,λ,σ)=(9.315,0.163,0.657,0.921)代入支持向量机重建传感器模型,可以得到模型训练样本的预测结果,如图7所示。
图7 CO2训练集网络输出与实际输出对比图
从寻优结果图6和训练样本的预测结果图7中,可以看出利用训练集建立的模型对CO2训练集本身做预测时,模型预测值和CO2实际浓度值很好地吻合,误差极小。其中训练样本的测试结果均方差为4.12×10-5,曲线很好地逼近真实浓度,说明本实验建立的模型预测精度高,可应用于混合气体中CO2气体的回归预测。
同样的,可以得到经过AMPSO优化后的混合核ε-SVM建立其他气体训练模型。最优参数、寻优所用时间以及均方误差(MSE)如表2所示。
最终对8组测试样本气体进行测试,将三种模型预测得到的3种气体浓度数据进行对比,结果如表3所示。由表3中的数据,通过误差分析,两种算法的检测结果如表4所示。
表2 AMPSO-混合核ε-SVM寻优结果表
表3 混合气体浓度测量结果
表4 误差结果对比
由表3、表4可以看出:通过AMPSO-混合核ε-SVM建立的气体定量测试模型误差分析,CO2、CO、C3H8的浓度绝对误差(MAE)分别满足±0.1%、±0.2%、±0.002%的误差要求,相对误差(MRE)在5%以内,并且误差明显低于AMPSO-单核ε-SVM和PSO-混合核ε-SVM模型。由模型训练过程中的均方差也可以看出此模型在稳定性方面也具有一定优势。在混合气体预测过程中,训练样本浓度选择的不同以及样本容量的不同,都会对均方差(MSE)有所影响,在满足绝对误差和相对误差要求的同时,均方差尽量降低,这点在允许范围内。因此应用此方法建立气体定量分析模型是有效可行的。
本文将自适应粒子群算法用于优化支持向量机,并且支持向量机的核函数由RBF核函数和多项式核函数结合的混合核函数,以此取代传统的单核函数支持向量机,在此基础上建立混合气体浓度定量检测分析模型。对浓度范围分别在0~20%的CO2、0~10%的CO、0~5%的C3H8标准气体进行定量分析,实验证明该模型的预测精度明显高于以往的混合气体预测模型,符合国家关于尾气排放的检测标准,能够满足气体测量的实际需求。
与AMPSO-单核ε-SVM和PSO-混合核ε-SVM模型相比,在样本容量相同,样本浓度值不变的前提下,首先,AMPSO-混合核ε-SVM预测模型使得气体浓度检测结果相对误差和绝对误差均有所降低,预测精度得到提高;其次,收敛速度有所提高,表现在寻优时间短,迭代次数少;再次,AMPSO算法具有一定的抗干扰性,又因为引入了双核,使得的泛化性能和学习能力有所提高,表现在训练过程中均方差的减小,使得寻优参数能够实现稳定预测功能,具有较好的鲁棒性。因此,基于自适应变异粒子群算法的混合核ε-SVM模型在对利用汽车尾气传感器检测汽车排放的多组分气体定量分析建模中具有一定的发展潜力和挖掘空间。
[1]孙辉.基于红外吸收法多组分气体分析仪的研制[D].哈尔滨:哈尔滨工业大学,2009.
[2]Li Xiaowei,Che Xiaobo,Ma Jianhui.Based on the Principle of NDIR Infrared CO Concentration Detector[J].Shandong Coal Sci⁃ence and Technology,2009(4):86-88.
[3]曲健,陈红岩,刘文贞,等.基于改进网格搜索法的支持向量机在气体定量分析中的应用[J].传感技术学报,2015,28(5):774-778.
[4]曲健,陈红岩,刘文贞,等.基于自适应变异粒子群优化的SVM在混合气体分析中的应用[J].传感技术学报,2015,28(8):1262-1268.
[5]Manouchehrian Amin,Sharifzadeh Mostafa,Hamidzadeh,et al.Selection of Regression Models for Predicting Strength and De⁃ formability Properties of Rocks Using GA[J].International Jour⁃nal of Mining Science and Technology,2013,23(4):495-501.
[6]刘建国,安振涛,张倩.基于传感器阵列的可燃混合气体RBF网络分析[J].装备环境工程,2013(3):113-116.
[7]汤守鹏,姚鑫锋,姚霞,等.基于主成分分析和小波神经网络的近红外多组分建模研究[J].分析化学,2009,37(10),1445-1450.
[8]单黎黎,张宏军,王杰,等.一种改进粒子群算法的混合核ε-SVM参数优化及应用[J].计算机应用研究,2013,30(6):1636-1639.
[9]潘峰,李位星,高琪,等.粒子群优化算法与多目标优化[M].北京:北京理工大学出版社,2013:1-192.
[10]余盛威.MATLAB优化算法案列分析与应用(进阶篇)[M].北京:清华大学出版社,2015:1-533.
[11]田文奇,和敬涵,姜久春,等.基于自适应变异粒子群算法的电动汽车换电池站充电调度多目标优化[J].电网技术,2012,36(11):25-29.
[12]张一龙.三组分汽车尾气浓度传感器的研制哈[D].中国计量大学,2014.
[13]王小川,史峰,郁磊,等.MATLAB神经网络43个案例分析[M].第1版.北京:北京航空航天大学出版社,2013:1-394.
[14]卓金武,李必文,魏永生,等.MATLAB在数学建模中的应用[M].第2版.北京:北京航空航天大学出版社,2014:1-324.
刘文贞(1990-),女,河南商丘人,在读研究生,主要研究方向为检测技术,848990467@qq.com;
陈红岩(1965-),男,浙江杭州市,教授,研究生导师,浙江大学内燃机工程专业硕士、博士学位;上海交通大学动力与机械工程专业博士后。主要研究领域为汽车电子、发动机排放与控制等,bbchy@163.com。
Application of Mixed Kernel Function ε-SVM Based on Adaptive Mutation Particle Swarm Optimization in Multi Component Gas Detection*
LIU Wenzhen,CHEN Hongyan*,LI Xiaolu,YUAN Yuefeng,GUO JINGjing
(College of Quality and Safety Engineering,China Jiliang University,Hangzhou 310018,China)
Due to the simultaneous measurements of automobile exhaust gas by using the multi-component gases sensor based on the dispersion of light infrared method(NDIR),the text is the result of the cross absorption and in⁃terference,resulting in the large measurement error and low accuracy.To solve this problem,a kind of mixed kernel function ε-SVM based on adaptive mutation particle swarm optimization algorithm is put forword to establish a mod⁃el for the quantitative analysis of three component mixture gases.Collect the concentration signals of CO2,CO and C3H8as the model inputs,through the model regression analysis,the outputs are corresponding mixed gases concen⁃trations.thus,the problem of mutual interference can be solved.Finally,the performance of the model is analyzed through the experimental data,the result shows that the average error of the model is significantly reduced com⁃pared to the traditional model.
detection technique and automatic device;gas quantitative analysis;mixed kernel function;adaptive mutation particle swarm optimization algorithm;mixed kernel function;SVM
TP274+.2
A
1004-1699(2016)09-1464-07
项目来源:中国计量大学第十九届学生科研计划项目(院级)(16-4-26)
2016-04-28修改日期:2016-06-22
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!