当前位置:首页 期刊杂志

利用 THz时 域谱技术和支持向量机回归法快速测定食用油的过氧化值和酸价

时间:2024-07-28

李向军 陈裕泉 李九生

(浙江大学生物医学工程与仪器科学学院1,杭州 310027)

(中国计量学院太赫兹应用技术研究所2,杭州 310018)

利用 THz时 域谱技术和支持向量机回归法快速测定食用油的过氧化值和酸价

李向军1,2陈裕泉1李九生2

(浙江大学生物医学工程与仪器科学学院1,杭州 310027)

(中国计量学院太赫兹应用技术研究所2,杭州 310018)

采用 THz时域谱技术得到 30个食用油样本的吸收谱,随机分为训练集和预测集,利用支持向量回归算法和标准方法测得的参考含量在训练集上建立了食用油酸价和过氧化值的预测模型,并应用此模型对预测集样本进行预测。结果表明该模型对食用油预测的相关系数较传统 PLS方法对比更为精确。

酸价 过氧化值 太赫兹时域谱 支持向量回归 偏最小二乘回归

太赫兹 (Terahertz,THz)波通常是指频率在0.1~10THz区间的电磁波。THz光谱技术可提取有机及生物大分子的震动和转动特征,为分子的构象提供了唯一的标识谱[1-2],用来做爆炸物、药物和气体等化学及生物样品的探测和识别[3-5],在物理学、化学、生物医学、天文学、材料科学和环境科学等方面具有重要的应用价值。THz光谱作为一种新型的快速、无损的检测技术,有可能成为荧光谱、红外谱等光谱检测分析手段的互补技术,在农产品与食品检测领域获得广泛应用[6]。

在食用油的各项品质指标当中,过氧化值和酸价是最重要的两项指标。我国国家标准规定,过氧化值采用碘量滴定法 (GB/T 5538),油脂酸价测定采用中性乙醚 -乙醇混合溶剂萃取脂肪酸,再使用碱标准溶液进行滴定法测定 (GB/T 5530)。这些理化方法易造成环境污染,同时测定时间较长,无法应用于实时监测。油脂的过氧化值和酸价还可以通过气相色谱法、液相色谱法和电化学方法等间接测定,但需要繁琐的预处理过程,费效比和时效性仍较差。紫外光谱[7]、荧光光谱[8]、近红外谱[9]等光谱分析法在无损和快速测量方面有独特的优势。其原理是决定过氧化值和酸价的化学基团在不同光谱波段具有特定光谱特征,并符合朗伯 -比尔定律。基于同样原理,通过测量过氧化值和酸价已知样本的 THz吸收谱,回归建立校正模型,来快速测量食用油的过氧化值和酸价。

在光谱定量分析中,常用的定标方法有多元线性回归 (MLR)、主成分回归 (PCA)、偏最小二乘回归(PLS)和神经网络法。与这些方法相比,基于Vapnik提出的“统计学习理论”[10]的支持向量回归(SVR)建模法,具有更好的泛化预测能力,建模速度也更快,并可避免过拟合现象。利用 SVR回归食用油酸价和过氧化值的 THz谱建立校正模型,用于快速测量酸价和过氧化值,并与 PLS算法所建立的模型进行了比较。

1 理论分析

支持向量机(SVM)理论对于用线性回归函数拟合样本数据的问题,若采用线性不敏感损失函数f(x)=wT·x+b拟合样本数据 (xi,yi)i=1,2,…n,xi∈Rd,yi∈R的问题,若采用线性ε不敏感损失函数:

引入松弛因子ζi≥0和ζ3i≥0,则问题转化为在约束条件:下,最小化目标函数:

式中,常数 C>0表示对超出误差ε的惩罚程度,即惩罚因子或正则化系数。使用 Lagrange乘子法可到其对偶问题,即在i∑=n1(αi+α3i)=0,0≤αi,α3i≤C条件下,对 Lagrange乘子最大化以下目标函数:

然后得到回归函数:其中 (αj+α3j)不为零时对应的样本成为支持向量,由于不敏感损失函数作用恰好位于回归函数周围半径为ε的“管道”壁上,可以很好避免“过拟合”现象,显著提高了回归模型的泛化预测能力。对于非线性问题,支持向量机回归方法的主要思想是将原问题通过非线性变换转化为某个高维空间的线性问题,并在高维空间中进行线性求解。即采用核函数K(xT

i·x)代替回归函数中的点积 (xTi·x),就可以实现非线性回归,得到非线性回归函数:

在 SVR运算中,多采用多项式、径向基、样条和S形等核函数。由于径向基函数的通用性较强,采用指数径向基核函数:

为回归核函数。

在研究设计的试验中利用太赫兹时域谱技术获得训练集样品中食用油吸收谱数据是 xi,i=1,2,…n,xi∈Rd,利用其他方法测到的食用油过氧化值和酸价的参考数据就是 yi,i=1,2,…n,yi∈R。这样可以建立式(6)表示的回归模型来用测试集样品的太赫兹吸收谱预测其过氧化值和酸价。

2 试验测试

2.1 试验材料

植物油样品为市购不同种类的食用油样品 30个,其中一些样品经过加热处理以改变其酸价和过氧化值来增加代表性,食用油的过氧化值和酸价参考值由国标法测定 (见表 1)。

表 1 30个食用油样品酸价和过氧化值的参考值

2.2 试验装置

试验装置如图 1所示。钛蓝宝石飞秒锁模脉冲激光器产生中心波长为 800 nm、重复频率为80 MHz、脉冲宽度为 100 fs的激光光源,输出功率 960 mW。进入 THz系统后,光束经分束镜分为较强的泵浦光和较弱的探测光。泵浦光被斩波器调制,经透镜聚焦后射向光电导天线砷化镓 (GaAs)晶体激发 THz脉冲。THz脉冲经过两个离轴金属抛面镜准直入射到样品上,再经过另两个金属抛面镜聚焦到达2 mm厚的碲化锌 ZnTe晶体,与经过延迟线的探测光汇合。这时 THz电磁辐射脉冲的电场通过线性电光效应调制电光晶体 ZnTe的折射率椭球,探测光偏振态随之发生改变,由平衡二极管进行探测,信号送入锁相放大器进行放大。并通过改变延迟线长度的方法探测 THz信号的整个时域波形。为了防止空气中水蒸气对 THz信号的影响,从产生 THz信号的 GaAs、样品到探测晶体 ZnTe的这一段光路被密封在充有氮气的箱体内。箱内的相对湿度小于 4%,温度为294 K。实验系统的信噪比为 1 000∶1,谱分辨率为20 GHz。

图 1 太赫兹时域谱测量装置

3 结果分析

使用图 1所示太赫兹时域谱测量装置测量 30个食用油样品的太赫兹时域谱,每个样品测量三次,取平均值作为待处理数据 (见图 2),其中参考信号是THz脉冲通过没有样品的比色皿时的波形。根据Dorney等[11]提出了 THz时域光谱技术提取材料光学参数的计算方法,可得到样品太赫兹波段的吸收谱 (如图 3所示 )。

利用标准方法测定的过氧化值和酸价作为参考值,建立 SVR回归模型。具体过程是首先随机分为包含 20个样品的训练集和包含 10个样品的预测集,在每个样品的吸收谱中取 0.2~1.5 THz的 130点有效数据作为回归建模运算的输入值。并对 SVR模型的误差ε,正则化系数 C和径向基核函数的宽度γ等参数进行优化。为了减小优化复杂程度,并按照建模误差要求,固定误差ε=0.01,对 C和γ采用格点搜索法确定最优值,其中校正标准偏差 (RMESCV)留一法计算。对过氧化值参数优化过程如图 4所示。在校正误差相同时,尽量取较小的 C和γ,以减小支持向量数,提高模型泛化预测能力。

图 4 S VR建模时校正标准偏差(RMESCV)随参数 C和γ变化情况

为了评价 SVR模型的预测精度,同时使用偏最小二乘回归 (PLS)建立了回归模型,PLS最佳的主因子数通过留一法交互验证法所得的预测残差平方和(PRESS)确定。最后,使用优化后的 SVR模型对测试集进行预测,并与 PLS的预测结果作了比较 (见表2,表 3)。从过氧化值和酸价的预测误差和实际 -预测相关图 (如图 5、图 6)及总体相关系数 (见表 4),可以看出 SVR的平均预测精度比 PLS模型高近50%显示了 SVR模型很好的预测能力。但两个模型总体的预测误差有比较大,平均超过了 9%,这是由于样品容量较小造成的。

表 2 测试集中 PLS与 SVR模型预测食用油酸价值的对比情况

表 3 测试集中 PLS与 SVR模型预测食用油过氧化值的对比情况

表 3 总体预测标准偏差与预测相关系数

4 结论

过氧化值和酸价是植物油品质的重要指标。通过测量食用油的 THz时域谱可以计算得到相应波段吸收谱,并利用朗伯——比尔定理可以建立回归模型快速检测过氧化值和酸价,具有重要的实用价值。采用 THz时域谱技术得到 30个食用油样本的吸收谱,利用 SVR和 PLS在样本训练结合建立了检测过氧化值和酸价的回归模型,并利用此模型对预测集样本进行预测。结果表明 SVR构造的预测模型比PLS具有更好预测能力,平均精度提高近 50%,显示了 THz时域谱技术快速定量分析植物油成分的良好前景。但两个模型总体的预测误差比较大,平均超过了 9%,这是由于训练样本容量较小造成的,将进一步增加样本容量和代表性,以建立符合实用标准的预测模型。

致谢:感谢首都师范大学太赫兹光电子实验室提供了试验仪器。

[1]Fischer BM,WaltherM,Jepsen Uhd.Far-infrared vibra2 tionalmodes of DNA componentsStudied by terahertz timedomain spectroscopy[J]. Phys.Med.Biol.,2002,47:3807-3814

[2]BrucherseiferM,NagelM,Bolivar HP,et al.Label-free probing of the binding state of DNA by time-domain tera2 hertzsensing[J].Appl.Phys.Lett.,2000,77:4049-4051

[3]Sylvia J M,Janni J D,Klein KM.Surface-enhanced Ra2 man detection of 1,4-dinitrotoluene impurity vapor as a marker to locate landmines[J].Anal.Chem.,2000,72:5834-5840

[4]颜志刚,侯迪波,曹丙花,等,核黄素和烟酸的太赫兹(THz)光谱研究[J].红外与毫米波学报,2008,(5):326-329

[5]胡颖,王晓红,郭澜涛,等.一氧化碳的太赫兹时域光谱研究[J].光谱学与光谱分析,2006,26(6):1008-1011

[6]闫战科,张宏建,应义斌.THz技术在农产品 /食品品质检测中的应用[J].光谱学与光谱分析,2007,27(11):2228-2234

[7]Car men M,Dobarganes.Joaquin Velasco.Analysis of lipid hydroperoxides[J].Eur.J.Lipid Sci-Technol.,2002,104:420-428

[8]王淑艳.氢化物发生原子荧光法在卫生检验中的应用[J].职业与健康,2005,21(2)217-219

[9]崔晓君,袁昌明,徐立恒.花生油中过氧化物的近红外光谱分析[J].应用化学,2008,25(3),375-377

[10]VAPN IK V.Statistical Learning Theory[M].New York:W ildy,1998

[11]TDorney,R Baraniuk,D Mittleman,Materialparameter es2 ti mation with terahertz time-domain spectroscopy[J].J.Opt.Soc.Amer.A,2001,vol.18:1562-1571.

RapidMeasurement of Edible Oil’ sAcid Number and Peroxide Value by Terahertz T ime-Domain Spectroscopy and SupportVector Regression

Li Xiangjun1,2Chen Yu Quan1Li Jiusheng2
(College ofBiomedical Engineering and Instrument Science of ZhejiangUniversity1,Hangzhou 310027)
(Insititute of THz Technology and Application of China Jiliang University2,Hangzhou 310018)

The terahertz band absorption spectrumsof edible oilwere obtainedwith 30 samples by terahertz time-domain spectroscopy(THz-TDS)technology.W ith support vector regression algorithm and reference values of oil’s acid number and peroxide measured by standard methods,the samples are randomly divided into training set and testing set to build a regression model to predict those acid numbers and peroxides.Results show that the models have significant advantage compared with the traditionalmethod of PLS.

acid number,peroxide value,terahertz time-domain spectroscopy(THz-TDS),support vector regression algorithm,PLS

O656.3

A

1003-0174(2010)02-0131-05

浙江省科技厅面上项目“食用油品质的太赫兹波快速检测仪开发与研制”(2008C23018)

2009-03-02

李向军,男,1976年出生,博士,太赫兹生物传感技术

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!