时间:2024-05-22
林 晨,张方圆,吴凌涛,蔡大川,王李平,方 丽,林泽鹏,李雪莹
(中国广州分析测试中心 广东省化学危害应急检测技术重点实验室,广东 广州 510070)
气相色谱结合化学计量学分析4种食用植物油的指纹图谱
林晨,张方圆*,吴凌涛,蔡大川,王李平,方丽,林泽鹏,李雪莹
(中国广州分析测试中心广东省化学危害应急检测技术重点实验室,广东广州510070)
摘要:运用气相色谱法对4类植物油(橄榄油、花生油、菜籽油和大豆油)的脂肪酸组成进行分析,并构建了植物油的指纹图谱,对4类植物油进行鉴别和分类。采用连续投影算法(SPA)对变量进行筛选,选出11个特征变量。以特征变量作为输入,使用主成分分析(PCA)和有监督模式识别(径向基函数神经网络(RBF-ANN)、线性判别分析(LDA)和最小二乘-支持向量机(LS-SVM))进行建模分析。结果表明,11个特征变量能够较好地区分4类植物油,PCA获得了较好的分类,RBF-ANN的预报结果最佳,预报率为92.6%,并且能准确预报二组分混合掺杂油样。该方法能够准确区分植物油种类,可用于食用植物油的鉴别和掺杂食用植物油的鉴定。
关键词:植物油;橄榄油;气相色谱;指纹图谱;化学计量学;鉴别
食用油是人们膳食结构中不可或缺的重要组成成分[1]。近年来,食用油的安全受到来自“地沟油”、掺假油等劣质油的威胁。脂肪酸甘油酯是食用植物油的主要成分,也是其最为重要的营养成分[2]。脂肪酸为食用植物油中的特征成分,不同植物油的脂肪酸组成和含量有一定差异,在油脂质量检测中常被作为纯度检验指标[3]。
现有的植物油分类鉴定方法大多是以几种常规检测项目为依据来评价植物油质量的好坏,这些方法不能反映植物油中甘油三脂的整体化学特性,对于综合评价植物油品质有一定的局限性。气相色谱是目前分析脂肪酸成分的重要手段,可将食用植物油中的脂肪酸进行分离,得到其脂肪酸指纹图谱[4]。近年来,化学计量学发展成为多元数据处理、提取复杂体系中隐藏信息不可或缺的工具[5-6]。食用油脂肪酸图谱结合化学计量学方法是一种综合的、可量化的、直观的分析方法,已发展成为评价和鉴别食用植物油质量和品质的新型分析方法[7]。采用气相色谱结合化学计量学方法鉴别食用植物油的品质,能够有效鉴别食用植物油的种类,可为鉴定判别植物油种类和食用油的掺杂和勾兑提供技术支撑,对食用植物油的生产、销售起到一定的监管控制作用。
本文致力于将气相色谱获得的脂肪酸数据结合化学计量学方法来区分食用植物油的类别。首先应用Kennard and Stone(K-S)算法选择校正集和预报集样品;应用连续投影算法(SPA)筛选有效变量;应用主成分分析(PCA)、径向基函数神经网络(RBF-ANN)、线性判别分析(LDA)和最小二乘-支持向量机(LS-SVM)方法研究不同类别食用植物油的分类鉴别并建立校正模型。结果表明,SPA筛选变量后,再经过RBF-ANN模型分析,可成功区分4种常见的食用植物油。
1实验部分
1.1原料、试剂及样品制备
从广州市各大超市共收集食用植物油样品41个,包括特级初榨橄榄油样品6个,压榨花生油样品17个,菜籽油样品11个,大豆油样品7个(见表1)。混合油样的制备:大豆油和花生油的体积比1∶1。
脂肪酸甲酯混标(Nu-chekprep,Inc.);正己烷(色谱纯,广州化学试剂厂);KOH-甲醇(1 mol/L);三氟化硼甲醇(上海阿拉丁试剂有限公司)。Aglient 7820A气相色谱仪(美国安捷伦公司);毛细管色谱柱:HP-88(30 m×0.25 mm×0.25 μm);XW-80A旋涡混合器(上海琪特分析仪器有限公司)。
取0.02 g油样于10 mL比色管中,加入2 mL正己烷溶解,再加入1 mL KOH-甲醇溶液,涡旋1 min,加入三氟化硼甲醇0.5 mL,涡旋1 min,静置20 min。取上层清液,供气相色谱仪测定。
表1 食用植物油样品统计及K-S分集结果
1.2气相色谱工作参数
以He为载气,恒流流速3.0 mL/min,进样口温度260 ℃,FID检测器;升温程序:初始温度为100 ℃,保持2 min,以20 ℃/min升至170 ℃,以2 ℃/min升至200 ℃后保持10 min,再以5 ℃/min升至230 ℃后保持5 min。分流比为30∶1,进样体积为1.0 μL。
1.3化学计量学方法
所有的数据处理和程序运算均在MATLAB 6.5(Mathworks,Natic)软件下进行。
1.3.1相关优化翘曲方法(COW)COW常被用于校正色谱指纹图谱的保留时间漂移现象[8]。该方法通过相关系数的最大化累积效应从所有样品中选择1个样品作为参考数据向量,其余样品以参考样品为标准进行保留时间校正[9]。在COW算法中,可通过色谱图中峰宽和漂移程度来确定优化空间,然后通过单形设计(Simplex design)在此优化空间内确定段长和松弛的大小。
1.3.2Kennard and Stone(K-S)算法K-S算法是Kennard和Stone提出的一个用于多元空间选择样品的方法,所选的样品能够尽可能地覆盖所有的样品范围[10]。K-S算法主要用来选择具有均匀分布的校正集和预报集样品,依据欧式距离进行计算:
选择过程从具有最大欧式距离的(p1,p2)开始,在后续迭代过程中,K-S算法是选择具有最大欧氏距离的一对,一直重复直至达到分集要求。
1.3.3连续投影算法(SPA)SPA是多元校正中一种向前的变量选择方法,其原理是在向量空间中利用简单的投影算法来获得一个具有最小共线性的变量集[11]。
1.3.4主成分分析主成分分析(PCA)是一种将多个变量通过线性变换,选出较少个数的重要变量的一种无监督的多元统计分析方法,在数学分析中常用来降维[12-13]。一般将原始数据进行压缩后构建的一组新变量称之为主成分数(PCs),这些主成分数可以看成是原始变量的线性组合,主成分数之间是相互正交的。
PCA的分析模型如下:X=TPt
X为样本矩阵,T和P分别为对样本矩阵进行奇异值分解得到的得分矩阵和载荷矩阵。模型中的每个样品在主成分分数上分别定义为一个得分值,每个变量则对应一个载荷值。在尽量保留原信息的基础上,对原始数据进行转换,并将特征信息在前几个主成分中体现出来。通过对各主成分上载荷的对比可以找出对模型鉴别影响大的重要变量。
1.3.5径向基函数神经网络(RBF-ANN)RBF-ANN是一种强大的神经网络类型,计算过程分为两个步骤:第一步用一种聚类的无监督模式识别方法,第二步是有监督模式识别方法计算近似值。它包含一个只赋予隐藏的神经元输入层,一个由隐藏神经元组成的隐藏层,以及一个输出层。隐藏的神经元是从高斯贝尔曲线中衍生出的一个非线性转换函数,输出层神经元则有一个线性转换函数,该函数能够计算这些神经元的最优权重[14-15]。
1.3.6线性判别分析(LDA)LDA是一种常用的有监督模式识别方法,广泛用于非线性模型的分类分析。它首先是寻找能够分开两类或者多类样品的特征变量,将这些变量线性组合,再将这个线性组合用于线性分类或作为其他分类方法的数据前处理方法。LDA将不同类样品间的方差最大化从而保证了不同类样品间的最大分离。
1.3.7最小二乘-支持向量机(LS-SVM)LS-SVM在经典的支持向量机的基础上发展而来,它利用最小二乘线性函数作为损失函数,通过求解一组线性方程来代替传统的支持向量机(SVM)负责的二次规划求解问题,降低了模型计算过程的复杂性,提高了求解速度[16]。LS-SVM模型的公式为:
式中,k(x,xi)是核函数,xi是输入向量,ai是朗格拉因子(支持值),b是偏差项。核函数常选取多项高斯径向基函数。
图1 4类植物油的脂肪酸组成图谱Fig.1 GC chromatograms of the four species of vegatable oils1.olive oil,2.peanut oil,3.soybean oil,4.rapeseed oil,5.fatty acid mixed standards
2结果与讨论
2.1植物油中脂肪酸成分的定性定量分析
4类植物油样品经气相色谱分析后得到每个样品的脂肪酸组成色谱图,将样品色谱图与40种脂肪酸甲酯标准样品在相同色谱条件下得到的色谱图进行对比分析,并对色谱峰进行归属和确认。4类植物油的脂肪酸定性分析结果如图1所示。
采用面积归一化法,对油脂样品中各脂肪酸甲酯的含量进行定量分析,得到植物油的脂肪酸组成如表2所示。由表2可知,这4类植物油中含有10种共有脂肪酸成分,分别为C16∶0(棕榈酸),C16∶1(棕榈酸一烯酸),C17∶0(十七烷酸),C18∶0(硬脂酸),C18∶1(油酸),C18∶2(亚油酸),C18∶3(亚麻酸),C20∶0(花生酸),C20∶1(花生酸一烯酸),C22∶0(山嵛酸)。其中,4类植物油中棕榈酸和十七烷酸的含量很接近;花生油和菜籽油中的棕榈酸、棕榈酸一烯酸、十七烷酸、油酸、亚麻酸、花生酸、花生酸一烯酸、山嵛酸和木焦油酸的含量非常接近;花生油中硬脂酸与大豆油的含量非常接近。采用单个脂肪酸含量来分析和辨别不同类植物油不可靠。植物油之间的相似程度和区分结果由所有的脂肪酸组成成分来共同影响,其中一些含量低的成分往往具有不容忽视的作用。因此,采用化学计量学方法提取和分析样本间的整体信息,将得到更加准确可靠的分类效果。
表2 植物油中脂肪酸组成的定量分析结果
*no detected
2.2数据前处理
由于柱老化、柱污染、仪器的稳定性及其他环节因素的改变均可能引起基线漂移和保留时间的漂移。当采用全轮廓色谱数据构建指纹图谱进行分析时,基线漂移和保留时间的漂移均会对模式识别分类结果的准确性产生不利影响。因此基线校正和保留时间漂移校正非常必要。本文分别采用airPLS和COW算法进行基线校正和保留时间漂移校正。41个植物油样品的原始色谱图和经过校正后的色谱图如图2所示。通过对比可看出,原始色谱图中不同样品间的基线漂移不一,且保留时间有明显漂移,经过校正后,基线漂移和保留时间漂移得到明显改善。
2.3连续投影算法(SPA)应用于特征变量筛选
当采用全轮廓色谱对不同种类的样品进行区分时,由于色谱数据点较多(11 727 个),对计算机的内存要求较高,计算所需时间长,且载荷图(数据点变量)的解释困难。为提高PCA的运行速度和PCA分类图的可解释性,本文采用SPA算法对特征变量进行选取。首先采用K-S算法选择26个样品作为校正集,15个样品作为预报集(见表1)。通过SPA进行变量筛选,最终选取出6 603,3 582,5 903,5 229,4 903,4 882,5 404,5 317,3 547,3 573,9 399共11个变量。
图3 4种植物油样品的主成分分析投影图Fig.3 PCA score plot of four species of vegatable oils
2.4特征变量应用于主成分分析投影判别
将SPA算法选取的11个特征变量数据归一化后,进行主成分分析,前两个主成分的方差贡献率为67.21%,4种不同种类的植物油样品被很好地区分为4类(图3)。
表3 3种分类模型的预报结果对比
a:number of hidden neurons:8;increase of hidden neurons:21;Root-Mean-Square Errors:10-5;(隐藏神经元数:8;增加神经元数:21;均方根差:10-5);b:optimized parameters:gam(γ)=130,sig2(σ2)=69(优化参数:gam(γ)=130,sig2(σ2)=69)
从第一主成分上,菜籽油样品的得分为正,橄榄油和花生油样品的得分为负,而大豆油样品的得分处于-0.5~0.5之间。从第二主成分上,橄榄油的得分为正,花生油和大豆油的得分为负,而菜籽油的得分在-0.5~0.5之间。因而,投影双图上可以很好地将样品区分为4类:8号载荷将橄榄油样品与其他样品区分开;4,9号载荷将大豆油样品与其他样品分开,并帮助8号载荷将花生油样品鉴别出来;3,5,6,10号载荷将菜籽油样品聚为一类。PCA分类结果良好,同时也验证了采用SPA算法对变量的筛选是合理的。
2.5有监督模式识别方法
应用RBF-ANN,LDA,LS-SVM 3种有监督模式识别方法进一步研究区分或者预报4类植物油的可能性。K-S算法将41样品分为两个样品集:校正集和预报集,其中校正集26个,预报集15个(表1)。
3种有监督模式识别方法的分类结果见表3。结果表明,RBF-ANN模型具有最高的识别率:校正率100%,预报集92.6%;LDA和LS-SVM的识别率非常相似,均低于RBF-ANN。RBF-ANN结合气相色谱构建的二维指纹图谱可以对4类植物油样品进行正确区分,其区分度可达92.6%。
2.6混合样品的定量预报
RBF-ANN模型的预报结果较为理想,因此选用RBF-ANN对混合油样进行定量预报。将大豆油和花生油混合样品(1∶1)的色谱数据进行前处理作为RBF-ANN的数据输入。在RBF-ANN模型中,4类植物油的值分别设为:大豆油=1,花生油=2,菜籽油=3,橄榄油=4。26个校正集和15个预报集的实际值和预报值的相关散点图如图4A所示。从图4A可看出,大多数样品点落在直线y=x上,验证了RBF-ANN模型预报结果的准确性。通过RBF-ANN预报得到混合油样品的值,介于大豆油和花生油之间(图4B),与实际相符,说明RBF-ANN模型可用于二组分混合掺杂油的判别和预报。
3结论
本文采用气相色谱法测定了4类植物油(橄榄油、花生油、菜籽油和大豆油)的脂肪酸组成和含量,并构建了植物油的色谱指纹图谱,对4类植物油进行鉴别和分类。运用连续投影算法对特征变量进行选择,无监督(PCA)和有监督(RBF-ANN,LDA,LS-SVM)模式识别方法对4种植物油样品进行鉴别。实验结果显示,连续投影算法可以很好地解决变量选取问题,其中RBF-ANN模型结合色谱数据可获得最好的分类结果,其预报率达92.6%。化学计量学方法为建立植物油指纹图谱提供了强有力的手段,可以准确解析植物油的品种信息,为植物油的质量控制提供了一定的借鉴和参考。
参考文献:
[1]Jin Q Z,Wang X G,Li Q Y.Chin.OilsFats(金青哲,王兴国,历秋岳.中国油脂),2007,32(2):12-16.
[2]Ji S X,Wei F,Hu N,Lü X,Dong X Y,Chen H,Feng Y Q.J.Instrum.Anal.(藉淑贤,魏芳,胡娜,吕欣,董绪燕,陈洪,冯钰锜.分析测试学报),2014,33(1):112-118.
[3]Chen Y X,Ma Y X,Lu Y,He M,Yang Y X.Chin.J.FoodHyg.(陈月晓,马玉霞,陆颖,何梅,杨月欣.中国食品卫生杂志),2012,24(4):301-305.
[4]Wang T Z,Yu L,Qiu S C,Chen X J,Cai S Q,Cao W Q.J.Instrum.Anal.(王同珍,余林,邱思聪,陈孝建,蔡淑琴,曹维强.分析测试学报),2015,34(1):50-55.
[5]Dong W J,Ni Y N.J.Instrum.Anal.(董文江,倪永年.分析测试学报),2014,33(5):506-511.
[6]Ding X X,Ni Y N.J.Anal.Sci.(丁晓晓,倪永年.分析科学学报),2014,30(4):445-450.
[7]Gu T.ACombinationofChemometricsandGC-MSTechniquesinApplicationofEdibleOilandTumorCellClassification.Changsha:Hunan University(顾婷.化学计量学结合GC-MS技术在食用油与癌细胞鉴别中的应用.长沙:湖南大学),2013.
[8]Lucio-Gutierrez J R,Coello J,Maspoch S.Anal.Chim.Acta,2012,710:40-49.
[9]Lucio-Gutierrez J R,Garza-Juarez A,Coello J,Maspoch S,Salazar-Cavazos M L,Salazar-Aranda R,De Torres N W.J.Chromatogr.A,2012,1235:68-76.
[10]Daszykowski M,Walczak B,Massart D L.Anal.Chim.Acta,2002,468:91-103.
[11]Araujo M C U,Saldanha T C B,Galvao R K H,Yoneyama T,Chame H C,Visani V.Chem.Intel.Lab.Syst.,2001,57:65-73.
[12]Martens H,Naes T.MultivariateCalibration.New York:Wiley & Sons,1989.
[13]Wang N N,Feng X W,Sun Y P,Cong P S,Zhu Z L.J.Instrum.Anal.(王娜娜,冯昕韡,孙玉萍,丛培盛,朱仲良.分析测试学报),2013,32(10):1227-1231.
[14]Balabin R M,Safieva R Z,Lomalina E I.Anal.Chim.Acta,2010,671:27-35.
[15]Khajeh A,Modarress H.Expe.Syst.Appl.,2010,37:3070-3074.
[16]Guo H,Liu H P,Wang L.J.Syst.Simul.,2006,18(3):2033-2051.
Analysis of Fingerprints of 4 Species of Edible Vegetable Oils by Chemometrics Combined with Gas Chromatography
LIN Chen,ZHANG Fang-yuan*,WU Ling-tao,CAI Da-chuan,WANG Li-ping,FANG Li,LIN Ze-peng,LI Xue-ying
(Guangdong Provincial Key Laboratory of Emergency Test for Dangerous Chemicals,China National Analytical Center(Guangzhou),Guangzhou510070,China)
Abstract:Gas chromatography(GC) was used to determinate the composition and contents of fatty acids in vegetable oils,including olive oil,peanut oil,rapeseed oil and soybean oil.And the GC fingerprint profile was employed for the fingerprint analysis and species classification of the four species of vegetable oils.11 feature variables were selected by successive projections algorithm(SPA).Then,principal component analysis(PCA) and three supervised pattern recognition models:radial basis function artificial neural natwork(RBF-ANN),least square-support vector machine(LS-SVM),and linear discriminant analysis(LDA) were established to predict the species of the vegetable oils.The result demonstrated that the PCA obtained a clear clustering of objects respect to the species.RBF-ANN model performed better than the other two supervised pattern recognition models,with classification rate of 92.6%,and could predict the two component mixed oil sample accurately.The method could be used to distinguish the species of vegetable oil,and might be applicable for the identification of edible vegetable oils.
Key words:vegetable oils;olive oil;gas chromatography(GC);fingerprint;chemometrics;distinguish
收稿日期:2015-09-14;修回日期:2015-10-14
基金项目:广东省专业镇中小微企业服务平台建设项目(2013B091604003);广东省主体科研机构创新能力建设专项(粤科规财字[2014]208号);广州市天河区科技计划项目(2013B040402012)
*通讯作者:张方圆,硕士,研究方向:食品安全与质量控制,Tel:020-87603497,E-mail:zhangfyde@163.com
doi:10.3969/j.issn.1004-4957.2016.04.014
中图分类号:O657.71;TQ645.1
文献标识码:A
文章编号:1004-4957(2016)04-0454-06
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!