当前位置:首页 期刊杂志

基于PLS和PCR的葡萄酒酒精度近红外光谱研究

时间:2024-05-28

常瑞红,邵高超,李 娜,蔡 闯,毕研芳

(江苏洋河酒厂股份有限公司,江苏宿迁 223800)

近红外光谱(near infrared spectroscopy,NIS)分析技术是一种光谱学与化学计量学相结合的一种现代化分析技术,是通过对物质的透射或者反射光谱来分析其分子结构特点及其化学组成[1]。从近红外光谱图中可以得到样品物质的结构、组成、浓度等化学信息,可实现对样品便捷、快速、无损、高效、定性/定量分析,现已广泛应用于食品[2-3]、农业[4-5]、化工[6]等行业。

由于近红外光谱谱区的吸收强度较弱,信噪比低,同时受样品均匀度、仪器等噪声干扰,光谱易发生重叠和基线的漂移现象。因此,在建立模型时,采用适当的光谱预处理方法可有效消除背景噪音,提高谱图与化学成分之间的相关性,大大提高模型预测能力[7]。对于液体样品,常用的光谱预处理方法有平滑处理、求导、标准正态变量校正等,平滑处理是消除噪声的常用方法;标准正态变量校正(SNV)用于校正样品散射引起的光谱误差;求导处理可有效消除背景干扰,其中一阶导数处理可去除部分线性或接近线性的背景、噪声光谱对目标光谱的影响[8]。但由于导数处理可能使信噪比降低,因此在对光谱做导数预处理时先对其进行平滑预处理。

偏最小二乘法(PLS)和主成分回归法(PCR)是两种不同的建模方法,都能实现对光谱数据降维的目的,是近红外光谱建模分析中常用的化学计量学方法[9]。目前近红外光谱分析中定量模型构建比较单一,采用不同的化学计量学方法构建模型的研究相对较少。本实验运用近红外光谱技术检测葡萄酒中的酒精度,采用不同光谱预处理,并运用PLS和PCR两种化学计量学算法建立模型,对比分析两种方法建模的差异,并根据决定系数(R2)、校正均方根误差(RMSEC)和预测均方根误差(RMSEP)3个指标来评价模型的预测能力,旨在明确两种化学计量学在建模中的差异,为今后模型构建提供理论支持。

1 材料与方法

1.1 材料、仪器

酒样:116个葡萄酒样品,江苏东帝星徽国际贸易有限公司提供。

仪器设备:NIRMaster傅里叶变换近红外光谱仪(配有高性能样品杯和透反射盖),瑞士BUCHI公司;温度计和酒精计,冀州市耀华器械仪表厂;500~800 W电炉,弗恩森(北京)电炉有限公司。

1.2 试验方法

1.2.1 化学值测定

葡萄酒酒精度的测定按照GB/T 15038—2006葡萄酒、果酒通用分析方法。

1.2.2 光谱信息采集

将葡萄酒样品摇匀后,先用待测样清洗高性能样品杯3次,随后缓缓倒入约20 mL待测样于样品杯中,再小心将透反射盖盖上(防止样品杯底部有液泡产生)。使用NIRWare Opreator软件进行光谱采集;NIRCal软件进行建模;测量池选择NIRFlex Liquid液体测量池;近红外光谱测量波长范围10000~4000 cm-1;以空气为内参比;光谱扫描32次,仪器分辨率8 cm-1;每个样品重复采集3次,取平均光谱为最终分析光谱。

1.2.3 光谱预处理和模型建立

在建模时,为了去除噪声、提高谱图中的有效信息,选择合适的光谱预处理非常必要。常用的光谱预处理方法为平滑处理、求导、标准正态变量校正等。本研究通过多次试验,选取几种较好的预处理方式,并且基于PLS和PCR计算方法,在不同光谱预处理方法下建立葡萄酒酒精度模型,通过比较模型结果及预测盲样的效果对两种算法下的模型进行评价。

2 结果与分析

2.1 光谱预处理

近红外光谱图不仅包含了样品的吸收信息,也包含了一些与样品性质无关的噪声信息,如光散射、仪器影响、样品不均匀等引起的干扰信息,导致近红外光谱基线倾斜、漂移等现象。图1为采集到的116个葡萄酒样品的原始光谱图,由图1可知,在10000~4000 cm-1光谱范围内葡萄酒样品有独特的吸收特性,且样品近红外谱图都较相似,但在整个光谱波段区域吸收峰存在一定重叠、平移等现象,不能有效反映样品相关性信息。因此,在定量建模时,为了消除来自高频随机噪声、样本不均匀、基线漂移、光散射等的影响[10]。采用合理的光谱预处理方法,构建稳健性和预测能力都较强的模型,可有效提高样品分析的准确度和精确度[11]。

图1 葡萄酒样品的原始近红外光谱图

葡萄酒为质地均匀的液体样品,本实验采用不同光谱预处理方式进行多次尝试,选取相对较好的光谱预处理方法应用PLS和PCR算法建模,结果见表1。

表1 不同光谱处理方法应用PLS和PCR算法建模结果

由表1可知,基于PLS和PCR算法下,采用不同光谱预处理均可得到评价模型较好的参数,表明所建模型均具有一定的准确性和稳定性。在PLS算法下,经过光谱预处理建模的结果优于未经过预处理的,且3种光谱预处理方法建立的模型结果接近,相比较而言,平滑处理和求导的效果最好,其F1为5,R2最接近1,RMSEC和RMSEP最小且最相近;而在PCR算法下,平滑处理和求导处理后建立的模型效果是最差的,而经过SNV处理后建立的模型是较好的,F1为7,比PLS模型下的大,说明采用PCR模型运算量较大,且模型相对复杂[12]。R2最接近1,RMSEC和RMSEP最小。综合比较,采用光谱预处理建立的模型不一定优于未经过光谱预处理的,需多次试验,寻求最合适的预处理方法,以建立稳健性较好的模型。

经过试验选取,得到的最优预处理光谱图见图2,由图2可知,经过预处理后的近红外光谱,可有效消除原始光谱中的漂移,强化了谱带特征,为获得稳健模型奠定了基础。

2.2 模型的建立与预测

从上述不同预处理方法建立的葡萄酒酒精度的模型中,选取最优回归模型,结果见图3。

图2 预处理后的光谱

图3 酒精度的回归模型

由图3可知,横坐标表示葡萄酒酒精度的真值,纵坐标表示葡萄酒酒精度的预测值,两种算法下的拟合曲线都较好,其中PLS模型的R2为0.9657,RMSEC 为 0.0862,RMSEP 为 0.0892,PCR模型的R2为0.9594,RMSEC为0.0935,RMSEP为0.0999,通过比较模型评价指标可知,两种算法下建立的模型效果均较好,但PLS构建模型的R2、RMSEC、RMSEP均优于PCR构建模型,且RM-SEC、RMSEP越小预测结果越准确。所以,PLS模型预测精度高于PCR模型。

表2 预测集样本的预测值

利用建立的葡萄酒酒精度定量模型预测11个盲样,结果见图4和表2,由图4可知,两种模型的预测值与化学测量值相关性都可接受,但PLS算法下建立的模型R2值(0.9757)高于PCR算法下R2值(0.9037);由表2可知,比较两个模型的相对误差,PLS的较集中,模型稳定性好,PCR相对离散,PLS的相对误差整体上小于PCR的,说明PLS预测准确度高于PCR的,表2中PLS模型的RMSEP为0.2691,PCR模型的RMSEP为0.3485,说明PLS建立的模型预测效果优于PCR。将预测值和化学实测值进一步做t检验,在0.05显著性水平下,两个模型预测值与化学测定值均无显著性差异,说明两种模型均具有可接受的预测能力,满足常规分析精度的要求。综合比较两种模型,PLS模型的预测精度较高,所以,采用PLS算法构建的葡萄酒酒精度模型预测效果较好。

图4 预测值与化学值相关图

3 结论

本研究采用傅里叶变换近红外光谱结合两种化学计量学方法(PLS和PCR)分别建立葡萄酒酒精度的定量模型。结果表明,同一光谱预处理方法对两种模型的影响不同,建模时需多次实验以便选择合适预处理方法;两种算法构建模型结果均较好,采用PLS构建的模型R2为0.9657,RMSEC为0.0862,RMSEP为0.0892,采用PCR构建的模型R2为0.9594,RMSEC为0.0935,RMSEP为0.0999;两种模型预测效果均可接受,其R2均大于0.9,且与化学测量方法无显著性差异(0.05水平下),但PLS模型的精度和稳定性稍优于PCR。由以上可知,近红外光谱结合PLS和PCR算法构建的模型都可预测得到葡萄酒酒精度的理想结果,但采用PLS算法建立的模型预测效果更好,模型具有较高的可靠性和精密性,能实现葡萄酒生产中对酒精度的快速检测需求。

[1]YAN L,ZHAO L L,ZHANG L D.Application of near infrared spectroscopy[M].Beijing:China Light Industry Press,2005.

[2]彭帮柱,岳田利,袁亚宏,等.苹果酒发酵过程中糖度近红外光谱检测模型的建立[J].光谱学与光谱分析,2009,29(3):652-655.

[3]DAMBERGS R G,KAMBOURIS A,FRANCIS I L,et al.Rapid analysis of methanol in grape-derived distillation products using near-infrared transmission spectroscopy[J].Agric food chem,2002,50(11):3079-3084.

[4]李毅念,姜丹,刘璎瑛,等.基于近红外光谱的杂交水稻种子发芽率测试研究[J].光谱学与光谱分析,2014,34(6):1528-1532.

[5]吴军,白琪林,苏胜宝,等.近红外反射光谱法分析玉米秸秆纤维素含量的研究[J].分析化学,2005,33(10):1421-1423.

[6]JOHNSO T J,MASIELLOT,SHARPE S W.The quantitative infrared and NIR spectrum of CH2I2 vapor:vibrational assignments and potential for atmospheric monitoring[J].Atmospheric chemistry and physics,2006,9(6):2581-2591.

[7]尼珍,胡昌勤,冯芳.近红外光谱分析中光谱预处理方法的作用及其发展[J].药物分析杂志,2008,28(5):824-829.

[8]浦瑞良,宫鹏.高光谱遥感及其应用[M].北京:高等教育出版社,2000.

[9]褚小丽.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011.

[10]田海清,应义斌,徐惠荣,等.西瓜可溶性固形物含量近红外透射检测技术[J].农业机械学报,2007,38(5):111-113.

[11]黄庄荣,沙莎,荣正勤,等.基于近红外技术快速无损分析整粒棉籽中的脂肪酸含量[J].分析化学,2013,41(6):922.

[12]杨春梅,李宁,赵学玒,等.用于果蔬内部品质无损检测的NIRS技术新进展[J].激光与红外,2009,39(11):1137-1141.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!