当前位置:首页 期刊杂志

小麦质量指标可见/近红外光谱动态检测方法研究

时间:2024-07-28

周星宇, 姜洪喆, 蒋雪松, 沈 飞,何学明, 张 祎, 莫晓嵩

(南京林业大学机械电子工程学院1,南京 210037)(南京财经大学食品科学与工程学院2,南京 210023)(江苏省粮油质量监测中心3, 南京 210031)

可见/近红外光谱分析技术具有低成本、高效率、无损等优点,作为一种快速分析技术之一,广泛地应用于各个领域,本文利用可见/近红外光谱分析技术对江苏13市的小麦样本进行小麦品质的动态检测。

小麦作为三大谷物之一,在全世界各地广泛种植,研磨而成的小麦粉可以制作成面包、馒头等食物,对人类的生活有着重大的意义[1]。民以食为天,粮食的安全与每一个人都息息相关,随着生活水平的提高,人们对于小麦品质的要求也越来越高,由于小麦的生产、加工、贮藏等原因,小麦品质容易劣变,如在贮藏期小麦水分先降低后升高,随着贮藏时间增加变化趋于稳定,不同的贮藏方式对湿面筋影响较大,如高温贮藏会使得湿面筋含量下降等。国内外很多学者研究利用近红外光谱分析技术研究了小麦的赤霉病、白粉病、呕吐毒素等病变,还研究了小麦的蛋白质、水分、灰分、湿面筋、硬度指数等关键指标。所以一种快速、简单的检测技术就十分重要,本文探索了利用动态可见/近红外技术实现对小麦品质的快速检测[2]。

可见/近红外光谱属于吸收分子光谱,吸收带主要是由低能电子跃迁、含氢原子团(N—H、O—H、C—H)的伸缩振动的倍频及组合频吸收产生[2-5]。原子团具有固定的震动频率,当分子受到红外线照射时,被激发产生共振[6-8]。分子振动的非谐振性使分子振动从基态向高能跃迁时产生可见/近红外光谱,通过测量物质吸收可见/近红外光能量大小,可以反应被测物质的特征[9,10]。

本研究利用动态光谱检测技术建立动态小麦质量指标的预测模型,对于推动可见/近红外光谱技术动态、在线检测有着重要的意义。本文同时还创新性的建立小麦硬度指数的预测模型,小麦硬度作为重要的加工指标,在小麦碾磨成小麦粉过程中,是制粉工艺和其他参数的重要指标。

可见/近红外光谱分析技术在获得样本信息时容易参杂噪声,所以需要找到合适的预处理和建模方式。本文采用偏最小二乘回归分析(PLSR)和BP神经网络(BP-ANN)两种建模方法,研究在不同预处理方法下小麦各品质PLS建模结果,还研究了在相同预处理下不同训练算法下建立的BP神经网络的模型。

1 材料与方法

1.1 小麦样品

本文采用的小麦样品来自江苏省南京、常州、无锡等13个市各县、乡、村共213份,为了保证样本具有一定的代表性,该样本的土壤环境包括沙土、黏土、淤土、半沙半淤、壤土等31种不同土壤环境,小麦品种有宁麦13、杨麦16、烟农19、镇麦12、苏麦199等78种不同小麦品种。因此选取的213份样本具有一定的代表性,可以用于研究。

本研究根据《GB 5009.3—2016 食品安全国家标准 食品中水分的测定》中直接干燥法测定小麦水分,根据《GB/T 21304—2007 小麦硬度测定法 硬度指数法》测定小麦硬度指数,根据《GB/T 5506.1—2008 小麦和小麦粉 面筋含量》中手洗法测定湿面筋,根据《GB 5009.5—2016 食品国家安全标准 食品中蛋白质的测定》中的凯氏定氮法测定小麦蛋白质。

1.2 小麦漫反射光谱动态采集

本研究采用可见/近红外光谱动态采集平台由三个部分组成:机械传送单元、信息采集单元和信息处理单元。该平台具有操作方便、速度易调节等优点。

图1 近红外光谱动态采集平台示意图

本研究采用德国蔡司ZEISS MCS 600光纤光谱仪和OMK500-H/NIR型漫反射探头,对213种来自江苏13市的小麦样本进行光谱采集,实验前将小麦样本平衡至室温24 ℃,开启光谱仪预热30 min,设置积分时间为100 ms,平均采集次数3次,采集波段为600~1 600 nm,将小麦样本置于样本架上,样本距离探头约为3 cm,启动传送带,设置传送带速度为0.1 m/s,采集小麦样本的动态可见/近红外漫反射光谱。

1.3 光谱预处理方法

由于固体颗粒大小、表面散射和光程变化对可见/近红外漫反射光谱的影响,需要对采集的光谱进行预处理,以提高光谱的与数据间的相关性,降低噪声的影响,本文研究了在不进行任何预处理和3种不同预处理下对同一种品质建模结果的影响[11-15]。光谱的预处理方法:标准正态变化算法(SNV); Savitzky-Golay卷积平滑法(S-G平滑);多元散射矫正(MSC)。

1.4 建模方法

本研究对不采用任何预处理和进行3种不同预处理方法分别进行建立偏最小二乘分析(PLS)模型,利用决定系数(R2)和均方根误差(RMSE)评价指标衡量建立模型的预测性能[15-23]。

同时本研究为了研究深度学习建模方法在小麦品质上的预测与回归能力,利用BP神经网络(BP-ANN)建立预测模型。本研究将小麦的光谱数据作为输入层,则m为每个样本的波点数256,n为1代表每个样本的品质,根据经验公式选择的隐藏层节点为25,其示意图如下。把样本的测试误差的范数用来衡量网络的优劣,再通过误差范数计算每一个个体的适应度值,使得误差范数减小[24]。在BP神经网络前向传播时,隐藏层有着激励函数对输入节点的数据进行处理,常用激励函数有sigmoid函数、tanh函数等,由于sigmoid函数收敛速率快,本文选择的激励函数为sigmoid函数[25]。在BP神经网络反向传播时,为达到均方根误差最小,需要不断对网络中的权重和偏置进行调整[26,27]。同时研究了4种不同训练算法对建模结果的影响,这4种算法分别为:梯度下降法(GD算法);赖文贝格-马夸特算法(LM算法);贝叶斯正则化算法(BR算法);共轭梯度法(CG算法)。

2 结果与讨论

2.1 可见/近红外吸收光谱分析

图2为213份样本通过ZEISS MCS 600光纤光谱仪和OMK500-H/NIR型漫反射探头采集到的光谱,区间为600~1 600nm,在可见/近红外光谱区间中,发现由于每一个样本自身所具有的特殊性,光谱曲线整体上看上去类似,但还是存在差异性[28-30]。由图2可以看出在970、1 210 nm处有明显的吸收峰。近红外光谱区与有机分子中含氢基团(O—H、N—H、C—H)振动的合频和各级倍频的吸收区一致,通过扫描样品的可见/近红外光谱,可以得到样品中有机分子含氢基团的特征信息[30-34]。在970 nm处为O—H基团的二级倍频吸收,在1 210 nm处为C—H基团的二级倍频吸收,这与小麦的品质有最直接的联系[35]。

图2 原始光谱图

2.2 不同预处理方法对小麦品质PLS建模结果的影响

利用上述几种预处理方法对光谱进行预处理,注意校正集与预测集需要以同一种预处理方法处理。为保证验证不同预处理方法的可靠性,以比较出哪一种预处理方法更适用于本实验。利用PLSR建立模型,以决定系数(R2)、均方根误差(RMSE)和RPD值作为评价指标进行验证。结果如下表,发现蛋白质在经过MSC预处理后的模型最好,决定系数为0.863 5和0.827 5,RMSEC为0.511,RMSEP为0.574,MSC预处理可以有效消除散射水平不同带来的光谱差异,从而增强光谱与数据间的相关性,该方法可以通过理想光谱修正光谱的几线平移和偏移现象,在这种预处理下的建立的蛋白质模型较好。水分在不经过任何预处理下建立的模型最好相关系数为0.908 9和0.878 5,RMSEC为0.291,RMSEP为0.379,预处理虽然可以减少噪声,但也可能丢失一部分敏感信息,降低了其预测能力。

预处理为SNV时,可以有效的消除固体颗粒大小、表面散射和光程变化对漫反射光谱的影响。湿面筋模型在经过SNV预处理后的建立的模型最好,相关系数为0.874 4和0.832 2,RMSEC为1.258,SEP为1.453,硬度指数经过SNV预处理后的模型较好,相关系数为0.757 2和0.725 7,RMSEC为2.162,SEP为2.162。发现小麦的硬度指数预测模型低于其他模型,由于小麦的硬度指数与水分有着直接关系,本样本水分含量范围广,建立预测模型难度较大。除了水分,其他小麦品质在经过预处理后的模型建立效果良好。

表1 不同预处理方法小麦品质PLSR建模结果

2.3 不同训练算法小麦品质BP-ANN模型结果的影响

由表2可以看出采用sigmoid函数为激励函数时,再比较上述4种不同训练算法时,发现利用GD算法和BR算法时,训练时长较另外2种方法,训练时间更长,利用BP-ANN建立模型,以校正集决定系数(R2)、交互验证均方根误差作为评价指标进行验证。发现小麦的蛋白质、水分和硬度指数利用BR算法其模型更好其训练集的Rc2分别达到0.875 7、0.955 1和0.723 7,预测集Rp2分别达到0.892 8、0.926 9和0.794 7,更适合回归分析;湿面筋利用LM算法其模型更好,其训练集的Rc2达到0.808 5,预测集Rp2达到0.743 6。由表2可知水分和湿面筋的预测集均方根误差高于训练集,可能产生的原因为训练率太小,陷入局部最优,也可能学习率过大或者数据噪声太大。同时发现蛋白质和硬度指数的预测集均方根误差低于训练集,产生的原因为数据集太小,数据集切分不均匀,也可能为模型正则化过多,训练时dropout过多。

表2 不同训练算法小麦品质BP-ANN模型结果

3 结论

本研究采集不同产地和不同土壤环境下的动态小麦光谱信息进行分析,结合PLSR和BP-ANN建立预测模型。

利用动态可见/近红外光谱分析技术,传送带在0.1m/s速度下获得的动态光谱,发现可以实现在动态环境下对小麦品质的定量分析;利用PLS算法,对获取的动态小麦光谱数据建立蛋白质、水分、湿面筋和硬度指数的预测模型,结果表明蛋白质在经过MSC预处理后的模型最好,水分在不经过任何预处理下建立的模型最好,湿面筋和硬度指数模型在经过SNV预处理后建立的模型最好。利用BP-ANN算法,对获取的动态小麦光谱数据建立蛋白质、水分、湿面筋和硬度指数的预测模型,比较4种不同的训练算法对模型的影响,发现利用BR算法,可以建立良好的蛋白质、水分、硬度指数的模型,利用LM算法可以建立良好湿面筋的模型。通过研究发现基于深度学习的建模方法对于可见/近红外光谱分析有着重要的意义。本研究发现,利用动态光谱建立的PLS和BP-ANN模型可以快速、有效的得到小麦的主要品质参数。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!