时间:2024-05-28
余松柏,赵小波,2,田 敏,邹胜琼,刘梦婕,周 军,2,张宿义,2,3
(1.泸州老窖股份有限公司,四川泸州 646000;2.国家固态酿造工程技术研究中心,四川泸州 646000;3.酿酒生物技术及应用四川省重点实验室,四川泸州 646000)
白酒酒醅的常规理化分析,作为酿酒企业重要的质量控制手段,其结果对于酿酒生产指导、酒醅配料调整、质量控制有着不可替代的作用。但是传统的理化分析方法存在着工作量大、耗时长、耗费人力多、结果反馈不及时等诸多问题,制约着其在大规模生产中的进一步应用。为解决此类问题,近红外光谱分析技术近年来逐渐引起行业从业人员的注意,利用其快速、无损、操作简单等特点,以期达到白酒酒醅的快速、大批量检测。
近红外光是指介于可见光与中红外光之间的电磁波,其波长介于0.75~2.5 μm之间,近红外光谱主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时所产生,其主要记录的是含氢基团XH(X:C、N、O 等)振动的倍频与合频吸收[1-2]。近红外光谱技术由于其操作简单,无损,无需前处理等优点,近年来,已在食品、化工、医药等行业广泛应用[3]。此外,在“中国制造2025”“工业4.0”等强调智能制造的大环境中,白酒生产向着机械化、信息化、智能化的发展必定是今后行业的发展方向,近红外其自身具有的大批量、可移动车载式以及在线检测等潜在的应用优势,在白酒行业的广泛应用,为白酒产业智能化发展奠定了技术上的可能。
近20 年以来,研究人员不断尝试将近红外光谱技术应用于白酒酒醅的分析。2003年,五粮液集团的赵东等[1,4]首次将近红外光谱技术应用于白酒的酒醅分析,研究人员使用布鲁克的Vector 22/N型近红外仪器,用于分析酒醅的酸度、淀粉、水分指标,完成了近红外光谱技术应用于白酒酒醅分析的首次开拓性工作。随后,将近红外光谱应用于酒醅的检验引起了各酒厂的广泛研究,汾酒集团的郝建国[5],剑南春酒厂的唐利[6],山东景芝酒业的曹建全[7],安徽古井贡的杨诗腾[2],安徽金种子酒业的林房[8],武汉黄鹤楼酒业的李良[9],江苏双沟酒业的姜福州[10]等研究者分别使用福斯(foss) InfraXact 型,布鲁克MPA 型,瑞士Buchi 型,Thermo Antaris II 型,赛默飞Nicolet Antaris Ⅱ型,Nicolet Antaris Ⅱ型,瑞士Buchi 等近红外仪器完成了适用于各自酒厂酒醅的近红外快检技术的开发工作。
纵观此类报道,近红外光谱法在我国酿酒行业酒醅分析方面的应用,仍然处于起步阶段,大多数的研究仍然还停留于实验室阶段;虽然在各自报道中,近红外检测酒醅,其所预测的理化指标精确度都取得了不错的效果,但是考虑到酿酒行业四季变化、环境温湿度变化(尤其是酿酒车间夏季的高温高湿环境)、酒醅状态变化、酒醅配料调整,生产工艺改变等外界干扰因素的引入,将近红外光谱技术应用于实际生产中,进行全生产周期酿酒酒醅的检测,在当前的研究报道中,增加建模样品的多样性及代表性,优化算法增加模型准确性等诸多问题仍亟待解决。
本文旨在通过利用近红外光谱技术,将过去近几年内的糟醅近红外光谱与理化指标一一对应,利用一阶导结合单位长度归一化(nle)等方法对光谱进行预处理,使用协同区间偏最小二乘法(SIPLS)、向后间隔偏最小二乘法(BIPLS)等算法对光谱波段进行优化选择,建立最终的近红外酒醅快速检测模型。此外,通过模型参数、后期模型外部盲样的理化分析数据作模型外部验证等方式最终评定模型的稳定性、准确性及可靠性。最终,以期利用样本数量的优势性,尽可能的涵盖生产中可能存在的内部及外部影响因素,建立一个覆盖样本数量广泛,代表性强的酒醅快检模型,以应用于酿酒车间酒醅的酸度、淀粉、水分的快速检测,为后期酿酒车间向智能化升级提供技术支持。
实验样品:所用酒醅皆取自于泸州老窖酿酒车间,按照五点取样法取样,尽可能降低样品的差异性。按照生产工艺的不同,分别从春夏秋冬不同季节均匀地收集样本。
实验仪器及软件:傅里叶变换近红外光谱仪(瑞士),光谱范围为10000~4000 cm-1,分辨率为8 cm-1,扫描次数为32。光谱采集软件为NIRWare Opreator(北京中安信达科技有限公司)、建模软件为NIRCal(北京中安信达科技有限公司)、算法选择为Matlab软件。
1.2.1 样品的化学测定值分析方法
依据国标法或企标法分别对每个样品进行水分、酸度、淀粉指标的检测,其中水分检测参考国标GB 5009.3—2016 直接干燥法,酸度检测参考国标GB 5009.239—2016,淀粉检测参考国标GB 5009.9—2016 酸水解法。
1.2.2 样品光谱的采集
采用傅里叶变换近红外光谱仪,InGaAs 控温检测器,以漫反射测量方式获取酒醅样品光谱信息。通过操作NIRWare Opreator 软件采集每个样品的光谱,每个样品重复测定3次。
光谱的预处理、偏最小二乘计算,SIPLS 算法等程序均在Matlab环境下运行。
1.2.3 模型参数计算方法
式中:n——样本个数;
YS——样本的理化分析数值;
YC——样本的近红外预测值;
YP——样本理化分析数值的平均值。
鉴于近红外分析属于间接分析方法,建模样品光谱质量、传统理化分析精确度、模型优化参数选择都会对近红外定量分析的准确度产生较大的影响[11]。除去建模优劣的影响外,实验室分析数据的准确度对于近红外模型的准确度至关重要,因此,我们对传统分析方法检测酒醅的数据是否满足建模需求进行了验证,选择酒醅分析中步骤最为繁杂的酒醅淀粉分析为例,选择5 份出窖酒醅样品,分别分配于实验员A、B、C、D、E、F 共6 人,每人做4个平行试验,对所得的结果进行相对极差和平均偏差计算,结果统计于表1。
表1 不同人员传统淀粉检测结果统计分析
由表1 可知,使用传统理化分析方法,分析酒醅分析过程最为复杂的淀粉,实验员A、B、C、D、E共5 人均取得了较好的效果,个人的相对极差及平均偏差皆满足要求,这表明传统的理化分析方法及实验室操作人员的检测水平,皆满足近红外建模需求,为建模工作的顺利开展奠定良好的基础。
采集酿酒车间近两年全部的酒醅出入窖样品的近红外光谱,删除部分未及时进行光谱赋值的数据,然后将光谱按照Kennard-Stone(K-S)方法将总的光谱样本分为校正集与验证集。此外,保持适当比例同时期的非建模样本作为新建模型验证的测试集。分别按照出窖、入窖类别建立酒醅的酸度、淀粉、水分近红外快检模型。
2.2.1 淀粉模型建立
共采集到淀粉已赋值光谱3376 条,其中入窖酒醅光谱1425 条,出窖酒醅光谱1951 条,使用Matlab 进行算法选择对波段进行优化,使用建模软件NIRCal 对光谱进行预处理并建立模型。使用决定系数R2及预测标准偏差RMSEP 对模型进行评价,确定模型主成分数(PCs),建立出入窖酒醅快检模型。
最终,入窖酒醅淀粉模型采用趋近归一化(ncl)及一阶导数(db1)作为光谱预处理方法,采用协同区间偏最小二乘法(SiPLS 作为)作为波段选择方法,最终模型选择波段5504~6400 cm-1、6404~7000 cm-1作为建模波段区间,以偏最小二乘法(PLS)建立模型,最终模型PCs 为9,RMSEP 为0.4096,决定系数R2为0.8362。入窖建模样本其自身理化值及模型预测值散点分布图如图1。
图1 入窖酒醅建模样本淀粉理化值及模型预测值散点分布图
出窖酒醅淀粉模型最终光谱预处理方法选择为Segment 5 Gap5 的3点二阶泰勒求导(ds2),建模波段选择为4304~4600 cm-1、5504~6400 cm-1。最终模型PCs 为8,RMSEP 为0.3052,决定系数R2为0.9192。出窖建模样本其自身理化值及模型预测值散点分布图如图2。
2.2.2 水分模型建立
图2 出窖酒醅建模样本淀粉理化值及模型预测值散点分布图
共采集水分已赋值光谱2837 条,其中入窖酒醅光谱1049 条,出窖酒醅光谱1788 条。最终入窖酒醅水分模型选择预处理方法9 点卷积平滑(sg9)及一阶导结合单位长度归一化(nle),建模波段选择 为4304~4600 cm-1、5504~6100 cm-1、7600~7904 cm-1。最终模型PCs 为7,RMSEP 为0.5871,决定系数R2为0.8888。入窖建模样本其自身水分理化值及模型预测值散点分布图如图3。
图3 入窖酒醅建模样本水分理化值及模型预测值散点分布图
出窖酒醅水分模型选择光谱预处理方法整点散射校正(mf),建模波段选择为5504~6100 cm-1、6400~6700 cm-1、7600~7904 cm-1。最终模型PCs为9,RMSEP 为0.4766,决定系数R2为0.9118。出窖建模样本其自身水分理化值及模型预测值散点分布图如图4。
2.2.3 酸度模型建立
图4 出窖酒醅建模样本水分理化值及模型预测值散点分布图
采集酸度已赋值光谱4199 条,其中入窖酒醅光谱1732 条,出窖酒醅光谱2467 条。最终入窖酒醅酸度模型选择光谱预处理方法为趋近归一化(ncl)及一阶导数(db1),建模波段选择为4304~4900 cm-1、5804~6400 cm-1。最终模型PCs 为9,RMSEP 为0.0714,决定系数R2为0.8776。入窖建模样本其自身酸度理化值及模型预测值散点分布图如图5。
图5 入窖酒醅建模样本酸度理化值及模型预测值散点分布图
出窖酒醅酸度模型选择光谱预处理方法为Segment 5 Gap5 的3 点二阶泰勒求导(ds2),建模波段 选 择 为4300~4600 cm-1、4904~5500 cm-1、5804~6100 cm-1。最终模型PCs 为10,RMSEP 为0.0922,决定系数R2为0.9427。出窖建模样本其自身酸度理化值及模型预测值散点分布图如图6。
2.2.4 模型评价
在模型不过度拟合的前提下,预测标准偏差RMSEP 其数值越低,代表模型的效果越好;R2称为决定系数,其可以认为代表真值与预测值的相关系数的平方,R2越接近于100,其代表模型预测值与理化值越接近。通常在一个模型中,如果样品组分的最大值和最小值之间差值越大,决定系数R2越大[1,6]。
表2 泸型白酒酒醅近红外模型相关信息汇总
图6 出窖酒醅建模样本酸度理化值及模型预测值散点分布图
新建立近红外模型的各相关信息汇总于表2中,考虑到所建立模型样本含量基数大,指标理化范围跨度大,样本包含外界变化因素多以及理化测定存在的一定误差,从目前模型的参数水平上来看,总体上来说建立的模型是比较良好、稳定的。参考其他酒厂报道文献中所建立模型的参数,我们所建立模型也是比较符合行业目前主流水平的。
除去建模时,选用一定比例的非建模样品(建模样品同时间段样品)作测试集,来评价模型预测准确性外,为进一步验证所建立模型的预测效果,在模型建立完成后的,抽取一定比例的后期近红外检测样品,作为盲样,对模型进行外部验证,来评判模型的预测性能。结果见图7。
图7 淀粉模型预测绝对误差分布图
被抽取参与验证的盲样,对其模型预测值与理化分析值的绝对误差进行统计分析。淀粉模型预测情况的绝对误差分布图如图7,其中参与验证的入窖盲样197 个,出窖116 个。从图7 中绝对误差分布情况来看,模型预测效果整体是比较可靠的,总体来说,出窖模型要优于入窖模型,这与模型参数RMSEP(入窖0.4096,出窖0.3052)所反映的模型预测情况是一致的,出窖模型中淀粉预测值与理化值绝对差值<1.5 的样品占比达到96.55%,入窖样品占比达到87.31%。
水分模型预测值与理化值绝对差值分布图如图8,其中参与验证的盲样,入窖198 个,出窖115个。总体来说,入窖模型与出窖模型预测效果相差不大,整体预测效果比较可靠稳定,模型预测值与理化数值绝对差值<1.5的样品占比皆达到了92%以上。
图8 水分模型预测绝对误差分布图
酸度模型预测值与理化值的绝对差值分布图如图9,其中参与验证的盲样入窖个数200,出窖个数118。在模型参数中,入窖RMSEP 值为0.0714 优于出窖RMSEP 值0.0922,从模型盲样验证情况对比来看,入窖模型整体预测性能也是优于出窖模型的,其预测绝对差值<0.3 的样品占比相较于出窖的92.37%,入窖占比达到95.50%。
图9 酸度模型预测绝对误差分布图
2.4.1 季节性的工艺调整
酿酒生产随着季节的变化,往往会在酒醅配料上进行调整以适应外界环境的变化。以入窖为例,我们曾统计过不同季度的入窖酒醅其各指标理化均值及其最大值与最小值情况,随着季节的改变,酒醅的理化数据往往会发生一定规律上的变化。一般来说,二三季度的酒醅水分均值一般高于一四季度。水分和淀粉作为酒醅理化数据中的相对值,水分占比大,势必造成淀粉相对含量的减少,故二三季度的淀粉均值一般低于一四季度。酸度上二三季度均值总体上高于一四季度。考虑到酒醅指标变化的波动性,因此建立适用于全年流水线式的近红外酒醅检测模型适用于生产,酒醅模型的样本数量足够大,代表性足够广泛是极其重要的。
2.4.2 检测时效性的影响
酒醅作为一种酿造过程中的样品,其变化因素多,富含多种活性微生物。作为发酵过程中的半成品产物,其理化指标始终处于一个动态的变化中。为保证建模精确度,这要求在建模过程中,需尽可能缩短理化分析与近红外光谱扫描的时间间隔,提高酒醅检测的时效性,以降低间隔时间可能带来的精度影响。这也从另外一个方面说明,此类处在动态变化中且属于反应过程中的产物,其变化因素多,势必要求建模样品多,建模周期长。
本研究利用近红外光谱技术建立了泸州老窖酒醅快速定量分析模型,所建立模型样本基数大,时间跨度覆盖整个酿酒生产周期,理化指标范围足够覆盖整个生产周期样本各自的情况,总的来说模型比较接近于实际生产。模型光谱以近红外漫反射的方式采集,所建立模型中,使用整体散射校正(mf)、趋近归一化(ncl)等手段对光谱进行了预处理,对于特征光谱波段也进行了筛选,最终利用偏最小二乘法建立模型。此外,我们利用外部盲样作为验证,对模型进行了预测效果的外部判断,最终,在允许的检测误差范围内,该模型预测效果是比较稳定可靠的。
近红外光谱技术其批量性、快速性的检测特点满足酿酒车间智能化发展的方向,为酿酒行业实现过程控制,在生产中实现酒类食品质量预警,提高产品的优良率提供了技术上的支持。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!