当前位置:首页 期刊杂志

基于神经网络的白酒固态发酵中关键酸酯比预测与分析

时间:2024-05-23

祝田田,张力,杜成成,张保华

1.安徽大学电子信息工程学院(合肥 230601);2.安徽大学集成电路学院(合肥 230601)

固态发酵是我国白酒酿造中独有的生产工艺。固态发酵通过微生物群落的代谢将酒醅中的糖类转化成酒精及各种酸酯等呈香物质。其中,发酵产生的少量酸酯关系到白酒的口感体验,测定酒醅发酵过程中酸类和酯类化合物的含量[1],以获得最佳的风味和质量成为白酒发酵技术研究热点。

业界对酒醅酸酯比值获取,多由酒醅采样、理化实验室化验测定并经相关公式计算等一系列操作实现,过程繁琐且效率低下。随着人工智能技术与传统行业深度融合,业内初步开展白酒固态发酵窖池内部各种参数预测的研究。余天阳[2]提出的基于时延神经网络的酒醅温度时序预测,模型预测精度较高,为掌握窖池内部温度实时变化提供了解决方案;王昆等[3]提出的建立偏最小二乘软测量模型,预测清香型白酒发酵过程中窖池内的水分、酸度和淀粉含量,为预测白酒发酵产物提供方向。将发酵历史数据和发酵变量参数进行关联度分析,运用物联网技术实时监测重要发酵参数指标,构建并训练神经网络,对关键酸酯比进行分析预测,将显著提高工作效率,同时也为发酵过程调控进行有益探索。

在国内某大型白酒企业对其浓香型白酒展开发酵过程中的酒醅酸酯比预测研究。该酒企采用小麦、大麦和豌豆等作物混合作为酿酒原料,其配比约7∶2∶1,通过多菌种(如乳酸菌、酵母菌、霉菌和放线菌等)参与的窖池固态发酵。发酵中,乙酸和乙酸乙酯含量主要受温度和酒精度的影响;CO2浓度和蛋白酶的活力通过影响酸酯化学反应干预乙酸乙酯生成乙酸;水分和酸度通过影响酵母菌等微生物的生长也会影响乙酸的生成[4]。通过对影响乙酸和乙酸乙酯含量的变量参数进行关联度分析后确定预测模型的输入;选择乙酸与乙酸乙酯质量的比值作为预测对象;实时监测发酵前2周的温度、水分、酸度、酒精度、CO2浓度和蛋白酶活力等参数对发酵时乙酸与乙酸乙酯的比值进行预测,判断窖池内的变化是否正常,从而合理调节窖池的环境,生产出高质量白酒。

1 数据来源和预处理

1.1 数据来源

数据来源于国内某大型白酒企业,其中温度、水分和CO2浓度均由窖池监测系统测得。酸度、酒精度以及蛋白酶活力通过监测系统无法采集,需要人工采样测定。

乙酸与乙酸乙酯质量的比值则由反应式中各物质间数量关系计算得出[8]。乙酸乙酯生成乙酸的化学式为式(1)。

式中:CH3COOC2H5为乙酸乙酯,H2O为水,CH3COOH为乙酸,C2H5OH为乙醇。

化学反应式的平衡常数K表示为式(2)。

式中:c(CH3COOH)、c(C2H5OH)、c(CH3COOC2H5)和c(H2O)分别为乙酸、乙醇、乙酸乙酯和水的浓度,mol/L。

因为一定温度和压强下的平衡常数K固定,通过测量乙酸乙酯、水、乙酸和乙醇的浓度即可得到,因此在平衡条件下乙酸与乙酸乙酯的比值就可通过式(3)计算得出。

式中:m(C2H4O2)和m(C4H8O2)分别是乙酸和乙酸乙酯的质量,g;V/V为发酵过程中白酒的酒精度,%vol;ρ(H2O)和ρ(C2H6O)分别为当前温度下水和乙醇的密度,是2个具体的数值,g/m3;T为绝对温度,K。

1.2 数据预处理

数据采集之后会有部分数据明显偏离其他数值,形成野值[9]。为处理野值,使用滑动窗口的异常点探测法进行判别并将异常值用修剪平均值替换[10]。

设某个窖池某季节下的数据长度为k,含有6个变量,即温度、水分、酸度、酒精度、CO2浓度和蛋白酶活力,其数据序列可表示为x(t)=[x1(t),x2(t), …,x6(t)],l≤t≤k,其中变量i的第j个长度为l的滑动窗口,可以表示为si,j=[xi(j),xi(j+1), …,xi(j+l-1)]。该滑动窗口实际上是一段数据子序列,且长度为l。

每个滑动窗口的变化趋势可以用置信区间的距离半径表示[11],依据此值便可对异常点进行判别。变量xi的第j个长度为l的滑动窗口si,j=[xi(j),xi(j+1), …,xi(j+l-1)]的置信区间的距离半径为式(4)。

根据得到的变化趋势值,给出一个疑似异常点的判别方法。含有6个变量的数据序列x(t),按照目标窗口对每个窗口j计算其距离半径di,j,并进行划分,由预先设定的阈值T进行判断,如果在窗口j中存在某个变量x的距离半径di,j>T,则认为该窗口中可能存在异常点。

为使异常点位置的判断更为准确,需要对相邻窗口之间的关联信息进行分析,对初步筛选出的可能为异常点的位置进行再次判别,得出相对变化趋势数值特征。用各滑动窗口基于式(4)中提取的变化趋势数值特征定义其相对变化趋势数值,记为式(5)。

对于研究的预测模型,给出二次判断方法。数据序列x(t)有6个存在联系的变量xi,i=1, 2, 3, 4, 5, 6,设这6个变量的第j个目标窗口的相对变化趋势值为Ωi,j,若式(6)成立,则表明数据序列该位置处有异常点。

式中:γ为阈值。

白酒生产周期的前2周尤为重要,为确保发酵过程顺利进行,选择发酵车间随机3个窖池在春季和冬季前2个星期的发酵参数数据。每个窖池每个季节下的每组数据时间间隔为3 h,数据预处理后共112组数据,3个窖池两个季节下的数据共112×6组。以窖池1的春季数据为例,图1(a)是窖池1春季数据预处理前的温度图像,图1(b)是窖池1春季数据预处理后的温度图像,其中纵轴表示该窖池每天8组温度数据的方差,横轴代表发酵天数。图2是窖池1春季数据预处理后的水分、酒精度、酸度、CO2浓度和蛋白酶活力图像。

图1 窖池1春季温度数据预处理前后图像

图2 窖池1春季数据预处理图像

观察图1(a)和图1(b)可以得到,在进行数据预处理之前,由于个别异常值的影响,在这一天采集到的温度数据出现较大方差。然而,在进行数据预处理后,使用修剪平均值替换这些异常数据,数据的取值在一个合理的波动范围内,从而使方差恢复到正常水平。图2是除温度外的其他参数数据经过预处理的图像,可以看出每个参数2周内的数据方差都在较小的范围内波动,这表明数据预处理过程有效地处理异常值,提高数据的稳定性和可靠性。

2 乙酸与乙酸乙酯比值预测模型

2.1 关联度分析

每个窖池每个季节选择112组酒醅发酵数据来训练和验证模型,其中90组被用作训练学习样本,另外22组则被用作预测样本。在建立预测模型前,基于灰色关联度分析法对乙酸与乙酸乙酯比值的影响变量进行分析,影响变量包括温度、水分、酸度、酒精度、CO2浓度和蛋白酶活力。分析过程包括步骤:(1)建立影响变量参考矩阵和乙酸与乙酸乙酯比值参考序列;(2)对数据做归一化处理,使其标准化、规范化;(3)计算每个比较序列对应影响变量与参考序列的绝对误差,得到其最大值和最小值;(4)计算每个影响变量与乙酸/乙酸乙酯比值的相关系数并取均值,得到关联度。

通过流程计算可得,温度和酒精度的关联度都超过0.85,说明其对乙酸与乙酸乙酯的比值影响较大,水分、酸度、CO2浓度和蛋白酶活力的关联度在0.55~0.70的范围内,均大于0.5,可作为预测模型的输入,对乙酸与乙酸乙酯的比值进行预测。

2.2 BP神经网络预测模型

使用BP神经网络(Back-ProPagation Network)对窖池内乙酸与乙酸乙酯的比值进行预测。通过前向传递算法计算输出[12],反向传播算法不断调节参数以降低误差。该模型可在窖池异常时调整配料配比和发酵工艺,确保酒醅中酸酯物质含量达到预期,提供最佳的香气和口感[13]。

经关联度分析,建立的BP神经网络拓扑结构如图3所示。将窖池内各项与乙酸/乙酸乙酯影响较大的参数(温度、水分、酸度、酒精度、CO2浓度和蛋白酶活力)作为输入,将对应的乙酸与乙酸乙酯比值作为输出,所以输入层节点数有6个,输出层节点数有1个。输入层到隐含层和隐含层到输出层的激励函数,都采用sigmod函数[14],如式(7)所示。

图3 BP神经网络模型图

设隐含层有10个神经元,记vih为输入层第i个神经元到隐含层第h个神经元的权值[15],隐含层第h个神经元的阈值则一般被直接表示为bh,隐含层第h个神经元到输出层的权值通常还可同时被表示为whj,输出神经元的阈值表示为yo[16],乙酸与乙酸乙酯比值的神经网络预测模型输出为式(8)。

2.3 粒子群优化BP神经网络模型算法

使用粒子群优化算法(Particle Swarm Optimization,PSO)对神经网络进行优化训练,每个粒子的位置代表一个群集[17],该群集包含上述网络模型中的权值和阈值信息,粒子的速度表示权值和阈值的更新方向和大小。通过不断地更新粒子的位置和速度[18],粒子群优化算法可找出神经网络中使目标函数最小化的权值参数和阈值[19-20],从而提高神经网络的性能。粒子群优化算法的实现过程如图4所示。

粒子群算法需要将上面建立的BP神经网络的部分参数进行完善和调整,主要是对传递过程中权值和阈值的改进。在一次又一次的迭代中,粒子的位置和速度会不断更新,直至找到BP神经网络中最优的权值和阈值。

具体优化步骤:(1)初始值设定,即对模型中各个参数赋初值[21]。其中,迭代次数设为112;学习因子c1=c2=2;种群规模设为15;粒子速度控制在[-1, 1]内;粒子位置控制在[-4, 4]内。

(2)随机初始化一个种群,将神经网络模型转化为粒子群算法中的种群粒子,以实数编码方式初始化,每个个体编码,Wi=(wi1,wi2,...,wiST)代表BP神经网络的初始值,如式(9)所示。

式中:N、M、L分别为输入、输出和隐含层这几层的结点数,建立的模型中N=6,M=1,L=10,故S=17。

(3)粒子群算法对神经网络优化时,要有确定的适应度函数。将适应度函数定义为乙酸与乙酸乙酯比值的预测值与实际值差的平方求倒。为更好地逼近目标函数,还要使用优化算法对BP神经网络传递过程中的权值和阈值赋初值。适应度函数fiti按式(10)计算。

式中:yi为乙酸与乙酸乙酯比值的预测值,oi为乙酸与乙酸乙酯比值的实际值,n=22。

(4)在粒子群算法中,通过计算初始粒子的初始值与代表该粒子所处位置解决方案质量的值V,可以得到初始时群体所有粒子中的最优解和每个粒子自身所取到的最优解,并设置每个粒子的当前最佳位置。

(5)每一次迭代过程中,粒子的速度和位置会根据全局最优解和个体最优解进行更新。在达到设定的迭代次数后,使用已搜索到的最优解初始化BP神经网络神经元之间连接的权重和阈值。对网络预测模型进行训练,并输出乙酸与乙酸乙酯的比值预测结果的最优解。

3 结果与讨论

经过粒子群优化前后的BP神经网络对3个窖池在不同季节下乙酸与乙酸乙酯比值的预测结果如图5所示。通过对比同一季节下的3个窖池以及不同季节下同一窖池的数据,可以观察到在采用粒子群算法优化BP神经网络预测模型后,乙酸与乙酸乙酯比值的预测结果相对于实际值的误差明显减小,最大偏差未超过0.13。即使在优化前,模型的预测结果与实际值之间的差异也不大,但与经过优化后的模型相比,其预测表现较差。优化后的模型能够更准确地预测乙酸与乙酸乙酯比值,提高了预测的准确程度、精确度和可靠性。

为更好地评估神经网络预测模型的性能,引入绝对误差这一评估指标,以进一步了解模型的预测精度和准确性。在图6中,对比2种预测模型的绝对误差情况。通过观察,可以明显看出经过优化后的预测模型的绝对误差都在-0.1~0.1的范围内,表明优化后的模型对于乙酸与乙酸乙酯比值的预测相对准确。而未经优化的预测模型的绝对误差最大超过0.2,说明其预测偏差较大。这表明优化后的模型能够更准确地预测乙酸与乙酸乙酯比值,并且绝对误差保持在较小的范围内。

图6 预测模型的绝对误差比较图

对6组数据进行误差参数指标平均值计算,得出表1中的数据。相对于未优化的BP神经网络预测模型,经过粒子群算法优化后的预测模型在各项性能指标上表现更优秀。相较于未经优化的BP神经网络,粒子群优化算法可以加速BP神经网络的收敛速度,通过引入粒子的位置和速度更新机制,快速搜索到更优的权值和阈值组合,从而加快模型的收敛过程;该模型具有全局搜索能力,能够帮助跳出局部最优解,并朝向更好的解决方案,提高模型的准确性和可靠性。总体来看,经过优化后的BP神经网络预测模型的表现较为理想,可以用于不同窖池不同季节下乙酸与乙酸乙酯的比值预测。

表1 预测模型结果评价

在白酒生产过程中,固态发酵是一个关键的步骤,它直接影响到最终产品的质量和口感。乙酸与乙酸乙酯的比值是白酒的重要指标之一,它反映了白酒的品质[22]。优化后的预测模型可以帮助酒企实现对固态发酵过程的优化和精确控制。通过准确预测关键酸酯比,企业可以调整发酵条件、原料配比和操作策略,以实现更稳定、高效和可控的发酵过程[23]。

4 结论

试验建立粒子群优化的BP神经网络模型并与未优化的模型对比,对酒醅中乙酸与乙酸乙酯的比值进行预测。结果表明,由于白酒固态发酵时多个参数都处于动态变化的过程[24],其中乙酸与乙酸乙酯的比值是衡量白酒质量和口感的主要指标,通过对影响乙酸与乙酸乙酯比值的几个重要参数(包括温度、酸度、水分、酒精度、CO2浓度和蛋白酶活力)进行关联度分析,可以确定用这6项参数作为预测模型的输入,预测乙酸与乙酸乙酯的比值。为建立起一个能够精确描述酒醅发酵过程中乙酸与乙酸乙酯比值的预测模型,选取样本数据总量的近80%作为学习试验样本,剩下的作为预测研究样本。建立BP神经网络,采用粒子群算法优化神经网络模型,对酒醅发酵前2周窖池里乙酸与乙酸乙酯的比值进行预测,通过对模型优化前后的各项评判指标对比发现,优化后的网络模型性能更高。通过对已建模型进行优化、数据预测处理并分析计算,可得R2=0.985 0,MSE值仅为0.006 5,绝对误差处于-0.1~0.1的范围,充分表明粒子群优化的BP神经网络预测模型能够较好地定量描述酒醅发酵产物中乙酸与乙酸乙酯含量比值的变化趋势。相较于类似研究,试验提供一种可行的方法预测浓香型白酒固态发酵过程中乙酸与乙酸乙酯的比值,并在此基础上为预测其他香型白酒发酵过程中的参数探索新思路,可以帮助酒企准确控制固态发酵过程中的关键参数,调整发酵条件、原料配比和操作策略,以实现更稳定、高效和可控的发酵过程,优化产品质量[25]。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!