当前位置:首页 期刊杂志

基于多尺度核JYMKPLS迁移模型的间歇过程产品质量的在线预测方法

时间:2024-09-03

褚菲,彭闯,贾润达,陈韬,陆宁云

(1 地下空间智能控制教育部工程研究中心,江苏徐州221116; 2 中国矿业大学信息与控制工程学院,江苏徐州221116;3东北大学信息科学与工程学院,辽宁沈阳110819; 4 萨里大学化学与工艺工程系,英国吉尔福德;5 南京航空航天大学自动化学院,江苏南京210016)

引 言

随着经济的迅猛发展以及国际产品市场的竞争日趋激烈,产品质量的标准与要求也变得越来越高[1-5]。特别是在间歇生产过程中,产品质量的稳定不仅直接关乎企业的经济效益,而且也是实现间歇过程生产优化的前提[6-9]。精确的质量预测则是确保间歇过程安全运行、获得高质量产品的必要条件,随着数据技术的迅速发展,数据驱动方法[10-16]因其建模速度快、模型精度高、成本效益好等优点正成为过程建模的主流,被广泛地应用于间歇过程的产品质量预测[17-18]。数据驱动建模的前提是要拥有充足的过程数据,这是实现精准预测的必要条件[5]。在实际间歇生产过程中,不同的产品规格应采用特定的操作条件甚至设备进行生产,操作状态需要频繁更新,数据驱动模型的性能会降低,此时则需要重新构建新过程。但是,新过程由于运行时间相对较短而无法获得丰富的过程数据,难以建立准确可靠的数据驱动模型[19-20]。

大数据时代的背景下,在现代间歇工业过程中有很多使用相同或相似的工艺原理生产相同或相似规格产品的相似过程[20],这些过程中存在着大量相似的历史数据没有得到充分利用,造成了资源的浪费。针对上述问题,一些学者提出了迁移学习的概念,迁移学习方法因其可以利用相似源域的知识来帮助完成目标域的学习任务而越来越受到重视[21-23]。Shen 等[24]为了克服收集长期循环数据的成本高昂这一困难,针对训练数据集数据少的问题,通过融合转移学习和集成学习,提出了一种基于深度学习模型 DCNN-ETL(deep convolutional neural networks with ensemble learning and transfer learning)的容量估计方法,使得复杂神经网络的训练过程在目标任务中使用相对较小的训练数据集即可进行收敛。Shao等[25]开发了一个用于机械故障诊断和分类的深度迁移学习框架,通过使用迁移学习来加速深度神经网络CNN(convolutional neural networks)的训练,结果证明迁移学习能够明显提高深度模型的性能。Liu 等[26]利用迁移学习开发了一种领域自适应极限学习机DAELM (adaptive extreme learning machine),通过利用不同工况下的有用信息,并将其迁移到现有的软测量系统中,有效提高了模型的预测范围和预测精度。数据迁移作为迁移学习技术的一种形式,能够充分利用旧过程的数据和模型,并将有用的数据信息迁移到新过程中以辅助其建模和控制。Jaeckle等[27]提出了一种用于数据迁移的EPCR(extended principal component regression)方法,该方法通过结合两个相似过程的输出数据矩阵来建立PCR(principal component regression)模型,利用相似生产过程已有的数据信息进行有效预测。但是,此方法在迁移时没有合理利用相似过程的输入数据, 而这些输入数据中也很可能存在许多可以辅助新过程建模的有效信息。针对这个方法存在的不足,García 等[28]随后提出了JYPLS (Joint-Y partial least squares)方法,首先在同一空间建立相似过程的联合质量指标,然后利用所有相似过程的数据进行建模,而且JYPLS 模型只要求相似过程具有相同的质量指标构成,对于输入变量矩阵没有任何限制。

此外,针对JYPLS 方法不适用于非线性较强的间歇过程,Chu 等[5]在该模型上引入核函数,提出了一种改进的过程迁移的JYKPLS (Joint-Y kernel partial least squares)方法,成功地应用于非线性新间歇过程的产品质量预测,大大提高了建模效率和产品质量的预测精度。然而,在实际应用中进一步发现,虽然JYKPLS 方法可以描述过程数据的非线性关系,但是针对具有多尺度非线性特性的间歇过程,JYKPLS 方法的应用效果并不理想,存在局部拟合精度不高,模型参数匹配困难等问题[29-33],特别是当通过迁移学习利用相似旧过程的数据进行建模时,由于相似过程之间必然存在差异,使得包含两个相似过程的建模数据集在多尺度方面的问题更加严重,严重影响产品质量预测精度的进一步提高。

本文针对过程数据不足,且具有强非线性和多尺度特性的间歇过程,将迁移学习方法与多尺度核学习方法相结合,提出了一种基于多尺度核JYMKPLS(Joint-Y multi-scale kernel partial least squares)迁移学习模型的间歇过程产品质量在线预测方法。本文通过迁移学习在解决新间歇过程数据不足难以精准建模的基础上,旨在解决间歇过程数据具有多尺度特性且在过程迁移建模时由于过程数据之间的差异性表现得尤为突出的问题。由于单个尺度的核函数难以对所有样本进行高效的映射,本文在迁移学习的基础上引入了多尺度核函数的方法,通过改变核的尺度的大小更好地拟合数据变化剧烈和变化平缓的趋势,充分地反映了数据样本的分布特性,改善了新模型的泛化性,从而实现对产品质量的精准预测。

1 多尺度核学习方法

核学习方法以非线性特征提取的方式,能够将自变量通过非线性的方式映射到高维空间,并在其中利用线性运算进行特征提取[29-34]。核函数有很多种类型,每一种核函数都有不同特性的映射效果,针对具体的样本空间来选择不同类型的核函数一般能够获得较为满意的非线性映射。然而,由于噪声的存在以及工业过程日趋复杂多变,使得过程样本数据分布更加不规则、不平坦。在这种情况下,单一核函数的方法具有很大的局限性,过程的所有数据样本难以用一个特定的核函数对整体进行有效的映射[35]。

近年来有学者提出了多核学习的方法,而多尺度核方法作为其中的一种[29],通过设置不同的核参数大小来构造多个尺度大小的核函数,能够对过程不同的局部特征分别进行高效的映射。这种方法具有非常多的尺度选择性,因此具有很强的灵活性。高斯核函数作为常用核函数的一种,不仅能够多尺度化,而且具有普遍的无限逼近能力,具体形式如下所示:

其中,σ表示核函数的尺度参数,本文将其多尺度化后如下所示:

其中,σ1<σ2<…<σn,当σ 较小时,对变化剧烈的数据样本具有更好的映射效果;当σ较大时,对变化平缓的数据样本具有更好的映射效果。由此可构造出新的多尺度核函数如下所示,其中多个尺度采用直接加权的形式:

其中,k 代表所选核函数的尺度的数量,各个尺度核函数的宽度参数用σi(i = 1,2,…,k)来表示。基于高斯径向基核函数的多尺度核的学习方法主要是通过调整各个尺度核函数中的核参数,更好地拟合不均匀数据的变化特征,以达到最优解。

2 基于JYMKPLS 模型的产品质量预测

考虑到在现代工业生产中,使用相同或相似的工艺原则生产相同或相似规格的独立生产过程是普遍存在的。也就是说,对于一个新的目标工艺过程,虽然它与旧工艺过程有着不同的设备、原材料和操作条件,但是过程之间各变量的相关关系往往是相接近的,它们共享着相似的内在机理,且它们的过程数据的协方差结构具有相似性,从这个意义上说,这两个过程具有一定的相似性。近年来,迁移学习方法因其可以利用相似源域的知识来帮助完成目标域的学习任务而越来越受到重视[21-23]。考虑到新过程刚投入运行,过程数据不足以建立较为精准的数据驱动模型,而旧过程已经投入运行了很久,拥有充足的过程数据但尚未被利用,造成了数据资源的闲置与浪费。因此,如果能够通过迁移学习的方法将实际工业过程中可用的相似过程的数据进行整合和利用,依靠这些闲置的数据信息来促进新过程的快速高效建模,不仅能够提高产品质量的预测精度,而且还能提高企业和社会的经济效益。如图1所示,在本文中,假定有两个相似间歇过程:新 过 程B 和 旧 过 程A,XA,XB∈RI×J×K和YA,YB∈RI×J分别为两个过程的输入变量矩阵和质量指标输出矩阵,J 是过程变量数,K 是采样时间,I是生产的批次数量。

图1 两个相似过程数据Fig.1 Two similar process datasets

2.1 JYMKPLS

JYPLS 方法属于线性建模范畴,难以对非线性系统固有的特性进行准确高效的描述。为此,文献[5]中提出了一种新的JYKPLS 算法,通过在JYPLS算法中引入核学习方法建立新过程的迁移学习模型,能够较好地描述新旧间歇过程的非线性特性,提高模型的预测精度。该方法虽然可以在一定程度上解决非线性问题,但是考虑到工业过程中存在数据分布不均匀的特性,单个尺度的核函数往往难以准确拟合所有样本数据的变化趋势。为此,本文将多尺度核函数技术应用到JYPLS 算法,提出了一种新的基于多尺度核的JYMKPLS算法,通过改变核函数的尺度的大小能够更好地拟合数据变化剧烈和变化平缓的趋势,可以更好地解决复杂的非线性分析问题,从而进一步提高质量预测的精度,JYMKPLS的模型结构如图2所示。

用原始空间中定义的核函数来替代内积运算,则可构成如下形式的核矩阵:

图2 JYMKPLS模型结构Fig.2 The structure of JYMKPLS model

本文选用了高斯核进行多尺度化,并采用下式进行核矩阵元素的计算:

其中,多个尺度高斯核函数的宽度参数分别用σl(l = 1,2,…,m)表示。尺度个数m与核函数模型的复杂度直接相关,m越多,则构造的多尺度核函数模型越复杂,学习训练的时间也越长,尺度个数m 过多或过少都不利于使模型获得良好的泛化性。由于某一宽度的高斯核函数可以将某一特定分布的样本有效地向高维特征空间映射,因此输入空间中训练样本的特征分布的数量可以看作尺度个数的最优选择。目前常用的方法有模糊聚类分析方法,其可以通过划分原始空间的样本来确定相对最优的尺度个数。此外,核函数的合成系数以及核参数的大小的寻优方法越复杂,模型复杂度越高,学习训练的时间也越长。针对一些具体问题,对核参数的选取,合成系数的设定,目前还没有形成一个合理统一的模式[29]。本文在突出多尺度核优势的前提下,为了降低模型复杂度和学习时间,暂且采用直接求和的方式来构造核模型的合成系数[31]。同时,为保证模型精度,利用训练样本建立JYMKPLS回归模型,利用优化算法对核宽度参数σl进行寻优,计算拟合误差作为评价指标,选取最优精度模型所对应的参数作为最优结果。在此算法中,由于只计算原始低位空间的核函数就可以得到高维空间的核函数矩阵KA和KB,因此没有必要知道非线性映射函数的显式表达式Φ(⋅)。在执行JYMKPLS 算法之前,通常需要对这两个核矩阵进行中心化处理,公式如下:

其中,1I是I×I维的矩阵,其元素都为1,I则表示I×I维度的单位矩阵。

如果从原始空间到高维空间的映射Φ:xi∈RN→Φ(xi)∈H 已知,凭借样本映射ΦA、ΦB和输出样本YA、YB则可以在高维空间中直接使用JYPLS 建模,那么就可以利用拉格朗日方法分析准则函数得到如下所示:

但是ΦA、ΦB通常都是未知的,wJ则不能通过式(8)直接计算得到,不过可以利用核函数来巧妙地避开该映射,将式(8)转化成式(9)。

(4)计算YAi,YBi的得分向量uAi= YAiqJi,uBi=YBiqJi。

(5)对uAi和uBi进行收敛性判断,若步骤(4)中的得分向量都具有收敛性,再根据式(13)进行核矩阵和输出矩阵的缩减,否则返回到步骤(2)。

(6)然后令i=i+1,重复步骤(2)~步骤(6)提取主成分直到A 的主成分全部提取结束,主成分数量可以由交叉验证确定。

2.2 离线建模

给定某个间歇生产过程,假设它有J 个过程变量,在一个批次内有K 个采样时间点,共收集I 个批次数,就构成了典型的间歇过程三维数据X(I × J ×K)。在进行过程传递模型的建立之前,本文采取图3 所示的方法按批次方向将输入矩阵XA,XB∈RI×J×K展 开 成XA,XB∈RI×KJ形 式,对 应 的输出变量矩阵为YA,YB∈RI×J。

图3 相似过程数据的批次展开Fig.3 Batch-unfolding of similar process data

将JYPLS 过程迁移模型与多尺度核方法相结合,不仅能够解决新间歇过程因没有充足的过程建模数据而影响建模效率的问题,而且同时考虑到数据具有多尺度特性的问题,通过改变核的尺度的大小来更好地拟合数据变化剧烈和变化平缓的趋势,能够充分地反映数据样本的分布特性,可以进一步提高质量预测的精度。

JYMKPLS离线建模步骤如下:

(1)数据展开。采用批次展开的方式将新间歇过程B 和与其相似的旧间歇过程A 的矩阵XA,XB∈RI×J×K依次展开成XA,XB∈RI×KJ。

(2)数据预处理。将两个过程的输入矩阵XA,XB的每一列数据分别按照零均值和单位方差进行归一化;同样,对输出矩阵YA,YB也进行标准化处理,将其联合得到YJ=[YA; YB]。

(3)确定尺度个数m。对输入样本进行聚类,选择分类个数作为相对最优的尺度个数m。

(4)确定核函数宽度参数σl(l = 1,2,…,m)。利用新旧过程的学习样本建立JYMKPLS模型,计算拟合误差作为评价指标,利用优化算法寻找最优核宽度参数σl(l = 1,2,…,m),使得拟合误差最小,选取误差最小模型所对应的核宽度参数作为最优结果。

(5)计算核矩阵。通过式(4)进行非线性映射,利用式(6)的多个尺度的核函数在高维空间中分别计算并得到核函数矩阵KA和KB。

(6)通过式(7)中心化核矩阵KA和KB。

(7)使用输入核矩阵KA和KB以及联合输出矩阵YJ运行JYMKPLS算法。

(8)计算JYMKPLS模型的回归系数:

其中,TJ=[TA; TB]是旧间歇过程A 和新间歇过程B 过程潜变量的联合矩阵,是建立质量预测模型最为关键的变量。

(9)将预测样本代入JYMKPLS 模型,得到回归方程为:

其中,xnew是新过程B 的新采样数据,xj代表第j批次的输入训练数据,knew是新的批次数据对应的核向量, e 是预测误差,ynew为新采样数据的预测结果。

2.3 基于JYMKPLS模型的在线预测

本文基于JYMKPLS过程迁移模型,为间歇过程产品质量提供了在线预测方法的完整框架和算法流程,包括基于JYMKPLS 的预测模型的离线建立,在线模型更新和数据剔除,该方法的流程图如图4所示。

图4 基于JYMKPLS过程迁移模型的批次过程质量预测及更新流程Fig.4 Batch process quality prediction and update process based on JYMKPLS process transfer model

得到离线质量模型之后,该模型可用于下一批次产品的质量预测。在新的批次运行时,由于该批次过程没有完全结束,只能得到操作周期开始到当前时刻的不完整的输入数据xformer。为了预测当前时刻下最终的产品质量,可以通过预估计[7]的方法对当前时刻之后的数据部分xafter进行填补,构成与预测值ŷnew相对应的输入数据xnew=[xformer; xafter]。然后,通过核函数获得核向量knew,将完整的输入数据xnew和knew代入预测模型即可得到预测值ŷnew。

其中,xj代表第j 批次的输入训练数据,knew表示过程新产生的新批次的输入数据所对应的核向量,e为预测误差,ŷnew代表新过程新采集到的数据所对应的预测输出值。

2.4 模型在线更新和旧数据剔除

由于新过程建模数据的稀缺性,现有的新过程数据集也无法描述整个新过程的特征。因此,在每个批次结束时,需要不断地利用新获得的数据xnew和ynew补充到新过程的建模数据集XB和YB,进一步增加建模信息,从而有效提高预测模型的准确性。通过这两个增广矩阵可以离线更新预测模型,模型更新方法如式(17)所示:

在生产过程前期,由于新过程数据不足,旧过程的数据有助于新过程模型的建立,但是由于相似过程之间必然存在差异,旧过程的数据不可能包含新过程的所有过程信息,随着新过程数据的补充和积累,建模数据集中旧过程的数据反而会影响模型精度的进一步提高。因此,需要在适当的时刻对旧过程数据进行逐步剔除,本文检测了连续m 个批次的最终质量偏差,通过设置稳定性阈值εstable来判断误差是否收敛至稳定阶段从而决定是否进行数据剔除(εstable的值是趋近于0 的预设常数)。数据剔除的原则是对旧过程数据集中偏差较大的数据优先处理,具体方法和步骤如下。

(2)收集所有最新批次的最终质量的预测偏差,判断连续采样批次中Δj偏差小于阈值εstable的批次数是否大于等于n 个,如果是,则转到步骤(3)进行数据选择和剔除,否则返回到步骤(1)。

(3)计算新旧过程数据之间的相似度,从旧过程数据集中选取与新过程数据偏差最大的旧数据进行剔除,计算相似度的公式如式(18)所示:

其中,‖ ⋅ ‖2是欧几里得度量,XˉB是新过程数据的平均值,d(xAj,XB)表示过程数据之间的欧氏距离,相似度用S(xAj)表示,其范围是0~1。

3 算法仿真验证

3.1 青霉素生产过程及实验过程设计

青霉素生产过程是一种典型的间歇工业过程,其主要通过微生物发酵的途径进行生产,过程本身具有非线性的特性。而青霉素的终点浓度是衡量生产效益的最重要的指标,因此,对其进行质量预测十分重要。本文通过Pensim2.0 仿真软件按照设定生成的数据来验证本文算法,过程反应周期和采样间隔分别设定为400 h 和0.5 h。然后,选取了通风率等六个输入变量和青霉素浓度这一个输出变量建立预测模型对青霉素浓度进行质量预测。本文采用仿真软件按照表1设置的工作条件分别生成40 个批次的数据作为旧过程A 已有的大量过程数据,生成55 个批次的数据作为新过程B 产生的过程数据,其中5 个作为刚投入运行的新过程B 已有的过程数据,剩余50个批次的数据用作数据更新和数据测试。同时,为了增加实验实际应用的可信度,将2%的测量噪声分别加到过程的输入变量和输出质量指标上。提取旧过程A中40个批次数据中的6个输入变量和最终质量,形成旧过程数据集矩阵XA(40 × 6 × 800)和YA(40 × 1),同样,可以得到新过程数据集矩阵XB(55× 6 × 800)和YB(55× 1)。

表1 过程A和B的工作条件Table 1 Working conditions for batch processes A and B

图5 基于KPLS和MKPLS的青霉素最终浓度预测结果Fig.5 The prediction result of the final concentration of penicillin in each batch based on KPLS and MKPLS

3.2 基于MKPLS的青霉素质量预测

为了更清晰地表明新过程B由于数据稀缺导致数据驱动建模精度低下的问题,更好地突出多尺度核学习方法在质量预测中的优势,本节只用到新过程B 的数据,将MKPLS 模型与传统的KPLS 模型进行了比较,测试了这两种方法的预测效果。

首先为了充分地验证两个模型在整个工况范围内的最终质量预测能力,保持建模数据集不变,并且不进行模型的在线更新和旧数据的剔除,实验将新过程B 的50 个批次的数据分为5 个批次的建模数据集和45 个批次的测试数据集,构建最终质量预测模型。利用两种方法对测试数据集的最终质量进行了预测,评价指标为预测值的均方根误差RMSE 和平均相对预测误差MPRE。由图5 和表2 可得实验结果如下,新过程在刚投入生产的前期阶段,拥有很少的建模数据,在不进行模型更新的前提下基于这两种数据驱动建模方法的预测精度都不理想,但是MKPLS 建模方法的预测效果要略优于KPLS 建模方法的预测效果,这表明即使在少量数据的情况下,相比于单尺度核方法,多尺度核方法能够较好地抓取数据特征,具有更高的精度。

两种方法的均方根误差和平均相对预测误差值如表2所示。

考虑模型更新的情况,本实验将新过程B 的55个批次的数据分为5 个批次的建模数据集,45 个批次的更新数据集,5 个批次的测试数据集三个部分,测试数据集中5 个批次最终浓度预测值的RMSE 是量化预测性能的评价指标。利用建模数据集构建初始的最终质量预测模型,每次对测试数据集中的所有测试样本进行预测后,计算预测结果的RMSE,然后向训练数据集中添加一批更新数据集以重建质量预测模型,再次对测试集的最终浓度进行预测,直到更新数据集中的所有数据都放入建模数据集中。两种方法测试数据集的RMSE 如图6 所示,随着新批次数据的不断产生,建模数据不断增多,两种预测方法的精度随着模型更新都在不断提高,在第25批次之后,达到了较为稳定的精度。对比两种预测方法的均方根误差,可以看出在进行该生产过程的质量预测时,基于MKPLS的建模方法的预测效果明显优于基于KPLS 的建模方法,而且随着建模数据越来越多,基于MKPLS的建模方法的预测效果的优势会更加明显。

1.3 技术培训与质量控制 本研究的6名测查人员均经过北京妇幼保健院的Gesell神经心理发育测查的技能培训并取得证书,临床测查经验丰富。实验前6名测查员测查结果一致性检验合格。

表2 两种预测方法的评价指标对比Table 2 The evaluation index comparison of two prediction methods

图6 带有模型更新的KPLS模型和MKPLS模型的RMSEFig.6 RMSE of KPLS model and MKPLS model with model updates

3.3 基于JYMKPLS的青霉素质量预测

考虑到新过程B初期建模数据少导致建模精度很低甚至无法建模的情况,为了突出过程迁移在最终质量预测中的优势,更为了突出多尺度核方法在解决批次过程训练样本中普遍存在的数据分布不均匀的多尺度特性问题上的优势,本节将JYMKPLS模型、JYKPLS 模型以及传统的KPLS 模型的预测效果进行了比较。

首先,为了充分验证在新过程数据不足的情况下,JYMKPLS 模型在整个工况范围内的最终质量预测能力,保持建模数据集不变,并且暂且不进行模型的在线更新和旧数据的剔除。该实验中,用到旧过程A 的所有数据和新过程B 的50 个批次的数据,将新过程B的50个批次的数据分为5个批次的建模数据集和45个批次的测试数据集,用以构建最终质量预测模型。其中,传统的KPLS 建模方法只利用新过程B 的5 个批次数据进行建模,而JYKPLS 和JYMKPLS 过程迁移建模方法则利用相似旧过程A的40个批次的过程数据和新过程B的5个批次的过程数据进行建模。利用三种方法对测试数据集的最终质量进行了预测,评价指标为预测值的均方根误差RMSE 和平均相对预测误差MPRE。实验的结果如图7 和表3 所示,在新过程运行初期,拥有很少的建模数据的情况下, JYKPLS 和JYMKPLS 过程迁移建模方法的整体预测效果要明显优于KPLS 建模方法的预测效果。同时,基于JYMKPLS的建模方法的预测精度要略优于基于JYKPLS 的建模方法的预测精度。

三种预测方法的均方根误差以及平均相对预测误差如表3所示。

表3 三种预测方法的评价指标对比Table 3 The evaluation index comparison of three prediction methods

三种预测方法的平均均方根误差如表4 所示(无数据剔除)。

表4 三种预测方法的平均均方根误差对比Table 4 Comparison of mean RMSE of three prediction methods

图7 基于KPLS、JYKPLS和JYMKPLS的青霉素最终浓度预测结果Fig.7 Prediction results of final penicillin concentration for each batch based on KPLS,JYKPLS and JYMKPLS

图8 带有模型更新的三种模型的RMSEFig.8 RMSE of the three models with model updates

考虑模型更新情况,本实验用到新过程B 的55个批次的数据,将其分为三部分,5 个批次的建模数据集,45个批次的更新数据集,5个批次的测试数据集。然后根据KPLS、JYKPLS、JYMKPLS 三种建模方法构建初始的最终质量预测模型。其中,传统的KPLS 建模方法只利用新过程B 的5 个批次数据进行建模,而JYKPLS 和JYMKPLS 过程迁移建模方法则利用相似旧过程A 的40 个批次的过程数据和新过程B 的5 个批次数据进行建模。测试数据集中5个批次最终浓度预测值的RMSE是量化预测性能的评价指标,每次对测试数据集中的所有测试样本进行预测后,计算预测结果的RMSE,并向训练数据集中添加一批更新数据集用以重建预测模型,再次预测它们的最终浓度,直到更新数据集中的所有数据都放入建模数据集中。如图8(a)和表4所示,随着新批次数据的不断产生,建模数据不断增多,三种预测方法的精度随着模型更新都在不断提高,在第25批次之后,达到了较为稳定的精度。对比三种预测方法的均方根误差,可以看出在对新过程B 的前期进行质量预测时,相较于KPLS 方法,引入相似旧过程A 的过程数据进行迁移建模的JYKPLS 方法和JYMKPLS 方法能够明显地降低预测误差。同时,由于引入了多个尺度的核函数来更好地拟合数据的变化特征,使得JYMKPLS 方法相较于JYKPLS 方法在降低预测误差方面更加明显。此外,由于在第25批次之后,JYKPLS 方法和JYMKPLS 方法都已达到了较为稳定的精度,精度受到旧过程数据的影响,此时须考虑数据剔除情况,如图8(b)所示,通过上文所提的剔除判定方法,在误差稳定几个批次之后进行数据剔除,可以看出在第30 个批次以后,二者的预测误差都进一步降低。总体上,随着模型更新和数据剔除的进行,基于JYMKPLS建模方法的预测精度不断提高,而且预测精度明显优于另外两种建模方法。

4 结 论

针对间歇过程数据大都具有强非线性和多尺度特性的问题,为了对数据不足的新间歇过程建立更加精准的产品质量预测模型,提出了一种基于多尺度核JYMKPLS 迁移学习模型的产品质量在线预测方法。该方法综合了迁移学习建模和多尺度核学习方法的优点,既能在减少数据资源浪费的同时,迁移相似旧过程充足的过程数据到新过程中以辅助和加速新过程的建模,又兼顾了间歇过程训练样本中普遍存在的多尺度特性,提升了模型泛化性。此外,提出模型在线更新和数据剔除,在每个生产周期结束时,通过在线持续改善迁移模型对新间歇过程的匹配程度,以消除相似过程间的差异性给迁移学习带来的不利影响,进而不断地提高产品质量的预测精度。本文通过仿真将该方法应用于青霉素生产过程,结果显示,与传统的KPLS 方法和基于过程迁移的JYKPLS 方法相比,该方法在加快新过程建模速度的同时,具有更高的预测精度和良好的泛化性能,能够进一步提高新批次产品质量的预测精度。

符 号 说 明

B——模型的回归系数矩阵

e——ynew的预测误差

I——I × I单位矩阵

KA,KB——分别为A、B过程的核函数矩阵

knew——B过程的新的批次数据对应的核向量

qJi——联合输出变量的负载矩阵

S(·)——数据之间的相似度

tA,tB,tJ——分别为A、B 过程输入数据的得分向量和关联主成分

uA,uB——分别为过程输出数据的得分向量

XA,XB——分别为A、B过程的输入数据矩阵

xformer,xafter——分别为xnew中已存在数据样本和未知数据样本

xi——第i 批次的输入训练数据

xnew——B过程在线获取的新的批次的数据样本

YA,YB,YJ——分别为A、B 过程的输出数据矩阵和联合输出矩阵

ynew,——分别为B 过程在线采集的新生产批次的输出样本值及其预测值

βj——第j批次的预测偏差

Δj——前后批次间预测偏差的差值

εstable——稳定阈值

σ——核参数

Φ(⋅)——非线性变换函数

下角标

A——与过程B相似的旧间歇生产过程

after——之后的,未知的

B——新间歇生产过程

former——之前的,已知的

i——提取的潜变量的序号

J——联合矩阵

j——批次数

new——新过程B的当前运行批次

old——旧过程A的数据

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!