复杂化工过程调控操纵策略的深度学习方法

时间：2024-09-03

唐晓婕，杨博，李宏光

（北京化工大学信息科学与技术学院，北京 100029）

引言

现代复杂化工生产过程往往具有大滞后、非线性、强耦合等特点，现场操作人员通常需要依赖自身操作经验对过程进行运行调控，其过程调控经验则会记录于DCS 的历史监控数据库中。如果能够采用有效的过程时序数据挖掘方法，提取过程调控操作数据中包含的操纵经验规则，就可以辅助操作人员快速、有效地对过程进行调控，保证化工过程运行优良的安全、平稳和经济性能[1]。

卷积神经网络(convolutional neural network,CNN)[2]因其具有局部连接、权重共享和下采样等特点，更适合处理海量、高纬度和非线性数据环境下的深度学习问题。Lee 等[3]针对多变量传感器信号提出采用CNN 提取故障信号图像特征，对半导体制造过程的缺陷进行检测；Janssens等[4]采用CNN 对旋转机械中外圈滚道故障和润滑性能退化进行故障诊断；Yang 等[5]通过分析数值变量之间的时滞关系确定CNN 输入的时间窗大小，预测了蒸馏塔的动态时间延迟序列；张浩等[6]将CNN 用于时间序列的特征提取，实验表明对于大时滞系统的长时间序列预测具有较好的准确性；易令等[7]针对核磁共振采用光谱数据扩增与处理的方法建立了卷积神经网络回归模型；Wang 等[8-9]针对RNN 处理工业过程中高维和长时序数据时迭代的计算速度慢和建模精度差等问题，提出了适应于多区域操作的感受野时域卷积网络和具有条形结构的自适应感受野时域卷积网络。研究表明，CNN 对于复杂化工过程运行数据的深度特征学习具有较好的能力。

时序数据聚类(clustering)可以通过对生产运行和调控时间序列数据库中寻找时间序列的自然组合，为过程监控、故障诊断以及优化操纵序列获取提供有效的方法。Keogh 等[10]基于对多组时间序列的相似性度量，对整个时间序列中各个子序列进行聚类；Kumar 等[11]提出了假设数据误差服从独立高斯模型的距离函数，并且采用层次聚类法将季节序列划分为设定的组数；Begum 等[12]提出了一种改进的基于动态时间弯曲的时间序列聚类算法；Lin等[13]利用模糊模型提升对股票市场走势进行预测的准确度；Fu[14]使用连续滑动窗口将数值型时间序列分割来发现相似的时间模式；Akatsuka 等[15]提出一种利用Levenshtein 距离来分析连续报警间相似度的方法。

考虑到生产过程会受到多种扰动、需要对扰动状态进行聚类，然而却难以对K-means 等方法[16-17]的K 值进行设定。层次聚类算法[18-19]采用自下而上的凝聚方法或自上而下的分裂方法，通过滑动窗口截取将时间序列分割成若干子序列。朱坚等[20]提出了一种层次聚类的工业过程时序操作优化方法，将操纵变量时间序列符号化表示关键变量的变化方向与范围，对操纵变量时间序列的所有子序列进行聚类。然而，当实际工况受到多种类型的干扰时则难以匹配所获得的优良操作模式。本文结合了层次聚类、时序数据符号区块化处理和卷积神经网络，创建了一种基于深度学习的复杂化工过程调控策略重构方法。通过符号化对最优调控操作模式进行碎片化处理，建立相适应的卷积神经网络进行深度学习，重构各类扰动工况和最优调控操作之间的过程调控操纵策略。将提出的方法应用于工业换热器过程，验证它提升过程调控操纵规则挖掘方法的实际适应性。

1 过程扰动变量序列凝聚聚类

考虑如图1 所示的复杂化工过程，其关键变量受到多个过程扰动变量和操纵变量的影响。操纵序列学习与策略重构的目的是通过学习在过程扰动变量的各种模式下的操纵变量对关键变量的影响规律，以重构复杂工业过程调控操纵策略。

图1 复杂化工过程调控Fig.1 Diagrams of complex chemical process manipulations

化工生产的过程变量展现了对关键变量的多种扰动，为此需要从其时序数据中识别过程扰动状态，并寻找其对应的最优操纵片段。自下而上的层次凝聚聚类[21-22]方法分别对各个过程扰动变量时间序列子序列进行凝聚聚类，将各个扰动变量得到的聚类数进行排列组合，得到过程扰动状态的类别。选择Levenshtein 距离[23]来衡量时序数据子序列之间的相似性，利用两个子序列之间从一个到另一个所需的最少操纵次数来计算编辑距离[24]。假设有两个子序列S和T，计算其Levenshtein距离levS,T如式（1）：

其中，Si表示时间序列S的第i个数字；Tj表示时间序列T的第j个数字，表示当Si≠Tj时值等于1，而当Si=Tj时值等于0；i和j是每个时间序列子序列中数字的索引。

如果S和T分别为两个不同的子序列，可以计算序列之间的距离来构建一个聚类树，其相似度为：

其中,Slength为子序列S的长度。为了易于计算，将过程扰动变量时间序列分成相等长度的子序列。Levenshtein 距离矩阵由二维数列组成，如果两个簇的长度分别是m和n，其矩阵的维度为(m+1)×(n+1)。根据距离度量两个簇之间的相似度,将距离最小的两个簇凝聚为一个更大的簇，然后再计算更新后每个簇的距离矩阵。重复此过程，直到不再继续凝聚为止[25]，图2为凝聚聚类的示意图。

图2 凝聚层次聚类树Fig.2 Aggregations of hierarchical clustering trees

2 操纵变量序列符号区块化

符号聚合近似(symbol aggregation approximation,SAX)[26-28]在分段聚合近似(piecewise aggregate approximation,PAA)[29-30]的基础上等长划分时间序列，每个分段用其均值表示,并利用正态分布将时间序列等概率的分布在纵轴区间内，将其转化成符号序列，形成任意长度的字符串，SAX 包含以下三个步骤。

（1）将原始时间序列转换成均值为0、标准差为1的归一化序列：

其中，x为原始数据；x′为标准化后的数据；μ与σ分别为原始数据的均值和标准差。

（2）通过PAA 将长度为n的原始时间序列C=c1,c2,...,cn转换成长度为w的序列再用每段子序列的均值来代替这段子序列，即：

其中，Cj为时间序列数据的单个采样点;j为块的序列号;n是w的整数倍;w代表字符串的长度。

（3）经归一化处理的时间序列具有正态分布，通过在高斯曲线上确定“分裂点”从而划分等大小，对具有相同概率分布的区域，进行离散化表示处理[31]。断点列表是有序的数字序列B=β1,β2,…,βa-1,其中βi和βi+1之间的面积均为1/a，βa表示+∞。首先选定字母集的大小，然后查找区间的分裂点βi。获得断点后，可以对时间序列进行离散化。小于最小断点的所有PAA 系数被映射到符号“a”，大于或等于最小断点并且小于第二小断点的所有系数被映射到符号“b”，以此类推，图3 为符号化处理的示意图。

图3 SAX方法示意图Fig.3 Diagram of the symbol aggregation approximation method

操作人员根据关键变量和过程扰动的状态对操纵变量进行调控，而调控变量的变化大小并不是精确的。基于符号的时间序列区块化处理能够很好地提取过程调控操纵序列的特征，如图4所示，其中蓝线为原始调控操纵数据，红线为其区块化，“a、b、c、d、e”为符号化结果。

图4 调控操纵序列符号化Fig.4 Symbolizations of process control manipulating time series

3 调控操纵策略深度学习

图5给出了基于深度学习的复杂化工过程调控策略重构方法流程，它包括了调控操纵特征的离线深度学习与调控策略的在线重构及实施。

图5 复杂化工过程调控操纵策略深度学习Fig.5 Flow charts of manipulating strategy deep learning for complex chemical processes

(1)历史操作数据离线处理

Step1：提取过程的关键变量、操纵变量和过程扰动变量时序数据，并划分成等长的子序列。

Step2：采用层次凝聚聚类方法识别不同类别的扰动状态，并获得对应关键变量时间序列。

Step3：对关键变量根据绝对误差积分指标(IAE)进行筛选，得到能够使受扰动的关键变量调控到期望的稳定状态的最优操纵片段和对应的各类干扰片段。

Step4：将各类最优操纵变量时间序列段进行SAX 符号化，每个符号提取了操纵变量在时间和空间上的特征范围，代表了操纵经验的有效范围。

(2)CNN调控操纵策略学习

图6 为调控操纵策略深度学习的CNN 模型，主要包括6 个部分，即输入层、卷积层、ReLU 层、池化层、全连接层和输出层。其中，n、W、H分别为输入变量的个数、宽度和长度；C1、C2,…,Ct-1为卷积层特征平面的个数；St为全局平均池化；F1、F2为全连接层；L1、L2为输出通道的个数。输入层和输出层(input&output)将过程对象的扰动状态作为输入数据，每次输入由长度相同的n列不同干扰变量的子序列构成，子序列的长度为m，即CNN 每次处理n列1×m的向量，对应的输出数据为操纵变量经SAX 处理后的一个字符；卷积层(convolutions)含有4个特征平面，同一特征平面的卷积核共享权值，即共享同一组权重和偏置，由此可以大量减少参数数量，同时降低过拟合的风险；激活函数使用ReLU 函数,计算简单、加快模型速度；池化层(subsampling)降低数据体的空间尺寸、减少网络参数数量、降低卷积运算的时间，同时有效控制过拟合；全连接层(fullyconnected layer)将卷积层和池化层的输出展开成一维形式，所有通道的特征传入全连接层，进行特征融合；softmax 将任意实值转换为概率来实现多分类。

图6 面向工业过程时序数据深度学习的CNN结构Fig.6 CNN structures for deep learning of industrial process time series data

(3)调控操纵策略在线重构

Step1:提取在线实际过程扰动片段数据，划分成等长的子序列，并与各类扰动状态进行匹配，得到所属类别；

Step2:将实际各类扰动序列子序列逐个输进训练好的神经网络模型中逐步预测出新的操纵规则；

Step3:构建实际扰动工况下的调控操纵策略，并用于指导实际过程对象的调控操作。

4 工业换热器过程

图7 为一个工业换热器过程，具有大容量滞后和非线性等复杂特性。当物料冷端温度T1和进料流量F1发生波动时，需要调控操纵变量——热载体流量F2使得物料出口温度T3维持在期望值上。

图7 换热器流程示意图Fig.7 Flow diagram of the heat exchanger

4.1 扰动工况聚类

图8 为将T1和F1的过程扰动变量采用基于Levenshtein距离的层次凝聚聚类方法得到的聚类结果，图9分别为T1的3种扰动类别和F1的2种扰动类别，将其组合得到6 类过程扰动状态，如图10 所示，图中的横坐标为时间长度，纵坐标为温度和流量的无量纲量。

图8 T1和F1的过程扰动变量的凝聚聚类结果Fig.8 Hierarchical agglomerative clustering results of T1 and F1

图9 T1和F1的扰动类别Fig.9 Disturbance categories of T1 and F1

图10 过程扰动变量的扰动状态Fig.10 Disturbance states of the process disturbances variables

4.2 操纵变量符号化

将关键变量T3的时序数据按照6类扰动状态划分为6 类，提取满足IAE 阈值范围之内的优良操作和各类扰动状态片段，并将F2的最优操纵片段进行SAX 符号化，图11为将一最优操纵片段进行SAX 后转化的列字符串。

图11 操纵变量SAX符号化Fig.11 SAX symbolizations of manipulating variables

4.3 调控操纵深度学习过程

将6 类过程扰动状态依次输入CNN，输入数据由T1和F1的扰动过程变量序列构成，每段扰动变量长度为10，操纵变量符号化的类别为CNN 的输出，每两个1×10的输入数据对应一个输出符号，选定输出层字母集的大小为5，进行CNN 的训练。训练集与测试集的量是7∶1，准确率分别为95.52% 和92.69%，图12 为测试集的多分类混淆矩阵，表1 为混淆矩阵的关键评价指标。

表1 混淆矩阵的关键评价指标Table 1 Key evaluation indicators of the confusion matrix

图12 多分类混淆矩阵示例Fig.12 Examples of a multi-category confusion matrix

4.4 调控策略重构过程

在线提取实际扰动片段数据，划分成等长的子序列，并与各种过程扰动状态进行匹配得到所属类别；将各种过程扰动序列子序列逐个输入训练好的CNN 模型中重构新的操纵规则。将此方法和常规监督控制方法相比，各类扰动状态下的关键变量IAE 指标均有所提高。另外，若实际工况出现了不属于已知的6 类扰动状态(第7 类状态)，使用深度学习策略仍然能够重构出新的操纵规则，调控获得满意的关键变量，如表2所示。

表2 各类扰动状态下关键变量的IAE指标Table 2 IAE contrasts of the key variable corresponding to the disturbance states

5 结论

当化工过程受到多种类型的干扰而难以匹配优良的操作模式时,常规时间序列聚类方法难以保证实际工况的适用性。本文利用CNN 端到端的特性，将不同类别的干扰变量序列输入卷积神经网络，操纵变量进行SAX 后的字符类别作为输入数据的标签，进行卷积神经网络的训练，得到实际干扰片段与操纵规则之间的映射关系。应用于工业换热器，将所建立的复杂化工过程调控操纵策略深度学习方法与常规的监督控制方法相比，其关键变量调控的IAE 有明显下降，从而验证所提方法的有效性和优越性。未来的研究工作将扩展为多操纵变量调控模式，并考虑过程变量的时间延迟特性。