当前位置:首页 期刊杂志

基于改进GNG的电解铝生产杂质预警与控制*

时间:2024-07-28

刘天松,吴永明,b,c,盛晓静,陈琳升

(贵州大学 a.现代制造技术教育部重点实验室;b.公共大数据国家重点实验室;c.机械工程学院,贵阳 550025)

0 引言

随着大数据时代的迅速崛起,工业数据安全预警问题正在逐步成为人民重点的关注对象[1]。周志方等[2]采用基于支持向量机(SVM)模型对企业风险进行预警并对重污染企业管控提出指导意见。张丁[3]采用Apriori算法进行关联规则数据挖掘预警,得到的关联关系可以作为煤矿安全的重要依据。Jo B W等[4]利用基于RSS范围的加权质心定位算法提高煤矿井下安全管理水平,预防煤矿井下事故的发生。因此,数据监测与预警在工业应用中的地位较高。

在工业生产中常用聚类算法来实现数据的预警与控制。Duan Haiyang等[5]利用k-均值聚类和动态时间规整(DTW)相结合,研究开发了一种有效的漏钢预警方法。宋杰鲲等[6]采用PCA-AR和K均值聚类构等建煤炭安全预警模型,利用K均值将煤炭安全划分为不同的安全等级。

在聚类算法预警中大多是采用欧式距离进行划分,但是没有对聚类对象区别对待,使预警机制对重要的聚类对象不够敏感。因此本文提出一种加权欧式距离与GNG算法相结合的增量学习模型,通过改变每个聚类对象的权重使聚类结果更加准确,同时通过构建阈值机制对工业数据进行实时监督和预警。

1 GNG算法理论

GNG算法是一种自适应聚类算法,聚类是数据挖掘中常用的算法之一,主要用于把大量的数据集合成若干簇[7],同一簇内数据相似程度较大,不同簇之间相似程度较小[8]。聚类算法划分方法大多是基于距离的,有K-means算法[9],K-modes算法,GNG(Growing Neural Gas)算法[10]等。雷小锋等[11]提出一种改进K-means算法解决了局部最优问题,提高了聚类效率。Bulent Tutmez等[12]提出用K-modes算法快速实现,不做数据分布处理进行火灾的检测与识别。

最早的无监督生长神经网络之一生长细胞结构(GCS)是由1994年Fritzke B[13]提出。在一年后Fritzke再次提出一种无监督的生长神经气(GNG)具有竞争特性的算法。GNG网络拓扑结构是自由变化的,当有数据输入时其拓扑结构是最活跃的。GNG会动态增减网络节点,链接相关性大的点和删除老化以及边界点。曾锋等[14]利用GNG算法对点云三角网格的拓扑结构进一步优化更接近于三角形。吴永明等[15]通过控制节点生成机制的GNG对燃煤锅炉数据动态特征分析与控制,实现了新生节点生成机制和节点淘汰机制。仲朝亮等[16]提出将GNG与A*算法结合用于机器人的路径规划方法,实现快速收敛于采样空间。但GNG算法在前人不断研究的过程中也有部分缺陷:通常采用欧氏距离计算获胜节点,而忽略了数据之间的内在联系,导致有时候GNG在聚类时会达不到动态数据变化的预警。如图1所示。

图1 GNG的数据漂移

当t=100时,数据本身分布是比较稳定的,因此可以形成稳定的拓扑结构,在t=1000时,由于迭代次数的增加,数据开始出现了漂移。并且在数据的漂移过程中经典的GNG无法形成明显的簇,使之间依然有联系。虽然Mohamed-Rafik Bouguelia等[17]提出了改进的GNG—A自适应增量无监督学习方法对数据漂移有所改善,但是没有注意其数据内部关系。本文提出采用加权欧氏距离的GNG算法,即克服了数据内部没有关系的缺点,同时保存了经典GNG算法良好收敛性的特点。

2 改进GNG算法

GNG在输入新的数据时,转化神经元来刺激神经元之间的相互竞争,其竞争模式一般采用欧式距离,其竞争公式为:

(1)

但是由于考虑对象内部之间的关系,本文应用加权欧式距离,其竞争公式为:

(2)

其中,i=(X1,X2,…,Xp)和j=(W1,W2,…,Wp)分别表示p维的数据,λp表示每个变量的权重。在实际的应用中λp的大小要根据工业背景计算或者选取。

改进的GNG算法主要拥有对新输入数据的权重欧式距离计算,新节点的生成和淘汰机制,具体实验步骤如下:

步骤1:初始化数据,对必要参数进行设置,获取具有时间序列的数据,并获取维度。

步骤2:输入样本向量X,计算其加权欧式距离,利用公式(2)。权重根据实际情况选取。

步骤3:在输入新向量时会对所有节点进行求加权欧式距离,得到获胜节点Sn,并且更新该节点的局部误差ESn:

Esn=Esn+‖X-Sn‖2

(3)

Wn=Wn+α1×(X-Wn)

(4)

(5)

步骤6:在判断获胜节点Sn的年龄,若:

t(Sn)>Tmax

(6)

那么神经元Sn被移除。并且存在单独的获胜节点也会被移除。

步骤7:增添新的节点Snewnode

Snewnode=0.5×(Serrmax+Serrmax2)

(7)

Enewnode=0.5×Emax

(8)

步骤8:Q,P是判断阈值,一旦超过阈值便给予报警。在获胜节点处进行预警判断:若获胜节点坐标满足:

XSn>QorYSn>P

(9)

步骤9:一次循环结束,返回步骤2。

3 实例验证

3.1 铝电解数据以及实验参数

实验对象选择的是贵阳市某造铝厂半年内其中一个槽的数据(118号电解槽)。铝液中Fe和Si的含量对铝纯度有着非常大的影响,铝液纯度的下降,会使铝的耐磨性,韧性,刚性都会发生改变。基于改进GNG算法对具有时间序列的Fe和Si含量数据进行聚类,并进行预警同时也对数据进行了实时跟踪,为监管者提供了良好的理论支持。实验数据如表1所示。

表1 实验数据

图2 数据动态时序分布图

铝电解中Fe和Si含量的数据是具有时间序列特性的。其动态时序分布图如图2所示。在118电解槽连续6个月的时间产生的Fe和Si在铝液中的含量。时间序列聚类是指数据通过客观组成同一特性的数据来识别未标记时间序列的数据结构,在同质组中,簇与簇对象之间的相似度较小,簇内的对象之间的相似度较大。同时还可以看出,铝液中Fe和Si含量的数据具有数据漂移的现象,说明此数据在一个范围内是稳定的,超过了这个范围就会使数据变得活跃起来,进而使这一类数据变得不稳定,在此利用聚类算法将数据进行预警分析。

在第2节中的实验模型参数如表2所示。

表2 实验参数

λ1和λ2分别表示Fe含量和Si含量在电解铝溶液时Fe和Si含量杂质对铝的纯度的影响是的权重大小。α1和α2表示调节系数,获胜节点的权重。Tmax是最大年龄。Q和P分别表示Fe含量和Si含量的阈值。

3.2 实验结果

实验是用对比的方法,采用了经典K-means算法,经典GNG算法和改进GNG算法的网络拓扑图进行比较与分析。实验结果如图3所示:

(a) k-means实验结果

(b) 经典GNG实验结果

(c) 改进GNG实验结果图3 实验结果

在图3中可以看出铝电解过程中产生的杂质Fe与Si的含量是发生了明显的数据漂移,数据被分成了两块区域。图3a聚类出的结果可以看出一簇内Fe含量增长的过程中没有区分含量的多少,造成这种情况的原因是数据漂移后,k-means算法无法及时的检测到数据的变化。在图3b聚类出的结果中圆形的圈为神经节点,线条相互连接神经节点的线路,数据漂移的过程中GNG算法的连接线条无法及时的发现新的神经元和移除旧的神经元。在图3c可以看出神经元已经遍及所有的数据,并且设置阈值,当神经元到达阈值的时候报警装置立刻就会触发。在每次输入数据时网络拓扑图中都会产生相应的获胜节点,并且会把新输入数据形成的节点与关联节点的误差更新,但随着网络对新输入数据的适应性的增强,误差将会逐步减小。

如图4所示,铝液中Fe和Si含量的数据在不同算法中可以看出其聚类的特性是不同的。

图4 实验对比结果

在K-means算法中由于K-means的特性需要首先给定K的取值,一旦K值给定其聚类中心得个数也就确定了,在迭代的过程中只是在不断的更新其获胜节点的位置。经典GNG和改进GNG算法可以从图中看出在迭代次数不断增多的过程中聚类中心个数有明显差别。在数据具有时序性和漂移特性的情况下,改进的GNG在加权欧式距离的计算其相似度的情况下,会根据其每个样本的特性进行给出权重,每个样本在不同的权重下得到的获胜节点并在获胜节点的淘汰机制下,确定了聚类中心。在经典的GNG中的聚类中会在数据发生漂移的过程中无法及时的监测到。这就是本文所提出的改进GNG算法的对动态时间序列数据进行实时的监督与跟随,在聚类的过程中及时向工作人员反映。

对Fe和Si含量数据的预警分析主要是为了控制铝液纯度。影响铝液纯度的主要因素有:料量,次数,氟化盐,电压以及电解质水平和NB设定。下面给出某铝厂连续一周没有调整前的数据和连续一周调整后的数据:

如表3和表4所示在电解铝的过程中产生的Fe和Si的百分比受多个因素影响,其中Fe对于铝纯度的影响最大,所以控制Fe的浓度,就可以有效的提高铝的纯度。在表3中可以看出Fe含量最大是0.308%在调节氟化盐的加入量之后在表4中可以看出最大Fe含量是0.172%。综合表3和表4可以看出氟化盐对Fe的含量影响比较大,在加入氟化盐后Fe的含量明显降低。在以提高铝液含量为目标时,为了降低Fe的含量,即在加料中要加入适当的氟化盐,便可提高铝的纯度。由此可见,氟化盐是在众多影响因素中最重要的。所以在电解铝的过程中为了控制铝液纯度,要在投料时加入适当的氟化盐。

表3 控制调整前

表4 控制调整后

4 结论

为了实现对生产工业中时序数据的实时监督与控制,本文对无监督GNG的原理以及特性进行分析和研究,采用一种基于加权欧式距离的改进GNG算法实现了对时间序列数据的实时监督预警。以电解铝厂动态数据监督控制为例,通过电解槽杂质含量进行聚类分析并且以K-means、经典GNG算法为参照进行了实验比对。结果表明本文改进GNG算法在跟踪与监督杂质含量数据更具有优势,能够提高动态异常数据预警的有效性和精确性,进而为工厂管理者提供理论技术支持。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!