时间:2024-08-31
张 峰, 张 蔚, 张建明
(浙江大学智能系统与控制研究所,杭州 310027)
原油冶炼中主精馏塔装置的渐近辨识及分析
张 峰, 张 蔚, 张建明
(浙江大学智能系统与控制研究所,杭州 310027)
原油冶炼过程的精馏塔装置属于典型的强耦合多变量化工对象,对其进行控制需要准确、合理的数学模型,辨识模型的精确程度与控制效果和经济效益直接相关。出于安全和效率考虑,对原油精馏过程的测试需要在闭环条件下进行,渐近辨识方法在测试过程中能够同时改变多路操作变量并根据频域方法给出模型。本文基于渐近辨识理论,采用先升阶再降阶的解决方案,根据ARMAX模型描述精馏塔装置,取得符合要求的辨识模型。由于新观测数据能够降低过程建模中的不确定性,以输出误差为指标考察了新的测量数据对改善辨识模型精度的影响,分析测试数据信息量与有效估计之间的联系,量化分析新观测数据的引入对降低模型参数不确定性的影响。
多变量系统; 系统辨识; 渐近法; 性能分析
多变量系统的模型辨识问题,包括用脉冲传递函数矩阵描述、Markov参数描述和输入输出差分方程描述的多变量辨识方法[1]。与单变量系统辨识类似,多变量系统辨识利用系统的输入和输出数据,在某种准则意义下,寻找与系统外特性等价的数学模型。由于输入输出变量之间存在着耦合,改变一组操作变量往往对多组被控变量产生影响,多变量系统的系统辨识与控制一直是流程工业中的难题。部分方法着眼于将系统解耦,但这种方法不适用于强耦合的复杂系统。
原油冶炼过程的精馏塔装置是石化工业关键系统之一,该装置对原油各组分进行分离提纯,目前采用预测控制方法能够取得较好的控制精度和经济效益[2]。预测控制方法需要以准确合理的过程模型为基础,当数学模型与实际过程失配程度较大时控制效果将恶化。因此,工程实践上在过程辨识和验证环节需要投入大量人力和经济资源,建模过程成本很高。目前对于精馏塔装置,工业界采用区间控制,即要求操作变量和被控变量处于控制范围之内。出于安全和效益等因素考虑,测试过程不允许断开反馈回路,以保证过程稳定运行。但闭环测试数据输入输出相关度高,与开环测试相比,更难从测试数据提取信息用以构建数学模型,而且闭环系统存在可辨识性的问题[3]。
常规辨识方法每次测试只改变一组操作变量,观察并记录各输出变量,因此花费的时间相当多。渐近辨识方法提供多变量系统建模方案[4],能够在测试过程中同时改变多组操作变量,并依据频域方法给出待估计对象的数学模型,显著节省了辨识测试中的时间和经济成本。本文以原油冶炼过程的精馏塔装置为研究对象,采用了渐近辨识法对主精馏塔进行系统辨识和模型验证,以线性差分模型来描述多变量化工对象,按照先升阶再降阶的方案进行模型辨识和验证。
1.1 概述
依据人们对系统辨识的定义,辨识过程就是按照某个准则在一组模型类中选择一个与数据拟合得最好的模型[5]。因此,系统辨识包括输入输出数据、模型类和准则3个基本要素,其中数据是其基础,而准则扮演着优化目标的角色,模型类则给出可行范围。建立模型的目的是保证控制算法良好运行,根据悭吝性原则辨识模型的参数应尽可能少。Ljung从理论上分析得出当单变量黑箱传递函数模型阶次趋于无穷时,输出误差趋向于零[6]; Zhu将渐近理论推广到多变量系统中,拓展了该理论的适用范围[7]。渐近理论虽然具有很好的性质,但前提是假设阶次趋向无穷,条件过于苛刻。应用渐近理论意味着使用阶次相当高的模型。渐近辨识法大胆采用计算可行的高阶模型,通过降阶得到等价模型。采用先升阶再降阶的方案取得的效果不亚于采用直接估计方案[8]。
1.2 输入信号设计
输入信号设计作为一个细节,其谱密度函数应能覆盖系统的全部模态,但信号的幅度或功率要加以限制,并且工程上要容易实现。工程上常选用相关函数具有脉冲响应特性的信号作为输入信号,如白噪声或伪随机二位式序列等[9],这两种信号共性之处在于它们对于低频特性的侧重。一般而言,提高输入信号幅值对待估计过程模态激励得更充分,但存在着干扰装置或过程正常运行的弊端。从频谱分析的角度,输入信号u(k)的谱密度函数Su(ω)可表示为
(1)
其中Ru为信号的相关函数。如果只有某些频率使Su(ω)>0,这种信号称为有限阶的持续激励信号。
(2)
(3)
上式第二项负定,说明新观测数据的加入有助于降低参数估计过程中的不确定性。
1.3 模型选择
在得到输入输出数据之后,可以通过系统的某些特征来获得备选模型集,从中选择一个合适的模型。采用非线性Hammestain模型或Wiener模型[11-12],对于准确描述精馏过程动态特性有利,但会给实际工程应用带来障碍。本文选择线性差分方程来描述对象,差分模型具有如下形式:
A(q)y(t)=B(q)u(t-k)+C(q)e(t)
(4)
其中:e(t)表示白噪声;k表示过程时延;A(q)、B(q)、C(q)分别为多项式系数,表达式分别为
当C(q)=1时差分模型为自回归(ARX)模型,当C(q)≠1时差分方程为自回归滑动平均(ARMAX)模型。将真实过程表示为
(5)
(6)
由于A(q)参数中输出误差是非线性的,参数估计过程中可能存在数值问题,这意味着没有闭式解[13]。为了保证参数估计方法的渐近无偏性,假设模型阶次估计准确且输入信号满足持续激励条件,同时A(q)和B(q)没有公因子。
1.4 阶次估计
Akaike提出较为客观的判定系统的模型阶次的方法[14],在其基础上发展出的最终预报误差(FPE)定阶方法利用极小化一个准则函数来估计模型的阶次,当数据长度N充分大时,FPE准则表示为
(7)
(8)
无论哪种定阶方法,都不能保证得到无偏的模型阶次,模型结构的先验信息对确定模型结构有积极作用。
1.5 模型辨识
假设真实过程为m输入和p输出过程
y(t)=G0(q)u(t)+v(t)
(9)
y(t)=G(q,θ)u(t)+H(q,θ)e(t)
(10)
参数估计过程实际上是最优化计算的过程,即计算全局极小值,最优计算过程表达为
(11)
⊗Φv(ω)
(12)
其中Φv(ω)=H0(eiw)R[H0(eiw)]T;-T是转置的逆矩阵。
极大似然估计要求数据序列概率分布一致,通常还要假设服从高斯正态分布,具有渐近正态性等品质。渐近辨识法实际上是极大似然法在频域上的应用,基本思路是先估计高阶ARX模型,然后降阶为ARMAX模型。选择高阶模型既是为了获得模型的一致性,同时为了满足渐近理论的前提条件,模型表达式为
A(q)y(t)=B(q)u(t)+e(t)
(13)
(14)
降阶过程使用的最小化算法具有若干特点,首先高阶ARX模型中的扰动影响有所减弱,另外初始值的获得可以用不同方法,同时部分局部极小值可检测。由于模型降阶存在平滑效应,降阶后模型的频率响应一般位于高阶模型频率响应的中段,根据这个规律可剔除掉部分局部极小点。
f(z(k),…,z(k-na+1);
u(k),…,u(k-nb+1))
(15)
使得评价函数式(16)最小:
(16)
2.1 数据集及谱密度分析
实验采用的数据集来自于精炼厂原油冶炼的主精馏的闭环测试,包括7组输入变量和4组输出变量,采样周期为1 min。辨识模型将用于模型预测控制,其中输入变量1~3表示温度设定点,输入变量4为流量设定,输入变量5和6为流量比设定值,输入变量7则是流量量测值,来自于预测控制器的可测扰动;输出变量1表示精馏塔内托盘之间的温度差异,输出变量2~4为在线仪表测量的产物质量。预处理环节首先对输入输出数据取均值化,再将其标准差缩放到1。
数据集是信息源,辨识算法从中提取信息用于构建模型,因此对于复杂多变量系统辨识过程,我们需要考虑输入激励程度和测试信号长度两方面因素,使测试数据中信息量尽可能丰富,才有可能接近统计意义上的最佳模型。为判断输入测试信号是否对过程形成充分激励,对4组输出变量进行功率谱分析,得到各自功率谱密度函数,如图1所示。根据图1结果,精馏塔对象主要特性表现在低频段,符合过程对象的规律,同时说明在原油冶炼等建模过程中,输入信号应侧重低频段,在高频段可加入相对较少激励,既节省信号能量,又减少对系统扰动。
图1 输出变量谱密度分析Fig.1 Spectral density analysis of output variables
2.2 时延估计
原油冶炼过程存在显著时延,如果参数不估计时延,辨识模型质量将变差。时延估计与阶次选择有类似之处,即尝试多种不同时延,检测对应的损失函数,选择使得损失函数最小的时延。对于每组输出,通过估计模型来尝试不同时延。根据工程先验知识,输出变量2的时延范围为[50,110](单位:采样周期),其他输出变量时延范围为[1,40]。因此输出变量1、3和4的时延范围选择为[0∶2∶40],即[0 2 4 6 … 40];输出变量2的时延范围选择为[50∶5∶110],即[50 55 60 … 110]。
在选择时延的过程中,假设ARX模型阶次为40,选择输出误差作为衡量时延合适程度的指标。为简洁起见,对于一个给定输出,对所有输入均采用同样的时延。本文考虑的主精馏塔装置有4组被控变量,将其分解为4个多输入单输出(MISO)过程,选择输出误差较低点对应的时延作为4组MISO过程的时延估计值,结果如图2所示。
图2横轴表示时延值,纵轴则是按照输出误差准则计算得出的误差值。从图2得出可能的时延值有多种情况。根据这些情况开展的后续实验结果表明,较为合适的时延估计值为[4,100,12,10]。
图2 时延估计Fig.2 Time delay estimation
2.3 阶次选择
在时延确定后,首先采用计算复杂度较低的线性ARX模型对4组多输入、单输出(MISO)过程进行描述,针对每组输出变量,估计其对应的MISO过程的数学模型,在一定范围内选择使误差准则最小的阶次。为便于讨论,针对每组MISO模型,在ARX模型阶次选择方面假设na=nb。
对于给定的过程数据,ARX模型阶次比ARMAX模型阶次更高。采用FOE准则,将最高阶次设定为n=50。逐渐增高ARX模型阶次,检测相关的FOE变化情况,得到图3。由图3可见,当阶次逐渐升高,FOE会不断下降,对于输出变量3和输出变量4,模型阶次超过10后FOE下降并不明显。权衡模型的复杂程度和准确性等因素后,将描述4组MISO过程的高阶ARX模型阶次依次选择为45、38、6和4。模型结构确定后再降阶得到可应用的等价模型,同时根据参数估计计算出理论模型参数。
图3 FOE随ARX模型阶次变化情况Fig.3 FOE changes with the order of the ARX mode
2.4 参数估计
参数估计的目的是得到无偏的最小方差的模型估计值,良好的参数估计方法在闭环测试中应保持一致性,并取得最小方差,而且在数值上稳定可靠。描述4个MISO过程的高阶ARX经过降阶得到4组低阶ARMAX模型,每组模型具有7组输入变量,意味着式(13)中多项式B(q)存在7个分量。用时序数据来估计ARMAX模型阶次和多项式参数,同时给出均方误差(MSE)和拟合程度。MSE的值越小,说明预测模型描述实验数据具有更好的精确度。描述4组MISO过程的ARMAX模型参数估计结果如表1所示。表1中参数nb实际具有7个分量,表示MISO过程的ARMAX模型有7组输入。前面的假设认为7个分量相同,如nb=3则说明分量为nb={3 3 3 3 3 3 3}。为说明估计模型的稳定性,同时对降阶前的高阶ARX模型和降阶后的ARMAX模型进行阶跃响应测试,以说明降阶前后两种数学模型在描述过程动态的一致性。
表1 ARMAX模型估计结果
图4中虚线和实线轨迹分别代表依据ARX和ARMAX模型得到的阶跃响应,精馏塔装置有7组输入变量和4组输出变量,共28组阶跃响应。从阶跃曲线观察,两种线性差分模型下均给出稳定的响应结果,而且趋势较为吻合,实际上计算得到的两种模型是同一装置的不同描述形式,某种程度具有等价性,相比之下ARMAX模型给出的响应更为平缓。
根据响应曲线,每组输入变量对4组被控变量均存在不同程度的影响。这种现象反映出如原油冶炼这类多变量过程高度的耦合。
2.5 模型验证
得到的模型必须经过验证和评估才能为预测控制算法提供支撑。模型验证的目的就是确认实际过程与辨识模型匹配程度是否达到要求。为避免过拟合,辨识和验证数据应采取不同的量测信号,我们将原始数据(共3 977个采样点)分为两部分,前60%个采样点用于模型辨识,后40%个采样点作为验证数据。依据辨识算法给出的模型预测多变量系统在输入激励下的输出量,与真实输出变量进行对比,拟合程度高则说明匹配程度高,模型验证结果如图5所示。
从图5拟合效果看,线性ARMAX模型在预测4组MISO过程特性中不仅趋势吻合,拟合程度也相当高,起到以简驭繁的效果。对于预测控制而言,提前一步预报的精度满足实际应用,多步预报能更加精确地验证模型,但是多步预报可能会有更大的误差,在实际应用中有特殊要求时,需要进行多步预报。
考虑到测试数据量的变化对辨识模型精度带来的影响,本文将原始数据按照20%、40%、60%、80%、100%的比例进行分割,分别对应796、1 591、2 386、3 182和3 977个采样点,进行独立的辨识实验,实验结果如表2所示。
图4 阶跃响应测试Fig.4 Step response test
图5 ARMAX模型验证Fig.5 ARMAX model validation
原始数据分割比例/%模型辨识模型精度输出变量1输出变量2输出变量3输出变量420ARX0.15101.14510.07800.2284ARMAX0.12551.09790.06250.360740ARX0.19110.27500.07640.1818ARMAX0.19790.29790.06980.128360ARX0.15630.30810.06170.1673ARMAX0.16270.25270.06070.100080ARX0.13630.31870.06650.2361ARMAX0.11840.25840.06650.1893100ARX0.18770.38140.07140.2446ARMAX0.16300.32940.06940.2220
根据表2给出的信息,可以发现高阶ARX模型与等价ARMAX模型在输出误差方面接近,反映出ARMAX模型在描述多变量过程动态特性方面与高阶ARX模型具有接近的准确程度,说明降阶过程并没有牺牲过多的精度。此外,增加数据量将使得输出误差指标下降(图6),证明有效观测数据的引入能够降低建模过程中的不确定性,但输出误差的降低是有限的,反映出接近最佳有效估计边界。
由图6可以看出当数据量下降到原始数据总量40%的水平时,辨识算法给出的等价ARMAX模型的输出误差上升,特别是对于输出变量2和输出变量4。要得到这些变量过程的较好模型,至少需要60%的原有数据,即2 386个采样点才能支撑整个辨识算法。再增加数据量,性能指标基本持平,增加工作量的同时又带来信息冗余的问题。
图6 不同数据量下ARMAX模型输出误差Fig.6 Output error of ARMAX model under different data
针对原油冶炼过程的精馏塔装置,采用渐近法进行多变量系统辨识,选取ARX、ARMAX模型描述过程,取得符合控制要求精度的模型。同时考虑到观测数据中信息量对辨识模型精度的影响,本文将原始数据截取为多部分,分别进行独立的辨识实验。结果显示,新观测数据的引入有助于降低关于模型参数的不确定性,但这种提升是有限的,输出误差指标存在着最低边界。当数据量达到某一阈值时,辨识算法可实现有效估计,再增加数据无助于提升模型精度。为量化考察指定数据集下能达到的最低指标边界,后期工作拟考虑从Cramér-Rao下界的角度来展开讨论。
[1] BACKX T C,DAMEN A A H.Identification for the control of MIMO industrial processes[J].IEEE Transactions on Automatic Control,1991,37(7):980-986.
[2] 钱积新.非线性预测控制 [M].北京:科学出版社,2015.
[3] HANSEN F,FRANKLIN G,KOSUT R.Closed-loop identification via the fractional representation:Experiment design[C]//American Control Conference.Pittsburgh,PA,USA:Wiley,1989:1-23.
[4] 朱豫才.过程控制的多变量系统辨识[M].长沙:国防科技大学出版社,2005.
[5] LJUNG L.System Identification,Theory for the User[M].[s.l.]:Prentice Hall PTR,1999.
[6] LJUNG L.Asym ptotic variance expressions for identified black-box transfer-functionmodels[J].IEEE Transactions on Automatic Control,1985,30(9):834-844.
[7] ZHU Yucai.Black-box identification of mimo transfer functions:Asymptotic properties of prediction error models[J].Kluwer Academic,1993,3(4):357-373.
[9] 方崇智.过程辨识[M].北京:清华大学出版社,1988.
[10] RAO C R.Information and the accuracy attainable in the estimation of statistical parameters[J].Bulletin of the Calcutta Mathematical Society,1945,37(3):81-91.
[11] ZHU Yucai.Identification of Hammerstein models for control using ASYM[J].International Journal of Control,2010,73(18):1692-1702.
[12] ZHU Y.Distillation column identification for control using Wiener model[J].IEEE,1999,5(5):3462-3466.
[13] EYKHOFF P.System Identification:Parameter and State Estimation[M].USA:John Wiley & Sons,1974:129-158.
[14] AKAIKE H.A new look at the statistical model identification [J].IEEE Transactions on Automatic Control,1974.19(6):716-723.
Multi-variate Identification of Crude Oil Refining Processes Using ASYM Method
ZHANG Feng, ZHANG Wei, ZHANG Jian-ming
(Institute of Cyber-Systems and Control,Zhejiang University,Hangzhou 310027,China)
The main distillation column of a crude unit at a refinery is a strong-coupled multivariate system.The precision of identifiable models has close relationship with performance of control and ecomonic benefit.Considering the safety and efficiency,test should be performed under closed-loop situations.ASYM method has the potential to change multiple manipulated variables at the same time,providing identified models based on frequency domain methods.This paper uses ARMAX model to describe the main distillation column by ASYM method.As efficient measured data reduce the uncertainty in the process of parameter estimation,this paper quantitatively analyzes accuracy improvement brought by new measured data,using output error as performance index.
multi-variate system; system identification; ASYM method; performance analysis
1006-3080(2017)03-0397-07
10.14135/j.cnki.1006-3080.2017.03.016
2016-10-10
国家高技术研究发展计划(863计划)重大项目(2012AA041702);国家自然科学基金创新研究群体项目(61621002)
张 峰(1993-),男,硕士生,从事系统辨识的研究。
张建明,E-mail:jmzhang@iipc.zju.edu.cn
TP391.41
A
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!