时间:2024-07-29
杜莉莉,傅 勤
(苏州科技大学 数理学院,江苏 苏州 215009)
迭代学习控制(iterative learning control,ILC)自从Arimoto等[1]首次提出完整的控制算法以来,已成为近年来控制理论研究的热点问题,并引起人们的广泛关注[2-3]。迭代学习控制适用于在有限时间区间内具有重复运动性质的受控系统,通过反复迭代修正,使得系统的输出轨迹沿迭代轴方向收敛于给定的期望轨迹。
广义系统又称为隐式系统或奇异系统,是一类较正常系统形式更为一般化的动力系统,被广泛应用于电子网络、经济系统、社会系统、生物系统等领域中[4-6]。近年来,许多具有重复运动性质的实际问题,例如工业机器人等[7],都是由广义系统模型来刻画的。由此,研究广义系统的迭代学习控制问题是有意义的。由于正常系统理论的研究基本成熟,已形成一套较为完善的理论体系,为了与之区别,习惯上以矩阵E为奇异矩阵作为广义系统的明显标志,从而使广义系统理论成为一个独立的研究分支。除了矩阵E的明显差异之外,还有一些其他的区别:从系统模型的特性来看,广义系统具有动态特性(由微分方程描述)和静态特性(由代数方程描述),而正常系统没有静态特性;从对系统初始值的要求来看,广义系统需要考虑相容条件,它对任意初始条件不一定有解,而且有解也不一定唯一,而正常系统对任意初始值都存在唯一解;广义系统的状态响应中通常不仅含有正常系统所具有的指数解,而且还含有脉冲解和静态解,从而使广义系统出现了正常系统所不具有的脉冲行为。由于广义系统含有正常系统所不具有的脉冲项,对其学习控制设计时,会较正常系统困难些。借助于广义系统的正则性条件,文献[8]讨论了线性广义系统的迭代学习控制问题,并给出了相应的收敛性条件。文献[9]基于矩阵奇异值分解,将广义系统转化为等价的微分(或差分)代数系统,并在通常的初值假设条件下,给出一种由D型算法和P型算法混合而成的新型学习律(称之为D-P型),有效地解决了线性广义系统的状态跟踪问题。这种新算法简单实用,基于此算法,文献[10]继续研究了具有固定初始偏移的广义系统的状态跟踪问题,文献[11]与文献[12]研究了离散时间广义系统的跟踪问题。
大型互联系统是由相互关联的子系统组成的一个复合系统,在电力系统、化工工程、大空间结构、多智能体系统、计算机通信网络等实际问题中,系统模型都具有大系统形式。由于集中控制结构复杂,运行成本高,所以对大型互联系统常采用分散控制[13]。近年来,大型互联线性系统的分散控制设计得到了较为深入的研究[14-15]。最近,基于迭代学习控制的大型互联系统的分散控制问题引起了大家的关注,文献[16]-[18]研究了大型互联系统的分散迭代学习控制问题。
广义大型互联系统是由广义系统互联而成的一类复合系统。文献[19]与文献[20]借助于分散控制方法,讨论了广义大型互联系统的稳定性和镇定设计问题。然而,由于广义大型互联系统的复杂性,就迭代学习控制设计而言,尚未涉及广义大型互联系统。本文提出广义大型互联线性离散系统的迭代学习控制问题,研究一类广义大型互联线性离散系统的分散迭代学习控制,利用矩阵奇异值分解的方法,将该类系统转化为差分代数系统,并构建D-P型学习控制算法。证明在该算法的作用下,迭代系统的状态能沿迭代轴方向一致收敛于给定的期望轨迹。
本文给出如下符号约定:对矩阵 A ∈Rn×n,记为矩阵的2-范数,其中ρ(ATA)为矩阵ATA的谱半径;矩阵 Bi∈Rmi×ni,B=blockdiag(B1,B2,…,BN)表示块对角矩阵;用 x =col{ x1, x2,… , xn}∈ Rn,表示n维列向量;对向量函数h(t)∈Rn,t∈{0,1,…,T},定义h(t)的上确界范数,这里为h(t)的2-范数。记I为单位矩阵。
考虑如下重复运动的广义大型互联线性离散系统[19-20]
对系统(1)作如下假设条件:
假设1 对于给定的理想轨迹zid(t),存在唯一的控制输入uid(t),使得
成立。
假设2 初值定位条件 zik( 0) = zid(0),k=0,1,2,…,k为迭代次数。
注1 假设1与假设2是研究迭代学习控制问题的常用假设条件。
对于给定时间t=0,1,…,T上的期望轨迹zid(t),控制目标是设计适当的学习律,使得当迭代次数k→∞时,系统的状态zik(t)在t=0,1,…,T上一致收敛于理想轨迹zid(t),即,其中
因rank(Ei)= ri<ni,存在实矩阵Pi、Qi,使得
对系统(1)作矩阵奇异值分解,令 zik(t) = Qixik(t ),有
进一步有
记
式中i=1,2,…,N。
对系统(2)作同样的矩阵奇异值分解,可化为
引理1 如果对任意的初始向量x(0)及g,由迭代格式 x(k+1)= B x(k)+g得出的向量序列收敛的充要条件是ρ(B)<1[21]。
对系统(5),构建如下形式的迭代学习控制算法[12]
定义 Δ uik(t) = uid(t) - uik(t),由式(7)可得
则式(8)可写为
式中:Γ1=blockdiag(Γ11,Γ21,… ,ΓN1);Γ2=blockdiag(Γ12,Γ22, … ,ΓN2)。同样,将式(5)、式(6)写成下面的紧凑形式
式中
对系统(11)作上述同样的处理过程,有
式(13)与式(15)相减,可得
i=0,1,…,T。将式(17)写成紧凑形式,得到
式(14)与式(16)相减,可得
将式(17)、式(19)代入式(9),有
反复套用式(19),再结合假设2,有
式中取t=0,1,…,T-1。结合假设2中的初值条件 zik( 0) = zid(0) ⇔ δik(0) = 0,有
式(22)代入式(21),可得
注意到
由引理1可知,当ρ(G)<1成立时,有
再根据式(22),有
式(17)结合式(23)和式(24),可得
考虑如下形式的广义大型互联线性离散系统
取线性变换中 Qi=I2,i=1,2,得到
记,可将上式转化为
取初始控制 u10( t) = u20(t) =t6。在学习算法式(7)的作用下,利用Matlab软件进行仿真分析,得到图1和图2。
图1 x1k的跟踪误差
图2 x2k的跟踪误差
图1和图2分别表示子系统1和子系统2的状态跟踪误差随迭代次数变化曲线,可看出,随着迭代次数的增加,广义大型互联线性系统的各个子系统的状态跟踪误差在学习算法式(7)的作用下沿迭代轴方向趋近于零。
本文研究一类广义大型互联线性离散系统的状态跟踪问题。利用矩阵奇异值分解的方法,将广义大型互联线性系统转化为等价的差分代数系统。针对差分代数系统,构建D-P型的迭代学习控制算法。理论分析表明,所给算法在一定条件下是收敛的,经过不断迭代,系统的状态能渐近地跟踪期望轨迹。同时,仿真算例说明了算法的有效性。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!