时间:2024-07-06
于坤杰,王昕,王振雷
(1 华东理工大学化工过程先进控制和优化技术教育部重点实验室,上海 200237;2 上海交通大学电工与电子技术中心,上海 200240)
通过模拟实际班级中教师给学生的教学过程和学生的学习过程,2011年Rao等[1]提出了一种新型的群智能优化算法——教学优化算法(teachinglearning-based optimization,TLBO)。该算法分为教师阶段和学生阶段,教师阶段是教师教导学生知识,学生阶段是学生之间互相交流,通过这两个阶段不断的提高学生成绩。教学优化算法具有参数少,算法简单,易理解,求解精度高等优点[2-4]。
TLBO算法自提出以来,已经引起很多学者的关注,并且得到了很好的应用[5-7]。2012年Rao等[8]通过在算法中加入精英策略提出了精英教学优化算法(ETLBO),ETLBO算法在解决复杂的约束问题上,显示出了很好的性能。Anguluri Rajasekhar等[9]提出相对精英教学优化算法(ETLBO),改进算法在寻优精度及速度上有所改进。Taher Niknam等[10]提出了基于改进TLBO算法的多目标优化方法并应用在自动电压调节器位置的分配上,取得了较好的效果。Rao等[11]在教师数量、教学因子及学习方式上进行改进,提出了改进 TLBO算法(modified TLBO,MTLBO),并将其成功用于热点冷却器优化和热交换器优化中。然而,这些改进的TLBO算法存在收敛速度慢,迭代后期容易陷入局部最优的问题。
针对上述问题,本文提出的改进算法对教学因子进行自适应调整,使教学因子TF呈线性减小,这样算法在搜索前期进行全局搜索,使搜索空间快速收敛于最优解附近,提高收敛速度,搜索后期进行局部精细搜索,提高搜索精度。同时,考虑实际的学生学习过程中,学生获取的知识存在一定程度上的误解,所以在算法中引入信任权重,对学生已经获取的知识采取部分信任的策略,避免对已学知识的过分信任。这样可以加强学生和老师之间,以及学生之间的信息共享,可以使算法跳出局部最优。在基准函数的实验测试中,结果显示本文提出的改进TLBO算法(improved TLBO,ITLBO)收敛速度快,并且能够跳出局部最优。最后在裂解炉裂解原料效益的应用中,改进算法获得了良好的应用效果,大大提高了裂解效益。
教学优化算法是模拟以班级为单位的教师给学生的教学过程和学生的学习过程而提出的新型智能优化算法。学习过程中,班级中学生成绩的提高需要教师的教导,同时,学生之间需要互相交流来促进知识的吸收,进一步提高成绩。对应这两个学习方式,该算法分为两个阶段:教师阶段(教师教导学生),学生阶段(学生之间互相交流)。在TLBO算法中,教师和学生相当于进化算法中的个体,而教师是适应度值最好的个体,学生所学习的不同科目相当于不同的决策变量,学生的学习成绩相当于适应度值。
这个阶段模拟学生获取知识通过教师的“教”过程。该阶段,教师教导学生们知识,努力提高班级学生的平均水平。在任意迭代次数 i,假设班级学生人数为n,学习科目数为m,学生在某一学习科目j的平均水平为Mj,i,由于教师是最具有知识的人,所以当前班级中成绩最好的学生作为教师。每一科目的当前学生平均水平与对应的教师水平之间的差,由式(1)给出。
式中,Xj,kbest,i为教师在科目j的水平。ri为0~1的随机数。TF为教学因子,它决定平均值改变的程度,TF由式(2)随机确定为1或2。
根据当前教师水平与学生平均水平之间的差Difference_Meanj,i,教师阶段对解的更新如式(3)所示。
式中,x'j,k,i为 xj,k,i更新后的值。如果 x'j,k,i对应的适应度值优于xj,k,i的适应度值,则接受x'j,k,i。
这个阶段模拟班级中学生互相交流的学习过程。通过学生间的互相交流,学生可以从比自己知识多的学生那获取新的知识。学生阶段的学习过程如下。
随机选择两个学生P和Q,对应的水平为X'j,p,i和 X'j,Q,i,X'j,p,i≠X'j,Q,i。X'j,p,i和 X'j,Q,i分别为 Xj,p,i和Xj,Q,i在教师阶段的更新值, ()f x为优化目标函数。学生阶段过程是通过分析两个学员之间的差异进行学习调整,该阶段过程由式(4)给出。
如果新解 X''j,p,i对应的适应度值优于X'j,p,i对应的适应度值,则接受X''j,p,i。
在基本的TLBO算法的教师阶段过程中,教学因子TF由式(2)随机取值为2或1,教学方法比较单一,这样一来,学生在向教师学习时,出现两个极端情况,要么全盘接受,要么全部否定不予接受。但是,在实际学生向教师学习过程中,学生根据自己的吸收能力向教师学习,学习前期,学生和教师之间水平相差较大,学生学习的知识多而快,当学生水平接近教师水平时,往往学习进步逐步变慢。在TLBO算法中,教学因子TF决定平均值改变的程度,较大的TF能够加快算法搜索速度,但会使搜索能力下降。较小的TF能够使搜索更加细微,但会使搜索速度下降。
因此,改进的TLBO算法对教学因子进行了改进,提出一种自适应的教学因子,即随着迭代的进行,线性地减小TF的值。改进的教学因子TF由式(5)给出。
式中,TFmax、TFmin为教学因子的最大、最小值;itermax为最大迭代代数;iter为当前迭代代数。
改进后的教学因子TF在算法搜索前期大,后期小。这样就能使算法在搜索前期采用全局搜索,使搜索空间快速收敛于最优解附近区域,提高搜索速度。后期采用局部精细搜索以获得高精度的解。
基本TLBO算法对学生已获取的知识采取完全信任的策略。然而,在实际的学生学习过程中,学生已获取的知识可能存在一定程度上的误解,也就是存在错误的知识,如果对已获取的知识过分信任,学生会盲目信任自己的水平,这样算法就容易陷入局部最优。
因此,改进的 TLBO算法引入信任权重 w(w<1),对学生已获得的知识采用部分信任的策略,避免学生对已获得知识的过分信任,以加强学生和老师之间,以及学生之间的信息共享,以使算法跳出局部最优。本文在引入信任权重w时,考虑教师阶段是学生向教师学习知识,如果对学生已获取知识的信任度低,这样就能从教师那获取更多的知识。所以教师阶段的信任权重w1低于学生阶段的信任权重 w2。教师阶段解的更新式(3)引入信任权重w1,如式(6)所示。
学生阶段更新过程式(4)引入信任权重 w2,如式(7)所示。
综上所述,改进TLBO算法用于优化问题的步骤表述如下。
(1)初始化种群(班级),根据具体需要优化的问题设定种群数,维数,教学因子TF上下限,信任权重w。
(2)评价种群个体,选择种群中适应度值最好的个体作为教师。
(3)按照式(1)、式(5)、式(6)进行教师阶段的迭代过程,接受好的解。
(4)按照式(7)进行学生阶段的迭代过程,接受好的解。
(5)重复步骤(2)~步骤(4),直到满足结束条件为止。
为了测试改进TLBO算法的有效性,针对8个典型的测试函数进行仿真实验,测试函数如表1所示,并与标准TLBO算法进行比较。算法参数设置为种群数ps=10,教学因子最大值TFmax=2,最小值TFmin=1,信任权重选举经验常数w1=0.1,w2=0.5,迭代代数itermax=500。
两种算法都连续运行30次,表2给出了优化结果,其中“最优值”表示运行30次结果的最好值,“平均值”表示运行30次结果的平均值,“标准差”表示运行30次结果的标准差。从表2中的比较中可以看出,改进的TLBO算法在这8个高维复杂函数上都达到了很高的精度,尤其在函数 f1、f3、f4、f6和f8都能达到全局最优解,而基本TLBO算法仅在f8达到了全局最优解,其余都陷入了局部最优解。
图1和图2为两种算法分别在f6和f8中一次寻优的收敛曲线,在图1中,改进的TLBO算法很快收敛到全局最优解0,而基本TLBO算法收敛缓慢并陷入了局部最优解。图2中改进TLBO算法基本在20代就收敛到全局最优,而基本TLBO算法在100代收敛到全局最优。通过对比可以看出,改进的TLBO算法收敛速度有显著提高并且能够跳出局部最优,达到了预期的效果。
表1 测试函数
表2 优化结果比较
图1 两种算法在f6中的收敛曲线
图2 两种算法在f8中的收敛曲线
乙烯裂解炉是乙烯装置的核心,是乙烯装置经济效益的决定环节[12-13]。在保证裂解炉运行周期的情况下,如何让裂解原料效益达到最大一直是人们追求的目标。
在裂解原料价格稳定的情况下,影响裂解效益的因素主要有:裂解原料属性、裂解炉出口压力(COP)、裂解炉出口温度(COT)、进料量、汽烃比(SHR)、停留时间等。然而,现场裂解炉的出口压力(COP)的测量位置处于高温高压的位置,难以获得其真实准确值,另外,裂解炉模拟计算发现,裂解原料的属性也是无法控制的。因此,可以自由控制调节的因素只有裂解炉的COT和SHR。应用基于自由基反应的裂解炉反应管模拟软件 CoilSim1D进行裂解模拟[14-15],并采集现场操作参数对模拟结果进行差值校正,使模拟结果更接近于现场实际结果,进而建立裂解炉效益模型。模型的输入变量由裂解原料属性值、裂解炉出口温度(COT)、进料量、汽烃比(SHR)、原料价格、产品价格和操作成本等构成,模型的输出为裂解每吨裂解原料所得到的效益。裂解炉裂解效益的目标函数为:
式中,yield=[乙烯,丙烯,副产品,燃料气消耗量,稀释蒸汽,进料量],v为价格因子,对应各自价格。输入变量的范围:裂解炉出口温度(COT),818<COT<845;汽烃比(SHR),0.495<SHR<0.6565。
目标是在裂解炉条件发生变化时,优化出口温度(COT)和汽烃比(SHR),以获得最大效益。用改进教学优化算法优化这个效益模型。实验参数设置为:种群数ps=10,教学因子最大值TFmax=2,最小值TFmin=1,信任权重w1=0.1,w2=0.5,迭代代数itermax=100。在现场采集到的数据中选举 3个点,每个点对应的原料类型如表3所示。其中参考价格为:乙烯,8500元/吨;丙烯,9000元/吨;副产品,4000元/吨;燃料气,-2.5元/立方米;稀释蒸汽,-80元/吨;原料,-5500元/吨(“-”表示该项使效益降低)。
改进教学优化算法优化的效益与实际效益比较结果见表4,从比较结果可以看出,经过算法优化,裂解效益显著提高。这样就可以在改变进料属性之前先对模型进行优化,避免在进料改变时仅凭经验对操作条件进行盲目的改变,从算法寻优中获得最佳的COT和SHR,以获得较高的裂解效益。
表3 3种裂解原料数据
表4 优化结果比较
本文提出了一种改进的教学优化算法,该算法对教学因子进行自适应调整使算法前期进行全局搜索,后期进行局部精细搜索来提高算法的收敛速度和精度。同时引入信任权重,对学生已获取知识采取部分信任策略,加强学生之间以及学生和老师之间的信息共享,避免算法陷入局部最优。8个函数优化的仿真结果表明,改进算法收敛速度显著提高并且能够跳出局部最优。最后在裂解炉裂解原料效益优化的应用中,本文提出的改进算法能够在裂解原料属性发生改变时,快速优化操作变量,显著提高裂解效益。
[1] Rao R V,Savsani V J,Vakharia D P.Teaching-learning-based optimization:A novel method for constrained mechanical design optim ization problems[J].Computer.Aided Design,2011,43(3):303-315.
[2] Matej Crepinsek,Shih His Liu,Luka Mernik.A note on teaching-learning-based optim ization algorithm[J].Information Sciences,2012:79-93.
[3] Rao R V,Savsani V J,Vakharia D P.Teaching-learning-based optimization:An optim ization method for continuous non-linear large scale problems[J].Information Sciences,2012,183(1):1-15.
[4] Rao R V,Savsani V J,Balic J.Teaching-learning-based optim ization algorithm for unconstrained and constrained real-parameter optimization problems[J].Engineering Optimization,2012,44(12):1447-1462.
[5] Rao R V,Pater V.Multi-objective optimization of heat exchangers using a modified teaching-learning-based optim ization algorithm[J].Applied Mathematical Modeling,2013,37(3):1147-1162.
[6] Zou F,Wang L,Hei X H,et al.Multi-objective optim ization using teaching-learning-based optim ization algorithm[J].Engineering Applications of Artificial Intelligence,2013,26(4):1291-1300.
[7] Rao R V,Kalyankar V D.Parameter optim ization of modern machining processes using teaching-learning-based optim ization algorithm[J].Engineering Applications of Artificial Intelligence,2013,26:524-531.
[8] Rao R V,Patel V.An elitist teaching-learning-based optim ization algorithm for solving complex constrained optim ization problems[J].International Journal of Industrial Engineering Computations,2012,3(4):535-560.
[9] Anguluri Rajasekhar,Rapol Rani.Elitist teaching learning opposition based algorithm for global optim ization[C]//IEEE International Conference on Systems,Man,and Cybernetics,2012:1124-1129.
[10] Taher Niknam,Rasoul Azizipanah-Abarghooee,Mohammad Rasoul Narimani.A new multi objective optim ization approach based on TLBO for location of automatic voltage regulators in distribution systems[J].Engineering Applications of Artificial Intelligence,2012,25:1577-1588.
[11] Rao R V,Pater V.Multi-objective optization of two stage thermoelectric coolers using a modified teaching-learning-based optim ization algorithm[J].Engineering Applications of Artificial Intelligence,2013,26:430-445.
[12] Liu S T,Wang H G,Qian F,et al.Coupled simulation of combustion w ith heat transfer and cracking reaction in SL-II industrial ethylene pyrolyzer[J].Journal of Chemical Industry and Engineering(China),2011,62(5):1309-1317.
[13] Li P,Li Q A,Lei R X,et al.Development and application of advanced process control system for ethylene cracking heaters[J].Journal of Chemical Industry and Engineering (China),2011,62(8):2217-2220.
[14] Van Geem K M,Hudebine D,Reyniers M F,et al.Molecular reconstruction of naphtha steam cracking feedstocks based on commercial indices[J].Computers & Chemical Engineering,2007,31(9):1020-1034.
[15] Pyl S P,Van Geem K M,Reyniers M F,et al.Molecular reconstruction of complex hydrocarbon m ixtures:An application of principal component analysis[J].AIChE Journal,2010,56(12):3174-3188.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!