时间:2024-05-04
戴幸泽 窦慧洋
(内蒙古工业大学信息工程学院 内蒙古自治区呼和浩特市 010051)
风电机组运行环境通常较为恶劣,由风机部件频繁发生故障造成的停机发电损失,以及产生的维护费用都会对风电场的效益产生严重影响[1]。齿轮箱是风机的核心传动部件,其故障发生率一直居高不下,必要时需要下塔进行周期较长的维修,从而造成经济损失。为此,及时准确的发现隐患,有计划性的定期维护,可以有效预防齿轮箱出现严重故障[2]。
针对齿轮箱故障诊断,可以通过对采集的高频振动数据进行分析,文献[3]和文献[4]分别提出了一种基于粒子群优化和纵横交叉法优化的BP 神经网络算法,提取振动信号特征,建立误差模型,进行故障诊断。但由于高频振动数据需要在机舱内安装大量传感器,也会出现故障且成本较高,而有效利用风机SCADA 系统采集的多通道数据同样可以对齿轮箱故障进行诊断预警[5,6]。文献[7]利用随机森林算法对SCADA 数据的特征进行提取。文献[8]对SCADA 数据建立的神经网络模型,依据马氏距离对主轴承进行故障预警。
本文提出了一种基于遗传算法优化的BP 神经网络模型,可以解决网络易陷入局部极小值问题,从而有效的进行全局搜索。以齿轮箱轴承温度为预测目标,利用L1 正则化对SCADA 数据进行特征选取作为网络输入,建立齿轮箱故障预警模型。测试表明了该方法的有效性,对齿轮箱故障的更深层次分析提供了一种新的研究方法。
采用误差反向传播(BackPropagation,BP)算法的多层前馈神经网络,由输入层,隐含层和输出层组成[9],图1 为有n 个输入节点,m 个隐层节点,l 个输出节点的单隐层神经网络结构。
图1:单隐层神经网络结构图
式中,η 代表学习率,在0-1 范围取值,wjk为隐含层第j 个节点到输出层第k 个节点的权值,vij代表输入层第i 个节点到隐含层第j个节点的权值。通过链式求导法则,可以推算出各权值的改变量,进而优化整个网络。
由于BP 算法采用梯度下降法搜索最优解,从而很容易使得误差函数陷入局部极小,网络的初始权值对最终结果影响较大[10]。
遗传算法(Genetic Algorithms,GA)是模拟自然界优胜劣汰的进化过程建立的数学模型,依据遗传概率在解空间中搜索全局最优解,可以用来解决多参数的最优化问题[11]。所以,利用遗传算法优化BP 神经网络的初始权值,对网络进行训练可以进一步逼近全局最小。
GA-BP 算法首先需要确立BP 神经网络的拓扑结构,从而确定网络权值和阈值的个数,并对其进行编码生成初始种群,种群中的任一个体均携带了整个网络的权值和阈值信息;其次需要计算种群个体适应度,适应度函数F(x)=-E(x),E(x)为网络训练误差,根据设定的选择、交叉、变异算子,循环迭代搜索种群最优个体;最后利用最优个体解码得到的权值和阈值对网络进行训练,预测样本输出。GA-BP 算法流程如图2所示。
由于完整的SCADA 数据特征较多,里面存在着大量的多重共线性特征,且许多属性与齿轮箱故障分析并不相关,所以在确定网络输入参数时,需要对SCADA 数据特征进行选取。
利用L1 正则化可以对数据进行降维选取主要特征,进而有效避免变量特征较多时造成的过拟合现象,提高模型的泛化能力[12]。
图2:GA-BP 算法流程图
图3:遗传算法进化曲线
L1 正则化代价函数如式(2)所示:
式中hθ(x)为预测值,y 为真实值,m 为样本个数,λ 为正则化系数,n 为特征数量。通过增添约束项使得部分特征权重置0 获得稀疏解,进而降低维度。
针对齿轮箱轴承温度对SCADA 数据进行特征选取,表1 为按相关度排序前10 的主要特征:
特征选取后,为了消除量纲之间的差别,需要对数据进行标准化处理,如式(3)所示:
式中,x 为某一特征的样本数据,μ 为均值,σ 为标准差。
风电机组齿轮箱故障预警算法主要分为三步:
表1:齿轮箱轴承温度特征选择
图4:残差概率分布
图5:残差预警限值
第一步,根据特征选择结果,利用风机无故障历史运行数据训练网络模型;第二步,利用测试数据得到风机正常运行下的齿轮箱轴承温度预测值,计算与实际值的残差E 及其均值μ 和标准差σ,设定预警限值第三步,对实时SCADA 数据进行预测,设定容错个数k=6,当连续k 个运行数据预测得到的残差超过预警限值时,对齿轮箱进行故障预警。
本文选取某风场1.5MW 机组进行了测试,其齿轮箱结构为一级平行轴加二级行星轮的传动形式。训练数据集为SCADA 系统2016年12月-2017年1月的10min 运行数据,为无故障运行数据,以2017年2月的10min 运行数据作为测试数据,进行验证。
本文采用单隐层网络,输入层节点个数为10,隐层节点个数为21,输出层节点个数为1,网络隐层激活函数使用Sigmoid 函数,输出层激活函数使用ReLu 函数,f(x)=max(0,x),训练次数设为2000,学习率为0.11。
设定种群数目为10,最大遗传代数为500。使用二进制编码方式对网络权值和阈值进行编码,选择操作使用轮盘赌算子,交叉操作使用两点交叉,交叉概率pc为0.7,变异操作使用二进制染色体的变异算子,变异概率pm为0.01。
对GA-BP 网络进行训练,图3 为遗传算法进化曲线,可以看出当进化约300 次后,种群最优个体适应度函数值趋于稳定。
由于适应度函数为网络训练误差的相反数,即最优个体适应度值和训练误差成反比,对进化后的最优个体进行解码后,开始训练BP 神经网络,用无故障运行的数据计算预测值与真实值的残差,其概率分布如图4所示,计算预警限值如图5所示。
用该模型对2017年2月SCADA 数据进行测试,得到残差如图6所示。
可以看出自2月13日起已经出现连续预警,2月15日出现明显异常,由此推断齿轮箱可能发生故障。对有明显超过报警限值的2月15日齿轮箱温度数据进行分析,发现油温明显偏高,其风速-功率-油温曲线如图7所示。
根据曲线可看出在6:55 以前齿轮箱油温与风速及功率呈正相关,即将达到75℃时,机组出现了一次停机,油温迅速下降至69℃。在此期间,齿轮箱油温和功率随风速变化而变化。11:35 以后风速增加,功率达到满发,油温迅速上升至75.6℃,导致机组限功率运行在1000kW。20:15 油温降至74.6℃,机组限功率解除达到满发,油温再次迅速上升至75.7℃,机组继续限功率运行,严重影响机组发电效率,而且油温高直接导致齿轮油粘度降低,油膜变薄,致使齿轮箱内部齿轮、轴承等部件磨损加重,寿命降低,同时油温高加速齿轮油的氧化速度,导致齿轮箱油使用寿命降低,形成恶性循环。经检查,导致油温过高的原因为齿轮箱配套冷却器风侧流道污染,堵塞严重。过高的油温导致轴承温度持续增加,从而产生SCADA 报警。
根据测试数据残差可以发现,在SCADA 自身报警前已经多次出现预测异常点,且在15日当天残差值达到最大。由此表明,该方法可以有效判断风机齿轮箱是否发生故障,且能够提前预警,结合SCADA 自身报警可以有效的对齿轮箱故障进行诊断,及时维护。
由于风机配备的SCADA 系统报警经常存在误报、延报现象。本文采用遗传算法优化的BP 神经网络对风机齿轮箱轴承温度进行预测,设定预警限值,结合实例验证表明该方法可以有效判断机组齿轮箱是否发生故障且提前预警,对风电场检修人员进行维护工作具有一定的指导意义。
图6:测试数据残差
图7:风速-功率-油温曲线
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!