时间:2024-09-03
安徽华电宿州发电有限公司 于 凯
基于随机森林的局部放电识别分析
安徽华电宿州发电有限公司 于 凯
为了提高局部放电的识别率,针对单一分类器不能全面学习样本特性的问题,提出采用随机森林集成分类器对局部放电类型进行识别分析,识别结果表明:基于EEMD-SVD特征,采用随机森林分类器取得了较好的识别效果,这对局部放电模式识别与分析具有一定的指导意义。
局部放电;EEMD-SVD;单一分类器;随机森林
目前对于局部放电类型分类应用比较成熟的是单一分类器[1],该分类器都要经过训练样本进行训练,然后利用测试样本对训练好的结构进行识别分析,然而单一分类器不能全面分析样本的特性,即使训练样本足够大,识别算法也很难会达到局部最优,从而导致识别率较低,因此,本文采用Leo Breiman提出的随机森林集成分类器对局部放电类型进行识别分析。随机森林分类器是首先利用训练样本构建一系列基分类器,然后对每个基分类器的预测分类结果进行投票,最后根据投票结果进行分类,这样就保证了对样本的特性能够全面分析,不易陷入局部最优,从而能更好的对局部放电类型进行识别分析。
局部放电是一种典型的非线性、非平稳信号,其信号中包含着丰富的放电信息。基于PRPD模式构造的统计、分形和放电图像灰度等特征,这些特征不是由局部放电信号直接提取,因而会丢失部分放电信息,不利于分类器对其准确分类。针对这个问题,本文对局部放电信号直接提取EEMD-SVD特征,这样可以保证所提取的特征信息是最原始,最直接的。
随机森林是Leo Breiman在2001年提出的一种集成学习算法,它利用bootstrap重抽样法从原始样本中抽取多个样本,并对bootstrap样本进行决策树建模,然后将这些决策树组合在一起,通过投票得出最终分类或预测的结果。
假设原始训练集中有M个样本,样本属性特征变量的维数为K,随机特征变量的维数为F,要形成包含N棵基分类器决策树的随机森林,其主要内容就是形成决策树的过程,具体构建过程如下所示:
(1)利用Bagging抽样技术从原始训练集中抽样产生N个不同的训练子集,每个子集中包含的样本个数仍为M。
(2)根据Forestes-RI方法为每个基分类器随机选取F个特征变量,其中F满足,K为全部特征变量的个数。
(3)依据CART算法Gini指标最小原则对每棵决策树的节点进行分裂,最终形成一棵棵相互独立的决策树,在节点分裂过程中,决策树不作剪枝处理。
(4)将上述构建出一系列相互独立的的决策树看作一个整体,从而形成了随机森林。本文中的每种放电类型样本各100个,总共有300个原始样本。对于EEMD-SVD特征,其样本属性特征变量的维数为13。设置基分类器的数目为1000,并且重复执行随机森林算法的次数也置为1000。
泛化误差是反应泛化能力的一个指标,泛化误差越小,则该学习性能越好,反之则性能越差。在随机森林算法中,Breiman通过实验证明,袋外( Out Of Bag OOB)估计是随机森林泛化误差的一个无偏估计,OOB分类误差越小,说明随机森林分类能力越强,识别准确率越高。
图1反映了基于EEMD-SVD特征,其OOB分类误差随决策树个数增加而变化的情况。
图1 基于EEMD-SVD特征的OOB分类误差估计
由图1可以看出,基于EEMD-SVD特征,其OOB分类误差随着基分类器数目的增加而显著减小,并当基分类器数目在20左右时,OOB分类误差趋于稳定,表明基于EEMD-SVD特征与随机森林集成分类器的局部放电模式识别算法学习性能较优,分类能力较强,识别准确率高。
表1给出了基于随机森林分类器的EEMD-SVD时域特征局部放电识别准确率,其每种放电类型的识别率是相同参数下1000次执行随机森林算法取均值而得。
表1 基于时域特征的局部放电分类准确率
由表1可以看出,基于EEMD-SVD特征与随机森林集成识别算法,其对应每种放电类型的识别率均达到了95%以上,总体平均识别率为97.32%,取得良好的识别效果。
本文针对变压器局部放电性质,设计制作了三种典型的放电缺陷模型,提取了局部放电信号,并构造了EEMD-SVD特征,同时利用随机森林集成分类器进行识别分析,得到的主要结论:采用随机森林集成分类器对局部放电进行识别分析,由于该分类器能对样本进行全面分析,因而每种放电类型的识别率均很高,尤其是基于EEMD-SVD特征,其OOB分类误差较小,局部放电的平均识别率很高,达到了97.32%。
综上所述,基于EEMD-SVD特征与随机森林集成分类器的局部放电模式识别算法,由于特征量包含的放电信息丰富,分类器能够全面分析样本特性,从而使得其局部放电识别准确率较高,这对局部放电的分类识别分析具有一定的指导意义。
[1]凌卫家,张浩,管敏渊.互感器振动对GIS超声波局部放电检测的影响[J].电工电能新技术,2016,35(5):74-79.
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!