时间:2024-06-19
余 辉,屈喜龙,谢京力
(1.湖南工程学院 电气信息学院,湘潭 411004;2.湖南财政经济学院 信息技术与管理学院,长沙 410205)
基于支持向量机的电力云故障诊断方法研究*
余 辉1,屈喜龙1,谢京力2
(1.湖南工程学院 电气信息学院,湘潭 411004;2.湖南财政经济学院 信息技术与管理学院,长沙 410205)
电力云计算将虚拟化与分布式技术代替传统的服务器+SAN/NAS信息计算模式,虚拟池对数据的整合与管理在提高资源利用率和降低建设成本的同时,由于电力云稳定和可靠工作的前提很大程度上依赖于良好的网络状态,由此也带来故障诊断更加复杂的新挑战.为了实现电力云网络故障的诊断,针对网络故障本身具有的小样本和非线性特征,采用支持向量机SVM算法,在二分类无法解决多分类的基础上进行改进,选择了一对一SVM,借助实验数据和MATLAB仿真结果验证了其可行性.
虚拟池;电力云;支持向量机;故障诊断
云计算作为一种信息化时代的新兴技术产物,备受信息通信研究者的关注,它是从互联网领域演变发展而来的,云计算实质是借用网络渠道将计算力进行集中,并且通过网络提供企业用户所需的服务[2],并借助虚拟化技术的伸缩性和灵活性[3],达到提高资源利用率的目的,还可实现节省人力物力财力和降低建设成本.
本文根据电力云研究的综合分析和虚拟化网络及业务服务的特点,在分析现有网络故障诊断方法的基础上,提出支持向量机故障诊断算法,且在此基础上改进为一对一SVM方法,并借助实验数据和仿真结果说明其有效性.
电力云是结合电力企业应用实践提出的云计算与电力系统相结合的产物,它隶属于交叉学科的研究课题,相比于电力系统领域的其他研究,电力云的研究起步较晚.自2010年四川大学的杨旭昕等学者发表了电力系统云计算初探以来,有关电力云的探讨开始逐渐进入电力行业相关机构和研究者的视野,并受到广泛关注,尤其是中国电力科学研究院、华北电力大学和王利赛、杨明玉、王德文以及庞松涛等.面向发展,国网信息化规划以建设国网云为目标.
电力云作为云计算技术在电力系统和电力行业中一项具体实践应用,它将虚拟化与分布式技术代替传统的服务器+SAN/NAS信息计算模式,通过硬件资源、平台组件、应用软件的集中服务,完成电力营销用户个人信息管理等系统运行和电力数据仿真、用户信息及智能仪表数据处理等应用的开发,为电力企业及电力客户、合作伙伴提供集中统一、按需服务、弹性扩展和安全可控的云计算服务模式[5],在提升资源应用效率的同时,也可提高信息处理能力并增强集约化管理水平,降低电力系统建设运营成本.
资源池是电力系统云计算得以实现的重要组成部分[6],其概念经过几年的推演与发展,已成为云计算基础设施即服务IaaS层面得以实现的基础架构新型应用方式.资源池是将电力云计算数据中心的虚拟化硬件资源和软件资源等进行整合与管理,当有业务应用需要相应资源时,只需向资源池提出申请即可获得,使用完成后资源被释放回池中[7-9].资源池完全围绕业务系统开展信息流调度与管理,实现了信息化从以前的服务于内部管理向服务于用户的转变.虚拟池整合资源及业务服务示意图如图1所示.
图1 虚拟池整合资源及业务服务示意图
目前研究表明,电力云的管理和计算的实现方式主要通过开源云资源管理平台Openstack和Hadoop软件.Openstack系统在基础设施即服务Iaas层完成云操作系统,将物理机虚拟化到资源池以提高安全可控、利润以及效率并降低成本.Hadoop软件则工作于平台即服务Paas层,对云数据中心具有数据分析和整理功能,可运行在Openstack系统之上实现分布式计算和存储,满足电力数据中心的需要.
电力云作为综合云计算平台,其兼备计算和存储处理能力,按照所提供的服务类型进行层次划分,各层次均对应着不同的子服务集合,根据用户请求即服务类型的不同,各层次既相互关联又相互独立.网络则是云计算基础架构和服务提供的重要组成部分[10].对于云环境下的故障诊断来说,分为服务故障诊断、数据中心的故障诊断和网络环境的故障诊断[11].文中主要研究网络环境的故障诊断问题.
2.1 网络故障诊断方法
国内外已经广泛使用的网络故障诊断方法主要包括减法聚类-ANFIS、人工智能、RS-CSA、模糊关联规则挖掘和BP神经网络等.云环境下的异常检测的方法主要有基于分类方法、基于最近邻居、基于聚类和基于统计方法,虽有各自的优势,但也有其缺点.例如,基于神经网络分类诊断需要大量的参数,输出结果难以解释,学习时间过长或根本达不到学习目的;基于贝叶斯网络分类诊断需要知道先验概率;基于规则的异常诊断要依靠人的经验,无法自动地从数据中发现规律.
文中借助支持向量机方法,它是传统学习理论的具体表现,与以神经网络为代表的传统机器学习方法相比,其主要优点体现在可以解决小样本情况下的机器学习问题,能够提高泛化性能,并能解决高维、非线性和局部极值问题以及结构选择的难题.
2.2 支持向量机
当前,支持向量机算法在电力领域的应用范围还比较广泛,主要涉及到变压器故障诊断、网络控制系统故障诊断、液压系统故障诊断、风机齿轮故障诊断和轴承传动系统故障诊断.
支持向量机算法主要是在事先获取的训练样本集合中,通过求解二次规划QP问题寻找最优分类超平面ω·x+b=0,从而实现线性可分问题的分类,最后将测试样本在训练好的支持向量机上进行分类,达到分类识别的目的.对线性不可分(有噪声)问题通过引入核空间、核函数以及映射等理论,达到将分类问题转化求解的目的.经一系列推导可得,线性可分和线性不可分问题的的最优分类函数如公式(1)、(2)所示.
f(x)=sgn{(ω*·x)+b*}
(1)
f(x)=sgn{(ω*·x)+b*}
(2)
其中,sgn()为符号函数,αi>0为与各个样本对应的Lagrange乘子,yi∈1,-1样本标签集合,Kxi,x为核函数.判别函数(2)中根据选择合适的核函数及参数就能构造出符合具体问题的支持向量机.
然而,上述求解机理仅是对二分类问题的解决,针对文中需要解决的网络故障多分类问题,需要对支持向量机SVM进行改进.
电力系统云计算主要依靠虚拟化资源和网络进行业务服务,云计算故障产生可能是网络基础设施的问题、存储发生问题、出站流量中断、DNS错误和系统日常刷新等原因造成的.因此,对电力云网络故障诊断的多分类问题就需要对SVM进行改进,在一对多、一对一和有向非循环图向量机(DAGSVM)以及修改目标函数等方法中,由于一对多SVM分类训练速度和分类速度较低,DAGSVM对大规模的多类分类问题简单易行且具有理想的训练速度与精度,而修改目标函数代价过高,故文中采用一对一SVM方法.
一对一SVM方法求解思路是将k种待分类问题模式识别的每两类进行组合,在MATLAB软件的帮助下,利用libsvm工具将已知训练样本构造出k(k-1)/2个二分类器模型,利用该分类模型对未知输入数据进行类别判定,从而达到对网络故障诊断问题的多分类识别.电力云网络仿真环境大致如图2所示,路由器连接各自局域网络内的计算机,交换机将两个局域网络互联以便网络管理工作站对网络运行状态进行收集与管理.
图2 电力云网络仿真环境
由于实验环境和条件的限制,为满足网络数据的真实可靠性,文中选用的网络数据样本全部取自于加州大学信息与计算科学UCI KDD归档的用于与第三国际知识发现和数据挖掘工具大赛和KDD-99第五届知识发现和数据挖掘国际会议的10%数据子集.
对网络攻击样本数据进行初步整理分析,将入侵攻击类型进行简单归类,将back、land、neptune、pod、smurf、teardrop标记为dos类型,ipsweep、nmap、portsweep、satan标记为probe类型,ftp_write、guess_passwd、imap、multihop、phf、spy、warezclient、warezmaster标记为r2l类型,buffer_overflow、loadmodule、perl、rootkit标记为u2r类型,得到样本数据汇总表如表1所示.
表1 样本数据汇总表
鉴于样本数量较多,且数据结构比较复杂,若选择n个样本作为训练样本,则训练样本数据为n×41的数据矩阵加上n×1的类别标签列向量,其中由于样本数据矩阵有三列为字符型非数字样本,在支持向量机训练过程难以识别,因此简化训练样本数据为n×38的矩阵,测试样本数据结构类似.为进一步验证一对一SVM方法的有效性,文中选用dos、probe、r2l、u2r四种故障类型与正常normal状态的样本集各10个样本为训练集,测试样本集也在每种故障类型和正常数据中各选2个样本,即训练样本xlyb为50×38的数据集加上50×1的标签列向量xlbq1,测试样本csyb为10×38的数据集加上10×1的标签列向量csbq1,工作空间数据变量大致如图3所示,具体数据限于篇幅在此不详细列出.
图3 工作空间数据变量
将所选样本加载到MATLAB中,用svmtrain函数训练训练样本xlyb得出一对一SVM模型svmStruct,然后运用所得模型,调用分类函数svmclassify和预测评估函数svmpredict对测试样本数据进行测试,部分测试结果如图4所示,比对所得测试样本分类结果是否与已知测试样本类别标签一致,仿真实验表明测试样本与仿真结果一致,即一对一SVM方法对于网络故障诊断具有一定的有效性.
图4 部分测试结果
本文对电力云计算及相关技术进行了简单分析,明确电力云网络故障诊断的重要性和网络故障特征后,提出了采用支持向量机SVM算法并在此基础之上改进,选择了一对一SVM,借助实验数据和MATLAB仿真结果验证了其可行性.然而,电力云环境工作网络更加复杂,在电力云中网络故障诊断的实践必须得到大型复杂网络中的故障日志,收集管理信息库数据进而做更加深入的实验和研究.
[1] 张晓亮. 基于虚拟化与分布式技术的电力云计算数据中心[A]. 中国电机工程学会电力信息化专业委员会、国家电网公司信息通信分公司.2016电力行业信息化年会论文集[C].中国电机工程学会电力信息化专业委员会、国家电网公司信息通信分公司,2016:4.
[2] 王海涛,刘 波. 云计算和关键技术问题的分析研究[J]. 电力系统通信,2011(10):6-11.
[3] 严金瑶. 基于虚拟化技术的云计算框架设计研究[D].南京邮电大学硕士学位论文,2013.
[4] 王 栋,陈传鹏,颜 佳,等. 新一代电力信息网络安全架构的思考[J]. 电力系统自动化,2016(2):6-11.
[5] 庞思睿,许鸿飞,于 然,等. 云计算技术及其在电网中的应用[J]. 电子技术应用,2015,41(S1):221-223.
[6] 赵潇潇,白晓民. 云计算资源池在电力信息化中的应用[J]. 华北电力技术,2014(8):62-65+70.
[7] 王健伟. 一种全新的IT建设架构——统一资源池[J]. 数据通信,2011(5):10-12.
[8] 百云川, 钱敏谨. 利用虚拟化技术构建资源池是实现云计算的第一步[J]. 中国制造业信息化,2010(12):34.
[9] 张 科,董 亮,邹澄澄. 利用云计算技术建立电力信息系统硬件资源池[J]. 湖北电力,2014,38(6):1-3.
[10] 李璐颖,张云勇,房秉毅. 云计算在网络中的应用[J]. 电信技术,2011(10):35-38.
[11] 顾海林,李 威. 云计算环境下业务服务模型及故障检测方法[J]. 电信技术,2015(10):66-69.
ResearchonFaultDiagnosisMethodofPowerCloudBasedonSupportVectorMachine
YU Hui1, QU Xi-long2, XIE Jing-li2
(College of Electrical and Information Engineering, Hunan Institute of Engineering, Xiangtan 411004, China)
Power cloud computing replaces traditional server+SAN/NAS information computing model with virtualization and distribution technology, and virtual pool with the ability of data integration and management improves resource utilization and reduces construction costs at the same time. Because the premise of the stability and reliability work of the power cloud depends heavily on the good network state, it also brings more complex new challenges of fault diagnosis. In order to realize the fault diagnosis of the power cloud network, a support vector machine (SVM) algorithm is proposed for the small sample and non-linear feature of the network fault itself. Based on the two categories which not can solve the multi-classfication, the one-to-one SVM is selected for the improvement, and experimental data and MATLAB simulation results verify its feasibility.
virtual pool; power cloud; support vector machine; fault diagnosis
2017-05-20
湖南省自科基金项目(2016JJ2040);湖南省研究生科技创新项目(CX2016B681);湖南省教育厅科研项目(17K015).
余 辉(1992-),女,硕士研究生,研究方向:新能源技术及应用.
屈喜龙(1978-),男,博士,教授,研究方向:支持向量机理论与应用.
TP393.0
A
1671-119X(2017)04-0039-04
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!