当前位置:首页 期刊杂志

基于数值特征提取的新能源发电基础数据核查方法

时间:2024-05-22

杨立波,马 斌,王亚军,孙广辉,李一鹏

(国网河北省电力有限公司,石家庄 050021)

近年来,传统化石能源消耗量不断增加,能源匮乏和环境污染成为当今时代热点问题,世界各国均在努力寻找更低碳、环保的发展道路,不断探索可再生能源发电技术,而新能源发电系统又具有运行期间无环境污染、安装方便、维护成本低,以及资源可再生[1]等理想特性。因此风力、光伏等新能源发电的应用备受关注,全球的新能源发电装机容量也在不断增加,相关系统和采集数据日趋丰富。

在新能源场站的系统中,作为发电机组的光伏阵列或风电机组均安装在恶劣的室外环境,这种户外环境会使光伏阵列或风电机组发生故障且不易被察觉,导致发电效率达不到理想效果。因此,需要工作人员及时发现并维修,但人工巡检不仅费力、影响发电效率,还存在危险性。通过对新能源发电所产生的基础数据进行数据特征分类和核查[2],进而获取新能源的故障辨识,是一种有效的解决方法。然而在实际中新能源发电系统的特征数据复杂且不易获取,需建立适当模型,通过数据稽查校验实现。为解决上述问题,文献[3]提出一种新能源发电的故障检测系统,该系统是基于测量光伏发电数据与其对应的预测量之间的差值,如果差值大于给定的阈值,则认为发生了故障,否则认为未发生故障。文献[4]提出一种基于限定记忆递推最小二乘算法的计量装置误差诊断方法,进行数据驱动误差分析。文献[5]基于概率神经网络,利用故障样本和正常样本的历史数据来建立故障诊断模型。上述技术大多依赖于人工特征提取,需要诊断专家和强大的信号处理知识,这种特征提取方法要求信号处理的熟练程度高,此外,整个数据校验过程耗时多,效率低下且核查准确性需要验证。

1 新能源发电数据核查服务平台设计

针对上述技术存在的问题,本文提出一种适用于新能源发电数据核查的方法,并将该方法应用于数据核查服务平台,数据核查服务平台系统架构如图1所示。由图1可知,新能源发电基础数据主要是通过电网调度系统及场站管控系统获取,该系统为更加合理地存储不同结构的新能源发电基础数据,提供了充足的模型特征提取样本。平台通过大数据统计分析技术进行数据分析,上层管理中心收到分析结果后,用户管理人员根据数据核查的相关算法,并通过可视化分析技术挖掘新能源发电基础数据隐藏的信息,并展示多维度数据,以实现对新能源发电系统的故障检测[6]。

图1 数据核查服务平台架构Fig.1 Architecture of data verification service platform

2 关键技术

数据核查服务方法主要包括5个步骤,分别为获取数据、数据特征提取、数据分析、数据核查和可视化实现。其中,在获取数据时应保证数据的质量,并对数据进行审查和评价,然后整理出与分析任务相关的数据,将数据统一或变换成适合分析的形式,以减小数据规模。数据特征提取后的数据由4种分析技术构成,分别为关联性分析、聚类分析、分类方法及特征量分析,将分析结果用于数据核查,以完成数据核查相关的内容。

针对新能源发电基础数据进行特征提取与数据核查,分别阐述该过程中所采用的关键技术。

2.1 数据特征提取模型

由于新能源发电基础数据类型结构多种多样,本文基于深度学习构建出一种数据特征提取模型,如图2所示。该模型通过构建特征模板,建立模糊粗糙集,以及应用条件随机场CRF(conditional ran⁃dom field)算法,最终提取到新能源发电基础数据的特征向量。

图2 数据特征提取模型Fig.2 Data feature extraction model

1)构建特征模板

由图2可知,提取新能源发电基础数据特征向量需要构建特征模板,即通过提取数据特征并建立特定的模板,使用该模板可以优化之后识别数据的特征提取。“模板窗口”是特征模板建立的决定性因素,当窗口长度过大时会出现过拟合情况;当窗口过小则会使能够提取的特征不足,造成新能源发电基础数据的识别效率较低,因此构建恰当的窗口十分必要[7]。

设置新能源发电基础数据特征为w(i,j),其中,w为新能源发电基础数据信息字符,i、j分别为相对w的位置和特征序[8]。设y为基础数据的安全检测数据段,可定义发电信息中第k个特征函数fk(y,w)为

式中:t为所需要进行检测的字段位置;Tfield为字段数;yt、yt-1分别为新能源发电基础数据在阶段t和前一阶段的检测数据段;x为新能源发电基础数据自变量;特征函数fk(y,w)为各个字段的特征函数总和。

将新能源发电所有的基础数据特征函数fk(y,w)转换为对应的特征向量,可得到全部特征向量的总序列F(y,w),即

式中,F(y,w)为全部特征向量的总序列。

2)建立模糊粗糙集

由于新能源发电基础数据种类太多,在特征选择过程中会产生不完全特征信息,因此,本文使用模糊粗糙集依赖的属性约简算法进行决策。

假设Z=(U,A⋃Q)是一个新能源发电基础数据处理程序,U为一个非空的有限对象集,A为条件属性的非空有限集,Q为一个非空的有限决策属性集,属性集P⊆A对应于一个不可区分的等价关系。

同粗糙集依赖相似,由式(6)可以得出只采用P中的数据时,可分辨对象在对应数据集中的比例。Q依赖于P的程度确定了在比例Kr中的值,即P决定新能源发电基础数据特征选择效果。当Kr值越大时,则表示基于模糊粗糙集新能源发电基础数据特征选择效果越好。

为了便于理解,采用新能源发电基础数据原始决策作为实例来解释模糊依赖的计算,假设新能源发电基础数据原始决策如表1所示。

表1 具有连续属性值的决策Tab.1 Decision table with continuous attribute values

表1中,a1、a2和a3为新能源发电基础数据条件属性;Q为新能源发电基础数据决策属性。在进行模糊依赖的计算时,首先计算a1、a2、a3的模糊近似值,然后进一步计算各属性的依赖程度Kr。对应每个新能源发电基础数据模糊属性的模糊等价类,等价类的隶属函数一般包括梯形函数、三角函数和正态分布函数[10]。由于新能源发电基础数据属性值是连续的,在模糊相似关系下,需要划分连续属性区间,对表1决策进行处理后,得到区间划分结果为

结果表明,由式(7)确定的每个二维笛卡尔子区间中,目标的决策值相等。因此,将每个条件属性分为2个模糊等价类,由三角函数和梯形函数确定条件属性的每个模糊等价类对应隶属函数如图3所示。

图3 条件属性对应模糊集的隶属函数Fig.3 Membership function of fuzzy set with the corresponding conditional attribute

综上所述,基于模糊粗糙集依赖的属性约简算法包括3个步骤:①确定候选属性集;②确定候选属性集中是否存在冗余属性,③确定每个新能源发电基础数据模糊属性的模糊等价类,根据依赖程度K确定新能源发电基础数据的特征选择[11]。

3)应用CRF算法提取特征向量

2.2 数据核查的相关算法

传统的递归神经网络模型存在梯度消失情况,限制了递归神经网络模型学习长期时间依赖关系的能力,本文提出长短期记忆LSTM(long-and short-term memory)神经网络体系结构,以解决递归神经网络模型所面临的梯度消失问题。图4为某单个LSTM块结构。于正则化,避免了方差问题。

图4 LSTM块体系结构Fig.4 Architecture of LSTM block

Softmax回归分类器对新能源发电基础数据测试样本的分类规则可表示为

综上所述,Softmax回归分类器通过式(16)的分类规则能够提高数据核查效率。

3 算例分析

为验证所获取发电数据是否存在数据造假或错误信息,选取河北省某光伏场站发电功率、电压、电流等基础数据和测量值作为研究对象进行正确性核查,得到检验结果如表2所示。

表2 新能源主要基础数据正确性核查结果Tab.2 Correctness verification result of main basic data of new energy

由表2可知,对不同节点有功、无功功率、电压和电流进行分类,其中有功功率基于模糊聚类的样本数量高达33种,表明数据复杂度高。由各分类数据的过检与漏检差异数可以看出,有功功率的要求最为严格,过检数为3,而漏检只存在于无功功率数据中。在相关性检测中,有功功率的p值为0.067,大于规程设定值0.05,则不能执行否决零假设,认为基础数据与检测数据之间不存在明显差异;电压基础数据的p值为0.018,小于设定值0.05,则执行否决零假设,认为这两组数据存在明显差异。

在执行效果方面,分别采用文献[5]中的PNN模型与本文方法进行对比实验,根据两种方法统计在0~2 GB不同发电基础数据量环境下,数据核查所需要的计算时间对比如图5所示。由图5可知,本文研究所开发的数据核查服务平台对新能源发电基础数据进行数据核查耗时更短,处理效率更高,表现出适用性与可靠性,在核查2 GB数据量情况下,所耗时间只有84 s。

图5 两种方案所需时间对比Fig.5 Comparison of required time between two schemes

4 结论

本文提出一种基于数据特征提取的新能源发电数据核查方法,经过研究和应用分析,得到结论如下。

(1)基于模糊依赖的两步属性约简特征选择算法,根据冗余属性集的定义,以候选属性集为出发点,能够依次消除不重要的属性,从而选择相同种类结构的新能源发电基础数据特征向量集。

(2)利用LSTM网络进行数据核查,通过单元的存储器状态进行写入、擦除和读取操作,可以避免深度学习过程中所面临的梯度消失问题,将特征输入Softmax回归分类,有助于提高数据核查效率。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!