当前位置:首页 期刊杂志

基于时域特征的电力感知数据频繁项查询

时间:2024-07-28

汪 江,温 炜

(1.国网宁夏电力有限公司培训中心,宁夏 银川 750001;2.华中科技大学计算机与科学技术学院,湖北 武汉 430074)

0 引 言

由复杂电网和交直流混联系统构成的电力系统[1-2],作为横跨我国全部省会的实时在线系统,能够通过逐时段潮流的方式为各受端系统提供能源支持。电力感知数据作为能源供应链中的庞大数据集,在展示电网调度性能方面起到重要的作用。然而,电力系统的传输特性决定了电力感知数据的冗余度。为了从海量电力感知数据中检索可用信息,可以通过频繁挖掘的方式,发现某些电力感知数据在给定时间范围内出现的频率较高。这些数据可能具有关联性或重要性。因此,研究电力感知数据频繁项查询方法具有重要意义。

文凯[3]等通过频繁项挖掘算法创立候选项数据集,将数据分流后持续压缩数据集内频繁项进位时段,从而在实现电力感知数据频繁项查询的同时减少了时间开销。但该算法的系统负载较大。刘卫明[4]等通过计算大数据环境下负载不均衡的节点冗余度,确定频繁项集中能够有效避免冗余搜索的合并节点,并在忽略合并节点的前提下提出超集等价剪枝策略,以实现电力感知数据频繁项查询。但该策略的计算过程较复杂。

为了解决上述方法存在的问题,本文提出基于时域特征的电力感知数据频繁项查询方法。该方法通过分析电力系统的拓扑结构和运行状态,挖掘其中的电力感知数据,以提高查询效率;根据数据的频域和时域特征,通过贝叶斯分类算法计算特征值出现频次,以缩短计算过程、完成电力感知数据频繁项查询。

1 电力感知数据的挖掘方法

截至目前,评估电力系统状态仍需要电力感知数据的参与。想要获取更加精确的电网走势情况,挖掘电力感知数据是必不可少的操作步骤。通常情况下,我国各省市电网的主要数据来源隶属于国家电网安全总局的能量管理系统。这意味着电力系统供电途中产生的电力感知数据也会作为量测数据存储于能量管理系统中。挖掘电力感知数据,即从能量管理系统中采集厂站转发的量测数据。其具体操作过程包括估计电力系统运行状态和挖掘系统内部电力感知数据这2个步骤。能量管理系统的拓扑结构如图1所示。

图1 能量管理系统的拓扑结构

由图1可知,能量管理系统主要由人机交流、数据分析、预测和决策优化这4个部分组成。人机交流部分用于获取能量管理系统的实时数据。数据分析部分用于获取历史数据和预测数据。预测部分用于负荷预测、发电预测和电价预测。决策优化部分用于制定调度计划。接口用于接收能量管理系统的状态,以便实时调整。

1.1 预测电力系统运行状态

在无外界因素干扰的正常情况下,电力系统运行状态满足自适应代理模型[5],即电网数据的时变特性围绕非线性自回归滑动平均(autoregressive moving average,ARMA)模型回归线展开。以电力工业生产环节的实际工况为例,一次电网运输过程可能受到隔离开关位置信息、电力变压器、母线电压等多种不良因素的影响,出现电力感知数据逻辑判断失误等问题。因此,在采集电力感知数据前粗略预测电力系统的大致运行状态,能够起到规避电力电量失衡的作用。自适应代理模型为:

(1)

式中:d为电压相角,(°);γ为电力系统供电开始时刻;θ为电力系统供电终止时刻;i为功率上下限值。

不良因素检测计算式为:

(2)

式中:λ为电线传输功率,kW;G为断面裕度;r为线路平均损耗;π为网损分布。

电力系统运行状态的估算式为:

(3)

式中:w为净注入有功功率,kW;di为电压幅值,V;x2为交流输电线路阻抗;x1为交流输电线路零序参数。

1.2 挖掘系统内部电力感知数据

在成功预测电力系统运行状态的基础上,本文约束交直流混联电网在发电、变电、输电、用电这4个方面的恒电流与恒电压,使电力系统恒压输出。此时,能量管理系统内参与辨识和修正的电力感知数据处于锯齿状波动的活跃阶段。根据电网的纵向连续性和横向连续性,可知相邻日期的所有耗电元件均受日负荷与次日负荷的反馈控制,呈现出电量乘积与总发电量比值小于单位碳排放量的标准趋势。因此,根据标准趋势定向采集传输活跃的电力感知数据,即可实现系统内部电力感知数据的挖掘。恒电流在交直流混联电网发电、变电、输电、用电这4个方面的约束式为:

(4)

恒电压在交直流混联电网发电、变电、输电、用电这4个方面的约束式为:

(5)

式中:Δs为线路末端电压,V;α为用电量;b为年度负荷;q为断面潮流限值;m1为发电机组出力上限;m2为发电机组出力下限;μ为发电量,kW·h;tR为发电频率,Hz;v为风电场风速;δ为变电量;y1为变电站母线规格;c为输电量,kW·h;y2为线路首段电压,V。

日负荷与次日负荷的反馈控制式为:

(6)

2 查询电力感知数据频繁项

为实现电力感知数据频繁项的查询,需要对电力感知数据进行贝叶斯分类算法处理,使对应的频繁项可以被聚类在一起。查询电力感知数据频繁项流程为:首先,挖掘出电力感知数据中的频繁项;然后,提取其时域特征,并将时域特征输入贝叶斯分类算法中进行处理。通过这一分类算法,可以进一步深入了解电力系统运行的状况,并识别出异常情况。

2.1 提取电力感知数据的时域特征

从宏观角度看,时域特征是由频域[6]和时域共同组成的活动性特征。由于存在加速度变化,时域特征常用于描述信号、输入向量或实时性统计信息随级数增长而逐步剧烈的扰动情况。在实际生活中,单独提取时域特征能够起到推测数据集角加速度[7]、合理分配单位采样时间内多组相关数据的作用。相较于逻辑疏密性优良的其他数据,电力感知数据由于存在不容忽视的电压暂升、暂降、瞬时中断等问题,其逻辑疏密性不仅较差,还具有明显的波动与闪变[8]。这种由谐波震颤效应导致的逻辑疏密性下降问题属于不可修正的负积分问题,因此无法通过更改样本数据的输出权值,从而达到订正逻辑疏密性的目的。

由谐波震颤效应导致的电压暂升、暂降、瞬时中断如图2所示。

图2 电压暂升、暂降、瞬时中断示意图

考虑到过电压[9]与欠电压[10]的持续时间一般不超过电力系统实时活动信息的2个滑动周期,因此本文在提取电力感知数据的时域特征时,需要将注意力集中于三轴加速度相同的2个滑动窗口[11]。谐波震颤效应为:

H=z(e)+gs+fst′(ls-ls+1)

(7)

式中:z为正弦交流分量;e为波动频率,Hz;gs为基波频率整数倍的正弦交流分量;fs为振荡暂态;t′为单相电压信号;ls为谐波衰减常数;ls+1过电压与欠电压持续时间为:

D=∂sin(ηrm+3Ψ)+cos(hm-1)+f′

(8)

式中:∂为过电压质量,%;η为欠电压质量,%;rm为低通滤波;Ψ为基波角频率,Hz;hm为正弦电压初相角,(°);f′为过电压与欠电压的出现时间,ms。

本文以三轴加速度相同的2个滑动窗口为目标区域,提取电力感知数据的时域特征。时域特征提取式如下。

(9)

式中:βb为可调参数;im为波速经验值;c′为回波部分具有的周期性特征。

2.2 电力感知数据频繁项查询

贝叶斯分类算法是以贝叶斯分类器[12-13]为元件的给定样本分类算法。本文将提取成功的时域特征作为样本数据输入贝叶斯分类算法。算法根据单位时间内特征出现频次,将电力感知数据划分为多组后验概率差异显著的类别区间。通过锁定频次占比较大的类别区间,可实现电力感知数据频繁项查询。

根据贝叶斯分类算法实现的电力感知数据频繁项查询的具体步骤如下。

①设a为待分类项集合Z中的特征属性,则Z={a1,a2,…,an};将待分类项集合Z作为训练样本集。

②设C为有类别集合,则C={o1,o2,…,on}。其中,o为有类别集合中的特征属性。

③获取各类别特征属性的概率估计为:P(a1|o1),P(a2|o1),…,P(an|o1);P(a1|o2),P(a2|o2),…,P(an|o2);P(a1|on),P(a2|on),…,P(an|on)。

④在各类别特征属性独立的前提下,根据贝叶斯定理推导特征属性的概率为:

(10)

⑤步骤④中最大值即为最终查询结果。

3 试验与结果

为了验证基于时域特征的电力感知数据频繁项查询方法的整体有效性,本文对其进行测试。试验操作系统为Windows10,64位。系统内存为16 GB。中央处理器(central processing unit,CPU)负载采样间隔为5 ms。本文采集某市电厂中的1 000个电力感知数据,以其作为试验数据进行以下试验。

3.1 电力感知数据频繁项查询性能测试

为了测试基于时域特征的电力感知数据频繁项查询方法的性能,本文将本文方法与文献[3]方法和文献[4]方法进行对比测试。

查全率可以计算电力感知数据中数据频繁项的比率。查全率越高,则挖掘范围越广、查询性能越好。不同方法对电力感知数据频繁项的查询性能对比如图3所示。

图3 不同方法对电力感知数据频繁项的查询性能对比

由图3可知,采用本文方法对电力感知数据中频繁项进行查询时,查全率维持在97%以上;而采用文献[3]方法和文献[4]方法查询电力感知数据的频繁项时,其查全率范围分别为94%~97%和%89~93%,查全率较低。该结果证明,本文方法的查询性能更好、对频繁项的挖掘范围更大,可以有效挖掘电力感知数据中的数据频繁项。

3.2 电力感知数据频繁项查询能力测试

测试将电力感知数据分为5组,平均每组200个电力感知数据,利用3种方法对电力感知数据的频繁项进行查询。查询的电力感知数据数量越多,证明所使用方法的查询能力越好。不同方法对电力感知数据频繁项的查询能力对比如图4所示。

图4 不同方法对电力感知数据频繁项的查询能力对比

由图4可知,在5组试验中,本文方法查询到的电力感知数据的数量始终在180个以上,而文献[3]方法和文献[4]方法查询到的电力感知数据分别在160个、130个左右。该结果证明本文方法的电力感知数据频繁项查询能力更好。

3.3 计算时间开销和内存开销

为了进一步验证所提方法的实用性,测试分别采用本文方法、文献[3]方法和文献[4]方法查询电力感知数据的频繁项,并记录不同方法的时间开销和内存开销。通过对比测试,可以判断不同方法的查询效率和计算复杂度。不同方法的时间开销和内存开销如表1所示。

表1 不同方法的时间开销和内存开销

由表1可知:采用本文方法查询三组电力感知数据的频繁项,其时间开销和内存开销均低于采用文献[3]方法和文献[4]方法。这可能是由于本文方法在提取电力感知数据的时域特征时,考虑了三轴加速度相同的2个滑动窗口,在一定程度上提高了查询效率。结果证明本文方法的查询效率高、计算复杂度低,进一步验证了本文方法的实用性。

4 结论

在电力系统中,电力感知数据的应用越来越广泛,各种电力电子设备均与电力感知数据有着密不可分的关系。为了实时监测电力系统运行状态,相关学者试图通过提高电力感知数据频繁项查询率,以达到协调电能市场分配关系、避免电力系统用电损耗日益严重的目的。为了提高数据频繁项查询的效率,本文提出了基于时域特征的电力感知数据频繁项查询方法。该方法通过挖掘电力感知数据、提取时域特征,结合贝叶斯分类算法锁定类别区间,从而完成数据频繁项查询。试验结果表明,本文方法具有较好的查询性能,可有效提高电力系统的查询效率、降低内存开销。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!