当前位置:首页 期刊杂志

基于用电异常数据的反窃电在线监测方法研究

时间:2024-07-28

刘安磊,马 迅,贾旭超,王 勇,赵 檀

(国网河北省电力有限公司营销服务中心,河北 石家庄 050000)

0 引言

窃电是电力公司无法彻底解决的难题,既影响电力公司经济效益,又扰乱用电秩序[1],同时还会提升电力设备损耗程度,导致严重的用电事故发生[2]。电力公司一直在提升窃电打击力度,完善反窃电技术,但目前反窃电技术具有一定的局限性,同时窃电手段的隐蔽性与多样性逐渐提升,直接加剧了反窃电难度[3-4]。熊霞等研究窃电监测方法,利用用电信息采集系统获取用户基本负荷数据,在负荷数据中获取疑似窃电异常关联因素,通过改进层次分析法,构造窃电监测模型,按照置信度求解用户窃电嫌疑值,完成用户窃电智能监测,该方法可精准确定疑似窃电用户,且窃电监测速度较快,为反窃电工作提供技术支撑[5]。张宇帆等研究窃电监测方法,通过深度卷积生成对抗网络获取负荷数据特征,利用边缘数据中心训练支持向量机,在完成训练的支持向量机内输入负荷数据特征,输出窃电监测结果,该方法可有效监测窃电情况,计算复杂度较低[6]。用户异常用电数据包含各种情况下的异常数据,涵盖范围较广,以上2种方法仅考虑负荷数据,考虑的因素不够全面,影响反窃电在线监测效果。为此,研究基于用电异常数据的反窃电在线监测方法,利用K-means聚类算法在一定周期内用电数据中,确定用电异常数据,根据用电异常数据构建疑似窃电数据特征数据库,确定异常用电数据特征,通过主成分分析法降低建立用电异常数据特征维度,依据模糊神经网络建立在线反窃电模型,实现反窃电在线监测。

1 基于K-means聚类算法确定用电异常数据

1.1 确定原理

利用K-means聚类算法在一定周期内用电数据中,确定用电异常数据,该算法是按照用电数据样本间的相似度,将用电数据样本自动划分成数个聚类[7],令聚类内部间用电数据样本相似度较大,聚类间用电数据样本间相似度较小。

利用欧几里德距离描绘用电数据样本间的相似度[8]

式中:x i、x j为用电 数据样本;x ik和x jk为用电数据x i、x j在第k个聚类内做差所得的数值;N为用电数据属性数量,n∈N;d(x i,x j)为欧几里德距离,如果用电数据样本x i与x j间的d(x i,x j)越小,说明x i与x j间的相似程度越大[9],如果用电数据样本x i与x j间的d(x i,x j)越大,说明x i与x j间的相似程度越小。

利用K-means聚类算法确定用电异常数据的原理如下:

1)确定用电数据聚类数量k,在M个用电数据样本中选取k个用电数据样本x k当成初始聚类中心;

2)按照x k的聚类均值,获取中心对象B,求解各类别和B的距离,按照最小距离再次分割x k;

3)求解存在变动x k的聚类均值,获取B,重复2),以各用电数据聚类不再改变为止,输出用电数据聚类结果[10],得到用电异常数据。

聚类数量k与用电数据聚类效果息息相关,为此选择有效指数度量方法确定k,在k超过1的情况下,便能够获取最佳的用电数据聚类结果,公式如下

式中:V(k)为用电数据聚类k的有效指数;M为用电数据样本数量,i,j∈M;Ci和C j分别为用户i和j的用电数据聚类;B i为C i的中心;B j为C j的中心;x为用电数据的聚类结果;为相同用电数据聚类中的内聚性为各用电数据聚类集间的离散性。

令用电数据聚类中用电数据样本和的B i距离最小,便可令相同用电数据聚类中用电数据相似度最大[11]。用电数据样本和B i的距离确定了相同用电数据聚类中用电数据样本的内聚性。为此,V(k)与用电数据聚类数量k的用电数据聚类效果呈反比,与最小V(k)相应的k值便为最佳用电数据聚类数量。

1.2 算法实现

通过K-means聚类算法聚类用电数据时,聚类结果共包含2类数据,分别是正常用电数据与异常用电数据,其中,异常用电数据包含缺失与错误两方面用电数据,根据1.1节设计具体的数据确定步骤如下。

步骤1:输入t时刻用电数据中的用电量P(t),确定用电数据中的缺失用电数据,如果当天t时刻用电量与当天t-1时刻用电量一致,说明该用电数据中存在缺失用电数据。

步骤2:初次确定用电数据中的错误用电数据,一天用电数据中用电量为累加的,即其变化过程为递增的,如果当天t时刻用电量小于等于当天t-1时刻用电量,那么确定t时刻用电数据是错误用电数据,存储至错误用电数据集。

步骤3:按照邻近时刻用电量差值ΔP,确定该用户外出情景;该用户存在外出情景情况下,仅有持续运行设备运行,邻近时刻ΔP为规律的。按照该用户一定时间段中每日各邻近时刻ΔP,可获取外出规律用电量差值,同时可按照用电量差值,确定该用户是否处于外出情景,在用电量较大时刻出现偏差,则将该用电数据确定为偏小用电异常数据。

步骤4:确定用户外出情景后,利用K-means聚类算法确定用电数据中的用电异常数据,通过有效值指数度量方法确定K-means聚类算法的最佳聚类数量k,输出用电数据聚类结果,确定用电异常数据。

2 用电异常数据特征选择与降维

在第1节确定的用电异常数据中,选择用电异常数据特征,利用主成分分析法降维用电异常数据特征。

2.1 用电异常数据特征选择

将第1节中确定的用电异常数据中的电流三相不平衡、电压三相不平衡、线损与负荷,作为用电异常数据特征指标,并在这4个方面对用电异常数据展开特征提取。

电流三相不平衡描绘三相电流间的差异[1213],电流三相不平衡指标的计算公式如下

式中:Ia、Ib、Ic为三相电流;z为 三 相 电流均值,z

电流三相不平衡描绘三相电压间的差异[14],电压三相不平衡指标的计算公式如下

式中:Ua、Ub、Uc为三相电压。

线损率在0~6%为正常状态,在6%~26%为嫌疑状态。设置统计天数为H天,那么日线损率移动均值为当天与前H-1 天的日线损率均值。

负荷特征指标包含用电异常数据内各时间段的负荷率与负载率,负荷率代表用户每日用电量变化情况,负载率代表各时段负荷变化情况[15]。日负荷率是日负荷均值与日负荷最大值间的比值;负载率是各时刻负荷均值与日负荷均值间的比值。

2.2 基于主成分分析的用电异常特征数据降维

利用主成分分析法降维各用电异常特征数据集,令各类用电异常特征数据集内均包含G个电力用户,各用户的用电异常特征数据集包含4项指标,原始用电异常特征数据集的矩阵是

式中:g为当前用户,g∈G;y1,y2,y3,y4为每项用电异常数据特征指标相应值。

线性组合Y的4项用电异常特征数据指标内数据,可获取:

式中:F1、F2、F3、F4分别为电流三相不平衡、电压三相不平衡、线损与负荷指标函数;a pn为特征数据指标分量系数,同时符合ap21+ap22+ap23+=1,p=1,2,3,4;λ为 修 正 系 数。

利用主成分分析法降维各用电异常特征数据集的具体步骤如下。

步骤1:标准化处理Y,利用行变换把矩阵变成行最简形,再使用列变换将每一非零行的除了首非零元素外的其余元素化为零。适当的交换各列的位置使其左上角称为一个单位矩阵,即可完成矩阵的标准化,获取用电异常特征数据集标准化矩阵Y'。

步骤2:求解Y'内用电异常特征数据均值[16],公式如下

式中:M′为用电异常特征数据量;y′i为第i个用电异常特征数据对应值。

步骤3:求解Y'内用电异常特征数据的协方差矩阵

步骤4:求解S的特征向量与特征值。

步骤5:确定各类用电异常特征数据的主成分,完成用电异常特征数据降维。

通常情况下,在特征值超过1、累积贡献率超过90%情况下,相应的前m个特征数据便是主成分。

3 基于模糊神经网络的反窃电在线监测模型

利用分类预测模型完成反窃电在线监测,在反窃电在线监测过程中,包含各种因素彼此作用的繁琐状况,模糊神经网络可较好地处理这种状况。为此,利用模糊神经网络建立反窃电在线监测模型,在该模型内输入降维后的用电异常特征数据y′i,输出反窃电在线监测结果。该模型共包含5层,分别是输入层、模糊化层、模糊推理层、去模糊化层、输出层。邻近两层间均包含一个连接权值。

第1层中共包含r个节点,各节点和y′i直接相连,并传输y′i至第2层,因用电异常数据特征指标有4个,所以该层节点数量是4,即r=4。

第2层负责求解用电异常特征数据的隶属度函数,如果各y′i内都包含l个模糊集合,那么第2层中共包含r×l个节点,即将用电异常特征数据分成r组,各组用电异常特征数据中共有l个节点,第β组的l个节点输入的用电异常特征数据为y′β;该模型内r=4,将各用电异常特征数据分割成l个模糊度,为此共分割成4l个模糊度,各节点的激活函数均为异常特征数据各模糊度的隶属度函数η(y′β),那么该层输出为η(y′β),η∈[0,1]。

激活函数选择高斯函数,计算公式如下

式中:θ为η(y′β)的中心;τ为η(y′β)的宽度;e为高斯函数符号表达参数。

第3层中各节点仅和上一层内各节点单独连接,节点数量是l r,各节点均与一条模糊规则相对应,用于匹配模糊规则的输入与状态,求解各条规则适应度f,因为该模型内r=4,所以节点数量是l4,即共包含l4条模糊规则,f的计算公式如下

式中:j′为当前节点标号,j′∈l4。

第4层节点数量是输出反窃电在线监测结果模糊度分割数量,该模型输出的反窃电在线监测结果为窃电与非窃电,即节点数量是2,第4层负责归一化f,归一化公式如下

式中:λ为修正系数;i′为当前节点数。

第5层负责变更上一层内每个节点的输出,获取精准值,第5层节点数量是1,输出的精准值是窃电嫌疑系数,该值与1越接近,说明窃电嫌疑越大,该值与0越接近,说明窃电嫌疑越小。通过加权平均法求解窃电嫌疑系数,公式如下

式中:w j′为连接权值。

4 实例分析

以某市供电局为实验对象,该供电局中共涉及18座110 k V 变电站,包含100 多万个用户,299条线路,总长2 964 km。在该供电局内随机选择部分电力用户的用电数据作为实验数据,这些用户中包含窃电用户,利用本文方法在线监测这些用户的窃电情况,验证本文方法的有效性。

4.1 实验步骤

采用第1.2节步骤,利用K-means聚类算法确定用电异常数据;

采用第2.2 节步骤,在确定的用电异常数据中,选择用电异常数据特征,利用主成分分析法降维用电异常数据特征。

采用第3节计算方法,利用分类预测模型完成反窃电在线监测,在反窃电在线监测过程中,包含各种因素彼此作用的繁琐状况,模糊神经网络可较好地处理这种状况,为此利用模糊神经网络建立反窃电在线监测模型。

4.2 实验结果

利用本文方法确定实验数据中的用电异常数据,结果如图1所示(以用电数据中存在偏小与偏大用电异常数据的2个用户为例)。

图1 用电异常数据确定结果

由图1可知,图1(a)的历史时刻用电数据远远高于当前时刻用电数据,说明当前时刻用电数据为用电异常数据,即属于偏小用电异常数据;图1(b)的历史时刻用电数据远远低于当前时刻用电数据,说明当前时刻用电数据为用电异常数据,即属于偏大用电异常数据。实验证明:本文方法可有效确定偏小与偏大用电异常数据,与实际情况相符,确定用电异常数据的精度较高。

利用本文方法在用电异常数据中选择用电异常特征数据,以三相电流不平衡指标的用电异常特征数据为例,随机选取某个用户的用电异常特征数据如图2所示。

图2 用电异常特征数据

由图2可知,A 相电流、B相电流与C 相电流间的差距很大,说明该用电异常特征数据为三相电流不平衡特征。实验证明本文方法可有效在用电异常数据中选择用电异常特征数据,再次验证其确定用电异常数据的精准性。

利用本文方法降维用电异常特征数据,4个用电异常特征指标数据的降维结果如表1所示。

表1 用电异常特征数据降维结果

由表1可知,三相电流不平衡特征指标数据中前5个主成分的特征值超过1,累积贡献率超过90%,为此,该特征指标数据选择前5个主成分作为指标数据集。三相电压不平衡特征指标数据中前8个主成分的特征值超过1,累积贡献率超过90%,为此,该特征指标数据选择前8个主成分作为指标数据集。线损特征指标数据中前9个主成分的特征值超过1,累积贡献率超过90%,为此,该特征指标数据选择前9个主成分作为指标数据集。负荷特征指标数据中前4个主成分的特征值超过1,累积贡献率超过90%,为此,该特征指标数据选择前4个主成分作为指标数据集。实验证明本文方法可有效降维用电异常特征数据。

依据降维后用电异常特征数据,利用本文方法在线监测反窃电情况,随机选择10 个电力用户,这10个电力用户的反窃电在线监测结果如表2所示。

表2 反窃电在线监测结果

由表2可知,本文方法可有效在线监测用户的反窃电情况,获取用户的窃电嫌疑系数,本文方法获取的窃电嫌疑系数与实际值间差距很小,最大误差仅有3.5%(用户ID9912),这10个用户均为窃电用户。实验证明本文方法可精准在线监测反窃电情况。

5 结论

研究基于用电异常数据的反窃电在线监测方法,基于电流三相不平衡、电压三相不平衡、线损和负荷为特征指标,得到异常用电数据中选取异常用电特征数据;对异常用电特征数据进行降维,采用K-means聚类算法确定用电异常数据,基于有效指数度量方法确定用电数据的聚类个数,增加异常数据判断的准确性;利用模糊神经网络建立反窃电在线监测模型,输入降维异常用电特征数据,输出窃电可疑系数。实验结果表明本文方法所得窃电可疑系数与实际值差距较小,最大误差仅有3.5%,可实现反窃电在线监测。

由于越来越多的电力设备将与互联网相连,从而面临着更高的窃电风险。反窃电行为监测作为一种信息安全技术,在未来的发展中,将逐渐适用于物联网设备,需要更加注重技术的可靠性和稳定性。通过质量控制和数据分析等手段提升技术的可靠性,并确保在各种情况下都能正常工作。除此之外,需更加注重标准化和规范化,制定相应的技术规范和标准,以保证技术的安全性和统一性。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!