当前位置:首页 期刊杂志

含照明负载用户供电智能监测算法改进的研究

时间:2024-07-28

潘明明,李义民,游元通,唐勇兵

(1.中国电力科学研究院有限公司,北京 100085;2.国网厦门供电公司,福建 厦门 361004)

引言

随着国家碳达峰、碳中和“30·60”战略的提出,碳核查MRV的监测、报告和核查三体系逐步建立,企业内部对碳排放的自我监测需要安装智能化的监测系统,与此同时,报告、核查所需的文档规范性、数据安全性也需要建立完整标准体系,这就给负荷监测提供了很多机会。负荷监测主要包括两类即:侵入式负荷监测(Intrusive Load Monitoring,ILM)与非侵入式负荷监测(Non-Intrusive Load Monitoring,NILM)。人工智能、区块链等现代信息技术的应用,为非侵入式负荷监测体系构建必要的信息基础单元,通过分析、对比用户用电曲线,获得设备组成和设备状态等用户模式,可进一步深入挖掘抗风险、节能的潜力,从而在减少电费的同时实现用能优化,比如削峰填谷、清洁能源占比提升、用电可靠性提高等,促进园区配电网的安全稳定高效运行。

相对于侵入式负荷监测需要改变用户现有电路结构,非侵入式负荷监测仅需在电力服务入口处安装一个测量装置获取端电压和总电流,然后利用数据分析技术就可以得到内部当前各用电设备的工作状态,更适合于多类型用户的分项监测,可以帮助电网侧挖掘用户侧的节能潜力和需求响应潜力,从而引导或帮助用户自行优化用能习惯,以及制定针对性的用能策略。

1 非健全信息条件下的多类型用户园区供用电智能监测

目前国内外已经研发出一些非侵入式负荷监测的产品,例如家庭场景下基于高频采样的Sense Home和基于低频采样的Chai Energy,楼宇场景下的Energy Wise。工厂场景下可将NILM 用于设备故障预报,在学校场景则可利用NILM 检测大功率用电设备,解决大功率用电器引发火灾的痛点。以Sense Home为例,在初安装时需要几个月的时间搜集数据,且它的进化对人工输入具有一定的依赖性,当识别到未知设备时,Sense 将其显示为“未知加热设备1”、“电机3”等名称,此时需要用户重新命名,或者当Sense 的识别出现错误时,需要人工纠正。

我国江苏省关于负荷辨识智能电表也展开了试点研究,用户通过手机APP 和微信公众号可查询各用电器的使用详情,如开通时间段、各区间耗电量和用电功率等,帮助用户了解具体的负荷模式。但上述设备和试点研究仍然存在一些问题。比如,未关注多种类型场景的园区低成本要求,基于深度学习的负荷识别方法虽然识别准确率达到了95%以上[1],但是在训练神经网络时每完成一次前向传播需要数亿次的运算,这一过程通常在集中式或基于云的服务器上完成,对于算力较低的嵌入式计算平台并不适用。

为此,需要一个远程智能平台来集合状态监测及用户场景分类,如图1所示。远程智能运维管控平台中,一方面,单个用户类型分解模块通过自动拓扑识别及用户提供的供用电资产清单,确定用户类型区间,然后反馈至NILM负荷监测模块,并结合历史数据形成的用户数据集,通过数据分析技术,首先识别出各用电设备,其次是各用电设备的主要工作状态;另一方面,远程负荷监测装置,结合环境采集系统,将实时曲线与历史数据的比对,判断出状态是否正常,并进一步通过故障研判模块进行故障评估,故障响应模块在采集到故障信息后向园区及电网公司主动告警。同时故障响应模块将故障类型与设备判定进行联合,判断某个用户出现故障,从而利用设备GIS平台快速对故障进行定位。

图1 远程智能运维管控平台Fig.1 Remote intelligent operation and maintenance management and control platform

其中非侵入时负荷监测可以起到用户级故障判断及设备级故障定位的作用,是整个智能运维的关键核心部分。

2 基于设备特征的NILM监测国内外研究现状

NILM由Hart[2]首次提出,根据Hart的算法,NILM包括4个步骤,如图2所示。

图2 非侵入式负荷分解过程Fig.2 Non-intrusive load decomposition process

1)数据采集:指获取用户总负荷的稳态或瞬态电压和电流数据,并进行去噪、归一化等预处理。

2)事件探测:当有用电设备投切时,总负荷的电气量发生突变,利用规则判断法或变点检测法[3]定位用电设备投切事件发生的时刻。

3)特征提取:从事件发生前后的波形中提取引发事件的用电设备的电流和电压数据,并根据电压、电流数据计算能够唯一标识该设备的特征,即负荷特征。

4)负荷识别:提取用电设备的特征后,NILM的最后一个步骤为利用数学优化或机器学习算法识别该设备的所属类别。

其中的设备特征也称电气指纹,是指用电设备运行过程中表现出来的具有很大差异性的电气特征,非侵入式负荷监测辨识的准确性主要取决于设备特征和对应识别算法的选取。有功和无功功率的变化[1]是NILM首先用到且应用最广的稳态特征,文献[3-5]以有功功率作为唯一特征进行负荷分解,结果表明可以识别开/关二状态设备和大功率设备如电暖器,而低功耗设备由于在P-Q空间中重叠较多,仅用功率特征识别难度高。电压和电流波形的时域和频域特征是另一应用广泛的负荷特征,文献[6-8]以峰值、有效值、相位差和功率因数唯一地定义用电设备,文献[9]对时域特征的有效性也进行了实验验证,表明有效值比峰值更具有区分性。文献[10-13]采用稳态高次电流谐波作为特征,其中,文献[13]对阻性和开关负载的电流时频特征进行对比,证明阻性负载多具有恒阻抗(Constant Impedance,CI),开关负载多具有恒功率(Constant Power,CP),提出一种利用电流频率信号中CP和CI的比例分解电力信号的方法。这些特征把用电设备分为阻性、感性和电子负载三个类别,但是当两种及以上设备同时运行时,无法进行区分。为了克服这些缺陷,文献[14]将谐波特征与有功、无功特征结合起来,当用电器并联运行时,不同的组合具有唯一的稳态谐波特征,这一方法在已知用电设备的场景下提高了检测性能,但在实际的负荷识别应用中,无法获取未知场景中所有设备组合的谐波特征集。文献[15]侧重于对一组用电设备(如:一个家庭中所有的照明设备)的总能耗进行估算,第一步估计组内设备引起负荷投切事件的概率,第二步将能量消耗的计算转化为加权伯努利分布的组合,给出了能耗计算期望值和标准差的解析式。文献[16]通过附加约束、校正和中值滤波对传统的整数规划进行了改进,提出辅助线性整数规划方法,该方法只需瞬时负荷采样,在低频数据上性能优于传统整数规划。文献[17]根据前端电子电路的拓扑将用电设备分为7类,在此基础上,文献[18]提出每个归类内的用电设备经过归一化之后V-I轨迹具有相似的形状,而不同归类的V-I轨迹形状存在明显差别,因此V-I轨迹可以用来区分不同归类的用电设备,从而在实际应用中识别负荷。目前NILM的识别算法也多与神经网络进行结合,文献[19]提出一种支持向量机和高斯混合模型(Gaussian Mixture Model,GMM)的多用电器识别系统,其中GMM用于描述电流波形的分布,支持向量机(Support Vector Machine, SVM)则对提取到的功率特征进行分类以识别目标负载。文献[20]利用了神经网络可进行高级特征提取的特点,实现了V-I轨迹图像特征与功率数值特征这两个具有互补性特征的融合,从而提高了V-I轨迹特征的负荷识别能力。

3 含照明负载时基于V-I轨迹和幅值特征的改进智能监测算法

基于深度学习的负荷监测方法计算量较大,一般只在集中式或基于云的服务器上完成这一过程,对于一个高复杂度的园区来说较难实现[21]。

3.1 负荷监测方法实现流程

图3展示了本文中提出的基于V-I轨迹与幅值特征的负荷检测算法的实现过程,主要由数据集预处理和负荷监测两个阶段所构成。根据流程图3所示,数据集预处理阶段:

图3 基于加权k最近邻的负荷分类算法流程图Fig.3 Flow chart of load classification algorithm based on weighted k nearest neighbor

Step1,在负荷电力数据中取稳态电流和电压绘制归一化V-I轨迹二值图像[20],同时利用快速傅里叶变换提取基波的有功功率、无功功率、电流幅值和其3、5、7次谐波的电流幅值;

Step2,第1步提取的V-I二值轨迹和幅值构成负荷特征,构建负荷模板,将得到的所有数据按3:7的比例划分成测试数据与训练数据;

Step3,对训练数据的V-I轨迹部分进行由遗传算法改进的K均值聚类算法,得到各类设备的V-I轨迹K均值聚类中心;

Step4,对每一个训练样本,以其到聚类中心的距离为依据,分配相应的权重值;

负荷监测阶段:

Step5,计算测试样本与各类训练样本的综合相似度;

Step6,依照kNN判决规则决断待测样本应归属的类别。

3.2 训练样本权重分配方法

kNN算法在预测样本类别归属时,一般采用的方法是多数投票法(majority voting),而此方法对数据集中的少数类很容易发生误判。本文对原始kNN算法进行改进,为每个训练样本赋予不同的权重,从而减少kNN算法误判情形的发生[22]。

一个训练样本的权重取决于它对所属类别的代表能力,由某样本点与聚类中心的距离表示,此距离越近代表能力越强,也就分配越大的权重。以d(i,Oc)表示某样本与其所属聚类中心的距离,那么此样本对所属簇的代表能力就可表示为:

(1)

在分配权重前,每个类别训练样本的权重之和设置为1,设某类别的训练样本包含簇的个数为Ng,簇中样本的个数为Ns,则为样本i分配的权重为:

(2)

由于各类别用电器的聚类中心数目不同且未知,故在分配权重前,难以使用固定的k值代入k均值算法以找出各类别训练样本的聚类中心,因此本文结合遗传算法与k均值过程,使用变异算子更新k值[10]。具体过程如下:

1)参数初始化:设置种群规模popSize,迭代次数numIter,选择率selectRate和变异率variationRate。

2)生成初始种群:随机生成popSize个[2,10]范围内的随机整数作为种群中每个个体的聚类中心数,然后为每个个体随机选择样本作为初始聚类中心。

3)执行k均值操作:对于每个样本个体,将每个训练样本归类到与其欧式距离最近的聚类中心,利用样本的均值更新迭代一次,得到新的聚类中心。

5)执行选择算子:采用轮盘赌选择算法,每次选择首个比随机数大的累积概率的位置的个体遗传下去,直到选择的子代个体数达到popSize×selectRate。

6)执行变异算子:变异操作能够用于k值自动学习的实现,朝k值增大1的方向或朝减小1的方向进行变异。若当前个体聚类中心数为[3,9]之间,则k值增大或减小的概率各为50%,当k值需要增大1时,新的聚类中心应选择距离聚类中心最远的一个样本,当k需要减小1时,将此个体中相距最近的两个聚类中心随机选一个删除。若当前个体聚类中心数等于2,默认选择k值增大1,若当前个体聚类中心数等于10,默认选择k值减小1。

7)生成下一代种群:下一代种群为选择操作和变异操作后的子代组合。

8)重复执行2)~7),直到迭代次数达到预先规定好的值,将适应度最大的个体设定为最终结果。

3.3 含照明负载时考虑幅值特征进行分类判决

V-I轨迹形状与用电设备的前端电路拓扑结构相关,反映出电压与电流相位差、负荷非线性度和高次谐波特性等信息,无法体现负荷的功率特征。在某些工作模式下,风扇、空调等家电与电阻型用电器电灯泡的V-I轨迹几乎重合,仅以轨迹特征作为分类依据容易发生误判,如图4所示。这也导致了在含照明负载情况下的常规非侵入式负荷监测算法误判概率较大。

图4 两类用电器的V-I轨迹图示Fig.4 V-I trace diagram of two types of electrical appliances

因此本文在利用kNN算法进行类别判决时引入了负荷的幅值特征,对待测样本所属类别进行预测的过程如下:

1)按公式(3)、(4)算出待测样本与所有训练样本的V-I轨迹相似度SA与幅值相似度SB,其中的距离为欧氏距离,其中f(~)是欧式距离的倒数;

SA=f(d1)

(3)

SB=f(d2)

(4)

2)按照S1值以降序顺序排列,当前测试样本的K最近邻取前K个相似度最大训练样本;

3)计算幅值特征与轨迹特征的综合相似度S,并计算得到待测样本与K个最近邻中各类的总相似度,预测结果取总相似度最大的类。

S=SA×wi+SB

(5)

4 实验结果与分析

4.1 数据集选择

由于V-I轨迹的绘制需要用电设备的高频电压和电流数据,且训练样本应包含尽可能多的设备类别,国外从事相关研究的实验室陆续发表了用于负荷分解的公开数据集,如表1所示。

表1 现有公开数据集信息列表

本文的算法验证由PLAID数据集进行。PLAID数据集包含56个用户11类常用用电器的电流和电压数据,采样频率为30 kHz,对于同一用电器实体,采集3~6次数据,最终该数据集共有来自235个设备的1 094组数据,设备开启的暂态与稳定运行的稳态过程均包含在各组数据中。训练样本和测试样本的数量按照比例7∶3确定,训练样本的数量为764,测试样本的数量为330,如表2所示。

表2 各类型用电器数量

4.2 评价指标

在二分类问题中,常用的评价指标为准确率Acc、精确率P、召回率R和F1-measure[12,18]。

当数据集平衡时,Acc越大表示模型的性能越好。但实际应用中,各类别样本数目差距大的现象时常发生,这时即使把少数类样本全部识别为多数类样本,该模型的Acc也会很高,因此准确率无法衡量分类器对每一类样本的识别效果。本文中的用电器识别为多分类问题,需要能够评价分类器全局性能的指标,如宏平均。计算宏平均时,首先为每个类别构建如表3所示的混淆矩阵:

表3 单个类别Ci的混淆矩阵

然后独立计算精确率和召回率(P1,R1),(P2,R2),……, (Pn,Rn)(n为当前分类问题的类别数目),对所有类求算术平均值M_P和M_R,最后它们的调和平均即为M_F1。

(6)

4.3 在数据集上对算法进行测试

图5 4种算法指标对比Fig.5 Comparison of 4 algorithm indicators

算法1:仅考虑轨迹特征的传统kNN;

算法2:仅考虑轨迹特征的加权kNN;

算法3:考虑轨迹特征和幅值特征的传统kNN;

算法4:考虑轨迹特征和幅值特征的加权kNN。

图5给出了四类算法近邻类K的数量与宏平均的变化关系。本文中的改进算法为算法4,在K≥12后区域稳定,准确率达到94%。出于计算成本考虑,在实际园区负荷识别中考虑将近邻数量设置为12左右,并根据实际情况调试。此外,本文所使用的算法4在宏平均意义下的性能均高于现有的其他三类算法(算法1~算法3),特别是空调、风扇与照明灯泡的误判率明显下降。表4比较了本文算法与现有算法,为了保证结果具有可比性,所选算法均是在PLAID数据集上进行了验证,表4中的Acc与M_F1是由文献中提供的实验结果而计算得到的。

表4 本文算法与现有算法的对比

5 结论

在多类型用户的园区应用场景下,针对基于深度学习的负荷监测方法需要在集中式或基于云的服务器上实现训练过程,这会产生较高的硬件成本。本文提出了一种基于kNN算法的无需训练过程的负荷分类方法,取得了较高的分类性能:

1)采用加权kNN算法和综合相似度判别方法改进原始kNN算法的识别效果;

2)本文提出的基于加权k最近邻的负荷分类模型Macro_F1为94.02%,与现有基于深度学习的负荷分类算法相比也是具有竞争力的;

3)在照明负载下,加入负荷的幅值特征分析,可以有效提升空调、风扇的判断准确率。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!