时间:2024-06-19
王宁, 陈宇, 李波
(同济大学 汽车学院,上海 201804)
随着环境恶化问题的日益突出,由于传统煤矿、石油等不可再生能源存在自身资源短缺和污染问题,能源消费正向电动化、清洁化、低碳化、智慧化转型[1]。电动汽车因高效能、零污染、低排放等优点逐渐受到各国政府的重视[2],电动汽车产业高速发展,大规模电动汽车接入电网,造成电网波动性变化,在可靠性、安全性和经济性等方面影响电网运行[3-5],对其充电负荷进行预测十分有必要。精准预测有助于促进电动汽车与电网的互动,实现有序充电,进而优化电网负荷运行曲线,保障电网稳定运行,提高充电设施的利用率,减少电动汽车充电给电网带来的负面影响[6-7]。
现有的负荷预测方法可按照时间尺度分为4类:超短期预测、短期预测、中期预测和长期预测,如图1 所示[8-9]。不同的时间尺度应用场景有所区别,超短期预测适用于电力系统实时监控,短期预测适用于充电设施的日常运维,中长期预测多用于辅助未来充电基础设施的投资规划和资源配置[10]。为实现协调电动汽车与电网关系的目的,国内外相关研究以短期为主,从车端和充电站端两方面展开。
从车端展开的预测方法多利用统计学方法建立车辆出行和充电模型,采用蒙特卡洛法进行仿真分析[11-14]。但由于用户行为存在高度的异质性和随机性,此类方法的模型参数设计复杂,模型难以克服长尾效应的影响,会导致最终的车端仿真结果与真实充电行为存在差异[15],普适性较差。
相比从车端展开的预测方法,从充电站端出发的预测方案通过采集大量充电站有效历史负荷数据,考虑温度、天气状况、节假日、特殊日期、生活习惯、交通状况等因素对充电行为的影响[6],利用机器学习类算法直接从数据中探索负荷变化规律[16],规避了建模仿真带来的误差影响,预测结果更接近于真实值的变化趋势,方法实用性更强。在电动汽车高速发展的背景下,充电站负荷数据井喷式增长,基于充电站端的方法应用前景广阔,国内外积极展开研究。李恒杰等[17]考虑电动汽车基础设施需求的特异性和电动汽车配置的差异性,建立能量集成轻量梯度提升框架进行充电站充电负荷预测,能在缩短训练时间和降低计算资源需求的同时实现充电站负荷的超短期预测。龚钢军等[18]考虑环境、日期类型等影响充电站负荷量的关键因素,改进深度学习中的栈式自编码器,提出栈式自编码器-极限学习机,实现对大量数据的特征提取,对充电负荷进行精准预测。FENG Jiawei等[19]将基于多变量残差修正的灰色模型和LSTM 相结合,建立从影响因素数据到预测的映射,降低电动汽车负荷预测误差,有效提高电动汽车充电站负荷预测的精度。SHEN Xiaodong 等[20]针对充电站数据稀缺问题,提出一种基于生成对抗网络的数据生成方法,在LSTM 中添加新型门控机制进行负荷预测,并通过试验证明该方法的有效性。
上述方法虽取得了良好的预测效果,但他们的研究只从时间序列角度探索外部因素对于充电负荷的影响,对象均为单个站点,方法泛化能力不足,不能实现对多个站点负荷的协同精准预测。为解决这一难题,诸多学者基于电动汽车充电负荷存在空间与时间的双重动态变化的特点,挖掘各充电站负荷在空间维度上存在的联系,构建预测方法时充分考虑空间维度信息的影响,从而实现对多个站点负荷的协同精准预测。张秀钊等[21]利用LSTM 层和三维卷积层捕获充电桩负荷的空间和时间维度信息,构建时空神经网络同时输出多个时间步的时空动态负荷矩阵,实现对于充电负荷时空二维信息的准确预测。彭丽等[22]通过二维空洞卷积层学习空间维度信息,并利用二维空洞卷积层的堆叠实现对时间维度信息的学习,成功构建一个能充分考虑空间和时间维度信息的模型。上述文献虽然具有优异的预测效果,但是忽略了外部特征对于模型精度的积极影响,易出现模型鲁棒性不佳的问题。对此,王圣元[23]意识到外部因素在充电站负荷预测中的重要性,构建基于门控图神经网络的负荷时-空预测模型,取得良好的预测结果,但只是将天气特征和日期特征作为图神经网络的输入,未深入挖掘其特征规律。
为此,本文提出一种能同时考虑负荷时空因素和外部因素影响,并且能协同多个充电站负荷进行预测的方法,该方法基于GSTNN 模型,将充电站看作充电负荷节点,构建每一时刻所有充电站的负荷加权有向图以刻画充电站之间的空间关系,对有向图进行堆叠后输入时空神经网络,进行时空因素特征提取,同时利用LSTM 网络提取天气、日期、历史负荷等外部因素的特征,再利用融合网络将特征进行拼接,最终实现同时对多个充电站的精准负荷预测。与随机森林(Random Forest, RF)、LightGBM (Light Gradient Boosting Machine)、XGBoost(eXtreme Gradient Boosting)、多层感知机(Multilayer Perceptron,MLP)、LSTM、不考虑外部因素的图时空神经网络(GSTNN_nf)等模型进行比较,本文提出的考虑外部因素的GSTNN 模型能充分考虑影响充电站负荷的因素,实现对多个充电站负荷的协同预测,同时输出各充电站的预测负荷,并具有更高的预测精度。
深度学习凭借其特有的深层结构,使模型能具备极强的特征表示和概念抽象能力,避免了传统机器学习方法对特征工程的依赖[24],已经在图像处理、机器翻译、自动驾驶等多个领域广泛应用[25-27],并取得了优异的效果。在上述领域使用的神经网络中,处理的数据节点都有固定的排列规则和顺序,此类数据称为欧式结构数据,如图2a 所示。但实际应用过程中,很多问题的数据节点排列无序,如图2b 所示,传统深度学习难以解决此类问题,图神经网络应运而生。
图2 数据结构示意图
图神经网络以具有不规则结构的图数据作为处理对象,可将图定义为G=(V,E),其中V表示节点的集合,E表示边的集合。利用图神经网络解决问题就是把实际问题转换成图中节点之间的连接和消息传播问题,通过交叉传播来获得更加丰富的邻域信息,从而实现节点信息的更新[28],更新过程可表示为:
式中:Vm为在m层的节点v;f为状态转移函数;vc为v节点的特征;ve为与v节点相连的边的特征;va为v节点邻域的节点特征;Vm-1为在m-1 层的节点v。
为提高图神经网络的性能,现有研究将多种深度学习技术与图神经网络结合,提出了图卷积神经网络、图注意力网络、门控图神经网络等新型模型。
在图神经网络中,节点和边集合的定义是构建和分析图结构的基础,因此,首先利用给定的充电站历史负荷数据和地理位置关系构建加权有向图,并添加邻接矩阵进一步描述节点之间的连接关系。定义图为G=(Vt,E,A),其中,Vt为N个充电站节点的集合,对应于交通网络中N个充电站在t时刻的充电负荷值,表示为为第i个充电站在时刻t的充电负荷值;E为边的集合;A为邻接矩阵,是一个维度为N×N的矩阵。
基于有向图的构建,可将充电站负荷预测问题转换为利用包含N个充电站M个时刻历史负荷值的有向图,来预测未来Δt时间段内整个区域的充电站负荷。形式上可表达为:
式中:θ为需要学习的参数,包括边集合、邻接矩阵等;为预测的t+ 1时刻所有充电站的负荷预测数据的集合;Vt为t时刻观测到的所有充电站的负荷。
邻接矩阵是表示顶点之间相邻关系的矩阵,为了捕捉隐藏的空间相关性,目前许多研究的常用手段是通过定义不同类型的邻接矩阵来映射更深层次的图结构[29]。由于每个充电站的负荷预测值不仅与该充电站本身的历史信息有关,也与其他充电站的负荷历史信息相关[30]。本研究以充电站之间的路网距离作为基准,使用基于阈值的高斯核[31]构建邻接矩阵,将路网距离转化为一个反映两个充电站连通性的权重ω,ω计算式,如式(3)所示。
式中:ω(i,j)为从充电站i到充电站j的边权重;dij为从充电站i到充电站j的路网距离;φ为距离的标准差;ε为控制矩阵分布和稀疏性的阈值。
为了解决充电站负荷的预测问题,本文提出一个GSTNN 模型,其整体架构如图3 所示。GSTNN模型由时空特征提取网络和外部特征提取网络两部分组成。在时空特征提取网络中,将不同充电站同一时刻的负荷特征Vt=[v1,t,v2,t,…,vN,t]作为时空卷积模块的输入,利用时间门卷积捕获时间特征,利用空间图卷积捕获空间特征,对两类特征进行叠加后,将结果输入全连接层,实现时空卷积模块的最终输出。在外部特征提取网络中,本文首先提取预测时刻t+ 1 至t+Δ的外部特征,并将其转化为特征矩阵S,然后利用LSTM 进行特征提取,再利用全连接对结果进行映射和整合。最后,通过融合层将两个模块的最终输出进行融合处理,得到t+ 1到t+Δ时间段内的预测结果V=[Vt+1,Vt+2,…,Vt+Δ]。
图3 预测模型结构图
为了融合来自空间域和时间域的特征,GSTNN 模型构建时空特征提取网络对图结构时间序列进行处理。如图3 所示,该时空特征提取网络由多个时空卷积模块和一个全连接模块组成,每个时空卷积模块中空间图形卷积层桥接两个门控序列卷积层,形成一个“三明治”结构。
传统卷积神经网络是针对规则网格的标准卷积,难以处理非结构化数据。目前,常使用扩展卷积的空间定义法或谱图卷积法对卷积神经网络数据进行泛化处理。此次基于谱图卷积的原理构建空间图形卷积层,该卷积层能充分考虑网络的连通性和全局性,直接对图结构数据进行处理,提取空间域中的特征,卷积核θ对图形信号进行过滤的计算式为:
式中:x为图形信号;θ为卷积核;L为归一化图拉普拉斯算子;U为L的特征向量矩阵;Λ为L的特征值对角矩阵。
由于采用图傅利叶基进行乘法运算,计算量较大,本文利用切比雪夫多项式逼近来克服这一问题,从而将图卷积改写成:
基于卷积神经网络结构简单、训练速度快等特点,本文选用门控序列卷积来对充电站负荷的时间动态行为进行捕捉,其由一维因果卷积和门控线性单元串联组成。一维因果卷积利用卷积核进行特征提取,门控线性单元可以堆叠时间层特征,从而获取更加全面的特征。卷积核θ与输入V之间的映射关系可以表示为:
式中:P、Q分别为GLU 中门的输入;⊙为元素级哈达玛积;σ为sigmoid门。
最后经过全连接层对所有输入的图结构数据进行处理,经过线性变换,最终得到n个通道的结果,记为Vn。
考虑到季节、天气、时间、历史负荷等外部特征对于充电站负荷的影响,GSTNN 模型中还包含一个外部特征提取网络,如图3 所示,该网络由一个LSTM 和一个全连接网络串联而成。LSTM 具有长时记忆功能,能解决长序列训练过程中存在的梯度消失和梯度爆炸问题,适用于处理与时间序列高度相关的特征。由于此次使用的外部因素多与时间序列高度相关,所以选择LSTM 进行特征提取,再连接一个全连接层用于特征从低维到高维的映射,最终输出外部分量特征为Ve。
为充分考虑充电负荷历史时空分布以及外部因素对于充电站负荷预测的影响,本文利用一个特征融合层将时空分量的输出Vn与外部分量的输出Ve进行融合,融合过程可表示为:
式中:Wr和We为调节时空分量和外部分量影响程度的可调节参数;×2 为2 模矩阵张量积,对数据进行降维和特征提取,并简化计算和分析;tanh 为双曲正切函数,使输出值均在[-1,1]的范围内。
为验证模型对每个充电站未来t+ 1至t+Δ时间段的预测结果准确性,使用L2损失衡量模型性能,损失函数具体定义为:
式中:Vt+i为t+i时刻的实际充电站负荷值;为模型预测的t+i时刻充电站负荷值;Θ为模型中所有可训练的参数。
充电站的充电负荷受多种因素影响,在预测中全面考虑影响因素是使预测结果更加接近实际情况的有效保证。对此本小节选择来自不同区域的充电站作为研究对象,通过对充电站负荷数据的统计分析,筛选用于此次研究的外部特征。
3.1.1 季节影响
不同季节在气候、温度等方面呈现出独特特征,会对充电站的负荷产生影响。本小节选择2021年3 月至2022 年2 月一个完整季节性年份,对充电站负荷的季节性变化进行研究,其中2021 年3~5月为春季,2021 年6~8 月为夏季,2021 年9~11月为秋季,2021 年12 月至2022 年2 月为冬季。选择10个充电站进行统计分析,他们在4个季节的充电负荷统计量如图4 所示。图4a 展示了充电站的日平均充电负荷统计情况,每个充电站的日平均充电负荷均会随着季节的变化产生波动,日均负荷最大值多出现在秋季,少数出现在夏季和冬季,极少出现在春季,充电站所处区域的差异是造成这一现象的原因之一。图4b 展示了日均充电负荷标准差的统计情况,4 个季节的日均负荷标准差同样存在差异,多数情况下春季的标准差最低,说明用户的充电行为在春季具有更高的规律性。
图4 季节对于充电负荷的影响分析
基于季节对充电站负荷的影响,为实现更加精准的预测,本文采用短期负荷预测,并在预测过程中添加月份特征体现季节对于充电负荷的影响。
3.1.2 天气影响
天气因素是充电站负荷预测研究中常用的外部特征,但在研究过程中常存在天气因素类型多、难以量化的问题[32]。为减少模型训练的复杂程度,对预测模型采集到的天气因素与充电站负荷进行相关性分析,以剔除相关性小的特征。皮尔森相关系数rXY是常见的衡量两个变量相关性的统计指标,计算式如式(9)所示,取值范围为(-1,1),其绝对值越大则变量间的相关性越强,系数与相关性之间的对应关系见表(1)。
式中:Xi和Yi为两个变量的第i个观测值;Xˉ和Yˉ为两个变量的平均值;n为变量观测值的总数。
表1 皮尔森系数与相关性对应表
所选择的10 个充电站的充电负荷与天气因素的相关性如图5 所示,其中max 代表充电站当日最大充电负荷,min 代表充电站当日最小充电负荷,mean代表充电站当日平均充电负荷,tem_max代表当日最高气温,tem_min 代表当日最低气温,weather_day 代表当日日间的天气,weather_night代表当日晚间的天气。天气包括晴、多云、小雨、阴、小到中雨、中雨、中到大雨、大雨、雷阵雨、大到暴雨10 种类型,用0~9 的整数对这10 种天气进行编码。由图5 可知,相较于天气情况,当日温度对负荷的影响更为明显。为降低模型的复杂性,选择当日的最高温度和最低温度作为预测模型使用的天气特征。
图5 充电站充电负荷与天气因素的相关性分析
3.1.3 时间因素
星期制度和节假日能塑造人们的时间安排、工作模式和社交习惯,对社会活动产生广泛影响。充电行为作为社会活动的一环,也一定程度上受其影响,考虑星期制度和节假日因素对于充电站充电负荷预测问题十分必要。
图6a展示了星期制度对于充电负荷的影响,观察可知对于所选择的10 个充电站,一周内的日平均负荷一直处于波动状态,主要存在两种趋势:一是工作日负荷高、休息日负荷低;二是工作日负荷低、休息日负荷高。这两种趋势的形成与充电站所处的区域具有一定的关联性。前一种主要出现在办公区域,休息日人们前往工作的数量减少,负荷下降;而后一种主要出现在景点附近,休息日前往游玩的人数增多,导致负荷上升。
图6 周循环和节假日对充电站负荷影响分析
图6b 中定义了差异率的概念,表示两个变量之间的差值占较小变量的比例,如式(10)所示。
式中:x,y为两个变量;xi、yi为第i个变量。本文计算了所有充电站节假日和工作日的每小时平均负荷,利用差异率公式得到两种日类型下的负荷差异率,绘制箱型图。如图6b 所示,充电站的差异率分布范围区间广,最大值超过1.7。这一情况的产生与充电站所处的地理位置密切相关,位于旅游景点、高速公路的充电站,其充电负荷常随着假期人流的增加而上升。因此,本文构建星期和节假日特征,以提高负荷预测精度。
3.1.4 历史负荷影响
历史负荷主要对短期负荷预测产生两方面的影响,一方面相似日的负荷值也会相似,另一方面待测负荷与其前某些时刻的负荷值存在变化趋势上的相似[33]。对此,本文基于会影响充电站负荷的衍生特征[34],提取10 个充电站预测时刻前k个时间步的负荷值(rolling_khour)、 平均负荷值(rolling_khour_mean)、负荷标准差(rolling_khour_std)、负荷的最大值(rolling_khour_max)和最小值(rolling_khour_min),以及过去n天内同一时刻的平均负荷(n_days_past_mean)、负荷标准差(n_days_past_std)作为分析指标,其中k的取值范围为[1,7]内的正整数,n的取值范围为[2,7]内的正整数,分析指标的具体表达形式见图7 的纵坐标。分别计算各个分析指标与当前负荷值的皮尔森相关性系数,并计算同一指标对应相关性系数的平均值,绘制历史负荷的相关性分析图,如图7 所示。观察可知,随着时间跨度的增大,前k时刻负荷相关统计量与当前负荷之间的相关性逐渐减弱,这符合常见的观点,即短周期内不同时刻的变量值之间的相关性随时间间隔的减小而增大。但在星期制度的影响下,前n天内同一时刻的统计量与当前负荷之间的相关性随着时间间隔的增大逐渐减弱,n为7 时相关性最大。为减少试验计算的工作量,本文选择皮尔森相关性系数大于0.6 的历史负荷影响因素作为输入特征。
图7 历史负荷与充电负荷的相关性分析
为展示基于GSTNN模型的多充电站负荷协同预测方法的性能,本文以中国某市城区内10个电动汽车充电站一年的历史数据作为数据集。每个充电站以小时为频率记录充电站的负荷,负荷单位为kW,一天记录24 条数据,全年共记录8 760 条数据。针对其中充电站负荷为0 的异常情况,如图8 中实线所示,利用异常时刻前一天同一时刻负荷和后一天同一时刻负荷的均值插补,插补后的结果如图8 中虚线所示。将数据集按照6∶2∶2 的比例,划分为训练集、验证集和测试集,邻接矩阵的阈值ε设置为0.5。
图8 处理前后数据对比
从准确性和泛化性两方面对本文模型进行评估。准确性方面,充电站负荷预测本质是一个回归问题,本文选择在机器学习和深度学习中广泛使用的均方误差(Mean Square Error,MSE)作为损失函数,利用归一化后的充电站数据计算损失值,评价模型预测的准确性。泛化性方面,由于本文是对多个充电站负荷进行协同预测,且不同充电站充电负荷变化范围具有较大差异,难以用以绝对误差为基准的指标量化评估模型的泛化性。所以本文选择加权平均百分比误差(Weighted Average Percentage Error,WAPE)作为评价指标,它侧重于相对误差的评估,且在充电站功率为零的情况下也能实现精准的计算。两种评价指标如式(11) ~(12)所示。
式中:n为测试样本数量;yi为第i个样本的真实值;为第i个样本的预测值。
3.3.1 图神经网络性能分析
预测结果与实际数据的对比是评价模型性能的直观体现,本文对充电站的实际负荷与预测负荷的拟合情况进行分析,图9展示了10个充电站的负荷拟合情况,可见预测负荷在负荷变化趋势上高度拟合实际负荷,直观体现了图神经网络预测的准确性。
损失曲线能有效反映模型在训练迭代过程中的损失变化情况,是评估模型性能的重要指标。预测模型试验的损失曲线如图10 所示,展示了训练集、验证集和测试集上损失值的变化情况。在前5 次训练中,3 种数据对应的损失值显著下降。随着训练次数的增加,损失值逐渐减小并趋近于0。这表明模型具备强大的学习能力,能快速适应数据并实现精确的预测。
3.3.2 充电站负荷预测方法对比
为更全面地评估基于GSTNN 模型的协同预测方法的实际预测能力,将其与使用RF、LightGBM、XGBoost、MLP、LSTM、GSTNN_nf 模型构成的充电负荷预测方法进行性能对比,其中,基于GSTNN 和GSTNN_nf 模型的协同预测方法能同时输出10 个充电站的预测结果,其余方法则需要单独预测每一个充电站的负荷。各充电站使用模型得到的预测结果所对应WAPE 值见表2。GSTNN 模型在其中7 个充电站上的预测上取得最优的预测效果,在剩余3 个充电站上取得次优的预测效果。在充电站2和充电站3上,仅有LightGBM模型表现出比GSTNN 模型更好的预测效果,在充电站7 上仅有RF 模型表现出比GSTNN 模型更好的预测效果。可见LightGBM模型和RF模型在充电站负荷预测上仍存在优势,但整体预测表现上仍是GSTNN 模型效果最优。并且使用GSTNN 模型对所有充电站进行预测时,所有充电站的WAPE 值均低于0.12。相比之下,其他模型存在最大WAPE 值超过0.22 的情况。由此可知,GSTNN 模型具有更强的泛化性能,能准确预测多个充电站的充电负荷。
表2 不同模型下充电站预测结果WAPE值
充电站负荷的准确预测是减少新能源汽车高速发展对电网影响的重要手段之一,本文针对现有充电站负荷预测方法难以同时考虑时空特征和外部特征影响的问题,提出一种基于GSTNN 模型的充电站负荷协同预测方法,该方法在充分考虑天气、日期、历史负荷等外部因素影响的同时,探索充电站负荷之间的时空关联,有效提高预测准确率。得出以下结论。
1)GSTNN 模型能实现多个站点的协同预测,相比只能实现单充电站预测的RF、LightGBM、XGBoost、MLP 和LSTM 模型和不考虑外部因素的GSTNN_nf 模型,具有更高的预测精度与更强的泛化性。在对10 个充电站的负荷预测试验中,GSTNN 模型在其中7 个充电站数据上得到最低的WAPE 值,在剩余3 个充电站数据也能得到次低的WAPE值,且整体误差率低于其他对比算法。
2)充电站之间地理位置关系是影响充电站负荷预测准确度的重要因素。GSTNN 模型凭借其对充电站之间地理位置关系的深入挖掘,获得了比对比模型更高的预测精度,体现出充电站之间的地理位置关系对于负荷预测的重要性。
3)GSTNN 模型存在不足,模型准确率在某些充电站数据上的预测效果不及LightGBM 和RF 模型,需要进行进一步优化。而且GSTNN 模型目前只能实现小范围充电站负荷的准确预测,需进一步探究提升其大范围充电站负荷预测的能力。本文采用的10 个充电站距离较近,随着充电站分布区域的扩大,GSTNN 模型的准确度会逐步下降。只考虑距离因素的邻接矩阵构建方式是造成该现象的原因之一,未来应进一步研究邻接矩阵的构建方法,扩大模型预测的范围,提升其学术价值与实际应用前景。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!