一种基于智能电表用户聚类分析的配电网负荷预测方法技术

技术编号:21363022 阅读:75 留言:0更新日期:2019-06-15 09:40
一种基于智能电表用户聚类分析的配电网负荷预测方法,其特征是,包括:分析智能电表用户的负荷波动性,按照波动程度将一天24小时分成3个波动程度有差异的时段;确定预测器输入特征集,并分析该特征集合下,不同用户的特征重要度;以特征重要度集合描述用户差异,并对用户进行SDCKM聚类,将输入特征具有相似响应程度的用户分为一类,日内不同配网总负荷波动程度时段最优聚类结果采用统计实验确定;选取基于集成学习的随机森林预测器,针对不同波动程度时段最优聚类结果,分别构建滚动预测模型。解决了聚类中心初始点选取具有随机性,容易陷入局部最优的问题,降低了滚动预测模型的预测误差,提高基于智能电表用户的配电网负荷预测精度。

A Distribution Network Load Forecasting Method Based on Cluster Analysis of Smart Meter Users

A load forecasting method for distribution network based on cluster analysis of smart meter users is presented. Its characteristics include: analyzing the load fluctuation of smart meter users, dividing 24 hours a day into three periods with different fluctuation degrees according to the fluctuation degree; determining the input feature set of the predictor, and analyzing the feature importance of different users under the feature set; describing the feature importance set with the feature importance set; User differences are clustered by SDCKM, and users with similar input characteristics are classified into one group. The optimal clustering results for different periods of total load fluctuation are determined by statistical experiments. Random forest predictors based on ensemble learning are selected to construct rolling prediction models for different periods of fluctuation. It solves the problem that the initial point selection of cluster center is random and easy to fall into local optimum, reduces the prediction error of rolling prediction model, and improves the load forecasting accuracy of distribution network based on smart meter users.

【技术实现步骤摘要】
一种基于智能电表用户聚类分析的配电网负荷预测方法
本专利技术涉及电气
,是一种基于智能电表用户聚类分析的配电网负荷预测方法。
技术介绍
负荷预测对于实现经济最优化调度、安全运行和分布式可再生清洁能源消纳起着至关重要的作用。配电网日前负荷预测准确性直接影响配电系统的经济和安全运行。相较于传统负荷预测,配网日前负荷预测具有波动性强、待预测区域内配网用户构成复杂、用户用电行为差异性大等特点,预测难度更高。智能电表(SmartMeter,SM)采集的用户用电数据为海量用户的负荷特性分析提供了数据基础。能够在大数据挖掘基础上,对海量用户开展聚类分析,并对聚类后的每类用户针对性构建不同预测模型。通过降低类内用户差异,进一步提升模型预测精度。目前智能电表用户聚类大多根据用户的负荷曲线或统计负荷特征对用户进行聚类,受用户用电量影响,难以保证类内的用户对预测器输入特征具有相似的响应,且难以分析非负荷类特征对未来用电负荷的影响。同时,未分析不同时段待预测总负荷波动程度对该时段内用户最优聚类数的影响。并且聚类中心初始点选取具有随机性,容易陷入局部最优。
技术实现思路
本专利技术的目的在于,克服现有技术的限制和缺陷,提供一种科学合理,适用性强,效果佳的基于智能电表用户聚类分析的配电网负荷预测方法。本专利技术的目的是由以下技术方案来实现的:一种基于智能电表用户聚类分析的配电网负荷预测方法,其特征是,它包括以下步骤:1)分析智能电表用户的负荷波动性,按照波动程度将一天24小时分成3个波动程度有差异的时段以标准差σ来体现用户用电的波动性,其公式为:式中,σ(t)表示在t时刻的标准差,n表示SM的个数,n=1,2,…,N;t代表每个时刻,t=1,2,…,48,Ln(t)为第n个SM在t时刻的负荷值;2)确定预测器输入特征集,并分析该特征集合下,不同用户的特征重要度RReliefF重要度分析的数学模型为:NdL=NdL+diff(L,Ri,Ij)·d(i,j)NdF(F)=NdF(F)+diff(F,Ri,Ij)·d(i,j)NdL·dF(F)=NdL·dF(F)+diff(L,Ri,Ij)·diff(F,Ri,Ij)·d(i,j)式中,Ri(i=1,...,m)是随机抽取一个样本,m即为人为设定的随机抽取样本Ri的次数,Ij(j=1,...,k)是Ri的k个近邻样本,k为迭代次数,NdL为不同样本的负荷值L权重,NdF(F)是预测特征F的权重,NdL·dF(F)为负荷值L加特征F权重,diff(L,Ri,Ij)和diff(F,Ri,Ij)分别计算的是样本Ri和Ij在负荷值L和特征F上的差;d(i,j)则是计算了样本Ri和Ij之间的距离,在此基础上,循环抽取m次Ri计算得到每一个特征的权重,即特征的重要度;3)以特征重要度集合描述用户差异,并对用户进行SDCKM聚类,将输入特征具有相似响应程度的用户分为一类,日内不同配网总负荷波动程度时段最优聚类结果采用统计实验确定;①聚类算法通过分析挖掘整个数据集,提取数据之间的相似性和差异性,聚类的数学模型为:式中,X={xq},q=1,2,...,Q,xq表示数据集中需要进行聚类的Q个对象,ck为第k类中的数据集,共有K类,代表ck的平均值,J为所有类的平方误差和;②K-Means算法首先初始化K个聚类中心;之后,计算集合中每一个样本到K个聚类中心的欧式距离Euc(xq,vk)并将样本划分到距离指标最小的那一类当中,欧式距离公式:式中,vk为ck的聚类中心,Euc(xq,vk)为每一个样本到K个聚类中心vk的欧式距离;③S_Dbw的数学模型:S_Dbw(k)=Scat(k)+Dens_bw(k)其中,Scat(k)为第k类的平均分散值,Dens_bw(k)为第k簇的簇内密度;④以乌鸦算法对聚类中心初始点寻优,M只乌鸦会为搜索到更好的食物位置在待解决问题决策变量维度中移动,所以该决策变量的维度是聚类中心初始点的维度,即聚类数k。每只乌鸦的位置与记忆用矩阵LOC、MEM:式中,第i(i=1,2,...,M)只乌鸦在第m(m=1,2,...,MCN)次迭代中的位置以li,m代表,并且每只乌鸦将自己隐藏食物的位置保存在记忆向量mei,m中;在第m次迭代中,乌鸦j返回食物地点mej,m时,乌鸦i跟随乌鸦j并发现位置,这时,乌鸦j发现并更换食物地点的概率为P,乌鸦i的位置更新为:式中,Fitness()代表适应度函数,λi与λj为[0,1]服从均匀分布的随机数,fl为飞行距离,如果新位置的适应度函数数值优于原位置数值代表方案可行需更新位置,反之不进行位置更新;4)聚类后,日内不同配网总负荷波动程度时段最优聚类结果采用统计实验确定在确定新聚类方法可行之后,以预测器的最终预测结果MAPE(meanabsolutepercentageerror,MAPE)为最优聚类数的评价指标,MAPE为:式中,nt为预测值的个数(nt=1,2,…,Nt);Lr为真实负荷值;Lp则为预测负荷值;5)选取基于集成学习的随机森林预测器,针对不同波动程度时段最优聚类结果,分别构建滚动预测模型随机森林预测模型为:{h(x,Θd),d=1,2,...,D}式中,h(x,Θd)代表构成随机森林的第d棵决策树Θ,x为决策树的输入向量,每个Θ是独立分布的,代表抽取随机森林中第d棵树样本数据和决策树生长的随机过程;在进行预测时,依据模型中所有决策树的输出,能够获得最终预测的结果yp,式中,D代表RF中树的个数;ypd为第d棵树的预测结果。本专利技术的一种基于智能电表用户聚类分析的配电网负荷预测方法,通过分析智能电表用户的负荷波动性,按照波动程度将一天24小时分成3个波动程度有差异的时段;确定预测器输入特征集,并分析该特征集合下,不同用户的特征重要度;以特征重要度集合描述用户差异,并对用户进行SDCKM聚类,将输入特征具有相似响应程度的用户分为一类,日内不同配网总负荷波动程度时段最优聚类结果采用统计实验确定;选取基于集成学习的随机森林预测器,针对不同波动程度时段最优聚类结果,分别构建滚动预测模型。一方面,克服了传统聚类方法难以分析非负荷特征对聚类影响的不足,通过对聚类中心初始点选取进行优化,降低随机选取聚类初始中心点对聚类效果的影响;另一方面,考虑了不同时段用户用电波动性差异,将24小时分为波动性不同的时段,进行聚类并针对性建模,显著提高整体预测精度,并且随机森林预测器不受维度灾害影响,通过扩充历史负荷特征维度,可有效降低滚动预测模型误差。具有科学合理,适用性强,效果佳等优点。附图说明图1为实施例的基于智能电表用户聚类分析的配电网负荷预测方法流程图;图2为实施例的基于智能电表用户聚类分析的配电网负荷预测方法中智能电表用户总负荷的波动性与数据箱线图;图3为实施例的基于智能电表用户聚类分析的配电网负荷预测方法中各时段的最优聚类数统计图;图4为实施例的基于智能电表用户聚类分析的配电网负荷预测方法中工作日与非工作日下的负荷预测误差箱线图。具体实施方式下面利用附图和实施例对本专利技术更全面地进行描述。参考图1,本专利技术的一种基于智能电表用户聚类分析的配电网负荷预测方法,包括以下步骤:步骤S101,分析智能电表用户的负荷波动性,按照波动程度将一天24小时分成3个波动本文档来自技高网...

【技术保护点】
1.一种基于智能电表用户聚类分析的配电网负荷预测方法,其特征是,它包括的步骤有:1)分析智能电表用户的负荷波动性,按照波动程度将一天24小时分成3个波动程度有差异的时段以标准差σ来体现用户用电的波动性,其公式为:

【技术特征摘要】
1.一种基于智能电表用户聚类分析的配电网负荷预测方法,其特征是,它包括的步骤有:1)分析智能电表用户的负荷波动性,按照波动程度将一天24小时分成3个波动程度有差异的时段以标准差σ来体现用户用电的波动性,其公式为:式中,σ(t)表示在t时刻的标准差,n表示SM的个数,n=1,2,…,N;t代表每个时刻,t=1,2,…,48,Ln(t)为第n个SM在t时刻的负荷值;2)确定预测器输入特征集,并分析该特征集合下,不同用户的特征重要度RReliefF重要度分析的数学模型为:NdL=NdL+diff(L,Ri,Ij)·d(i,j)NdF(F)=NdF(F)+diff(F,Ri,Ij)·d(i,j)NdL·dF(F)=NdL·dF(F)+diff(L,Ri,Ij)·diff(F,Ri,Ij)·d(i,j)式中,Ri(i=1,...,m)是随机抽取一个样本,m即为人为设定的随机抽取样本Ri的次数,Ij(j=1,...,k)是Ri的k个近邻样本,k为迭代次数,NdL为不同样本的负荷值L权重,NdF(F)是预测特征F的权重,NdL·dF(F)为负荷值L加特征F权重,diff(L,Ri,Ij)和diff(F,Ri,Ij)分别计算的是样本Ri和Ij在负荷值L和特征F上的差;d(i,j)则是计算了样本Ri和Ij之间的距离,在此基础上,循环抽取m次Ri计算得到每一个特征的权重,即特征的重要度;3)以特征重要度集合描述用户差异,并对用户进行SDCKM聚类,将输入特征具有相似响应程度的用户分为一类,日内不同配网总负荷波动程度时段最优聚类结果采用统计实验确定;①聚类算法通过分析挖掘整个数据集,提取数据之间的相似性和差异性,聚类的数学模型为:式中,X={xq},q=1,2,...,Q,xq表示数据集中需要进行聚类的Q个对象,ck为第k类中的数据集,共有K类,代表ck的平均值,J为所有类的平方误差和;②K-Means算法首先初始化K个聚类中心;之后,计算集合中每一个样本到K个聚类中心的欧式距离Euc(xq,vk)并将样本划分到距离...

【专利技术属性】
技术研发人员:黄南天王文婷蔡国伟杨冬锋黄大为杨德友孔令国王燕涛杨学航包佳瑞琦吴银银张祎祺李宏伟陈庆珠刘宇航张良刘博
申请(专利权)人:东北电力大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1