多距离聚类与信息聚合的负荷区间预测方法、系统及介质技术方案

技术编号:36127128 阅读:63 留言:0更新日期:2022-12-28 14:34
本发明专利技术公开了一种基于多距离聚类与信息聚合的负荷区间预测方法、系统及介质。该方法包括将归一化后的负荷曲线数据通过基于多距离的K

【技术实现步骤摘要】
多距离聚类与信息聚合的负荷区间预测方法、系统及介质


[0001]本专利技术属于电力负荷预测的
,具体涉及一种多距离聚类与信息聚合的负荷区间预测方法、系统及介质。

技术介绍

[0002]对于负荷预测问题,可通过预测形式的不同分为确定性预测和概率性预测。确定性预测的结果为预测对象在未来时刻的单点期望值,而概率预测则以概率分布或置信区间的形式给出未来时刻的预测结果,有效实现对预测不确定性的量化分析。与确定性预测相比,概率预测能够为电力系统提供更丰富准确的不确定性信息。
[0003]罗凤章,张旭,杨欣,等.基于深度学习的综合能源配电系统负荷分析预测[J].高电压技术,2021,47(01):23

32.构建了基于卷积神经网络与支持向量回归的负荷预测模型,卷积神经网络用于提取数据隐含特征,得出了较为精确的预测结果。李丹,张远航,杨保华,等.基于约束并行LSTM分位数回归的短期电力负荷概率预测方法[J].电网技术,2021,45(04):1356

1364.提出了基于约束并行长短期记忆(LSTM)神经网络的分位数回归预测方法,其将LSTM与分位数相结合,并考虑分位数预测值间的约束关系,得到了较好的概率预测结果。张淑清,李君,姜安琦,等.基于FPA

VMD和BiLSTM神经网络的新型两阶段短期电力负荷预测[J].电网技术,2022,46(08):3269

3279.结合优化变分模态分解与双向长短时记忆神经网络(BiLSTM)提出了一种两阶段负荷预测方法,该方法利用了BiLSTM网络挖掘数据时序特征的优势,并通过算例验证了其有效性。黄南天,刘德宝,蔡国伟,等.基于多相关日场景生成的电动汽车充电负荷区间预测[J].中国电机工程学报,2021,41(23):7980

7990.在预测前引入场景生成方法,使场景特征表达更为丰富,从而进一步提高了预测模型的精度。肖白,聂鹏,穆钢,等.基于多级聚类分析和支持向量机的空间负荷预测方法[J].电力系统自动化,2015,39(12):56

61.]提出了基于多级聚类与支持向量机的负荷预测方法,其根据各属性对元胞负荷进行多级聚类,得到了较精确的预测结果。
[0004]但是由于日负荷曲线的变化规律并不统一,上述文献仅用模型学习所有负荷曲线变化规律将导致模型训练不够理想、预测结果精度较低等问题。

技术实现思路

[0005]本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种多距离聚类与信息聚合的负荷区间预测方法、系统及介质。
[0006]为了达到上述目的,本专利技术采用以下技术方案:
[0007]本专利技术的一个方面,提供了一种多距离聚类与信息聚合的负荷区间预测方法,包括下述步骤:
[0008]将归一化后的负荷曲线数据通过基于多距离的K

means算法进行聚类,得到k类曲线集合结果;
[0009]对于第i类结果,将其与对应的气象数据分为训练集与测试集;
[0010]将训练集与测试集并分别输入日内局部波动概率预测模型与日内整体趋势概率预测模型进行训练,得到参数更新完毕的日内局部波动概率预测模型与日内整体趋势概率预测模型;
[0011]将两模型的测试集特征值分别输入,得到t分位数下的两模型区间上下限;
[0012]将两模型的预测区间上限与区间下限分别进行信息聚合,通过Choquet积分聚合函数计算出聚合后的预测区间。
[0013]作为优选的技术方案,所述基于多距离的K

means算法,具体为:
[0014](1)输入需要聚类的等长曲线样本数据集S,S={s1,s1,

,s
i
,s
h
},其中s
i
为第i条曲线样本;
[0015](2)在S中随机选取k个不同的样本作为K

means的初始聚类中心;
[0016](3)遍历所有样本,通过下式计算第i个样本与所有聚类中心的距离大小D
total
(X,Y),并将其归入与该样本距离最小的一类中;
[0017]D
total
(X,Y)=r1D1(X,Y)+r
2 D2(X,Y)+r
3 D3(X,Y)
[0018]其中,D1(X,Y)为采用欧式距离计算得出的两样本对应采样点的距离大小,D2(X,Y)为采用DTW距离计算得出的两样本对应采样点的距离大小,D3(X,Y)为先采用前项差分法再计算DTW距离得出的两样本对应采样点的距离大小;
[0019]r1、r2和r3分别为三种距离对应的权重,采用熵权法来确定其权值;
[0020](4)遍历所有类别,重新计算该类别的聚类中心,若当前聚类中心相较于上一次聚类有改变,则重复步骤(3)、(4),直至聚类中心不发生改变为止,输出聚类结果。
[0021]作为优选的技术方案,所述基于多距离的K

means算法采用DBI指标衡量聚类效果,并给出指标最好的聚类个数作为K值;所述DBI指标I
DBI
具体为:
[0022][0023]式中,A
i
为第i个聚类中心,为第i个类内样本到聚类中心的平均距离,为第j个类内样本到聚类中心的平均距离,其代表类内各曲线的分散程度,计算公式为:
[0024][0025]式中,T
i
第i类样本个数,X
i,l
为第i类第l个样本。
[0026]作为优选的技术方案,所述日内局部波动概率预测模型为BiLSTM,包括前向LSTM网络与后向LSTM网络,并在网络最后加入分位数回归层;
[0027]所述分位数回归层的回归模型为:
[0028][0029]式中,Q
M
(τ|V)为响应变量M的第τ个条件分位数;c为解释变量V的个数;β0为截距,
β
i
(τ)为τ分位数下的回归系数向量,i的取值范围为1到c,通过求解下式的优化问题得到:
[0030][0031]其中,V

=[1V

i
]为解释变量列向量。
[0032]所述分位数回归层的τ分位数下的响应变量为:
[0033][0034]式中:H为隐含层的单元个数;f为输出层激活函数;h
j
(τ)为LSTM隐藏层的输出;W
j
(τ(、b(τ)为输出层的权重与偏置。
[0035]作为优选的技术方案,所述日内整体趋势概率预测模型为高斯回归过程模型,通过学习输入的日气象数据与输出的日内每个采样点的真实负荷数值之间的映射关系,得到反映该场景下日内负荷整体趋势且匹配预测日气象数据的区间预测结果,具体为:
[0036]对于包含n个样本的训练集,输入特征矩阵为X=[x1,x2,
...

【技术保护点】

【技术特征摘要】
1.多距离聚类与信息聚合的负荷区间预测方法,其特征在于,包括下述步骤:将归一化后的负荷曲线数据通过基于多距离的K

means算法进行聚类,得到k类曲线集合结果;对于第i类结果,将其与对应的气象数据分为训练集与测试集;将训练集与测试集并分别输入日内局部波动概率预测模型与日内整体趋势概率预测模型进行训练,得到参数更新完毕的日内局部波动概率预测模型与日内整体趋势概率预测模型;将两模型的测试集特征值分别输入,得到t分位数下的两模型区间上下限;将两模型的预测区间上限与区间下限分别进行信息聚合,通过Choquet积分聚合函数计算出聚合后的预测区间。2.根据权利要求1所述的多距离聚类与信息聚合的负荷区间预测方法,其特征在于,所述基于多距离的K

means算法,具体为:(1)输入需要聚类的等长曲线样本数据集S,S={s1,s1,

,s
i
,s
h
},其中s
i
为第i条曲线样本;(2)在S中随机选取k个不同的样本作为K

means的初始聚类中心;(3)遍历所有样本,通过下式计算第i个样本与所有聚类中心的距离大小D
total
(X,Y),并将其归入与该样本距离最小的一类中;D
total
(X,Y)=r1D1(X,Y)+r2D2(X,Y)+r3D3(X,Y)其中,D1(X,Y)为采用欧式距离计算得出的两样本对应采样点的距离大小,D2(X,Y)为采用DTW距离计算得出的两样本对应采样点的距离大小,D3(X,Y)为先采用前项差分法再计算DTW距离得出的两样本对应采样点的距离大小;r1、r2和r3分别为三种距离对应的权重,采用熵权法来确定其权值;(4)遍历所有类别,重新计算该类别的聚类中心,若当前聚类中心相较于上一次聚类有改变,则重复步骤(3)、(4),直至聚类中心不发生改变为止,输出聚类结果。3.根据权利要求1所述的多距离聚类与信息聚合的负荷区间预测方法,其特征在于,所述基于多距离的K

means算法采用DBI指标衡量聚类效果,并给出指标最好的聚类个数作为K值;所述DBI指标I
DBI
具体为:式中,A
i
为第i个聚类中心,为第i个类内样本到聚类中心的平均距离,为第j个类内样本到聚类中心的平均距离,其代表类内各曲线的分散程度,计算公式为:式中,T
i
第i类样本个数,X
i,l
为第i类第l个样本。4.根据权利要求1所述的多距离聚类与信息聚合的负荷区间预测方法,其特征在于,所
述日内局部波动概率预测模型为BiLSTM,包括前向LSTM网络与后向LSTM网络,并在网络最后加入分位数回归层;所述分位数回归层的回归模型为:式中,Q
M
(τ|V)为响应变量M的第τ个条件分位数;c为解释变量V的个数;β0为截距,β
i
(τ)为τ分位数下的回归系数向量,的取值范围为1到c,通过求解下式的优化问题得到:其中,V

=[1 V

i
]为解释变量列向量;所述分位数回归层的τ分位数下的响应变量为:式中:H为隐含层的单元个数;f为输出层激活函数;h
j
(τ)为LSTM隐藏层的输出;W
j
(τ)、b(τ)为输出层的权重与偏置。5.根据权利要求1所述的多距离聚类与信息聚合的负荷区间预测方法,其特征在于,所述日内整体趋势概率预测模型为高斯回归过程模型,通过学习输入的日气象数据与输出的日内每个采样点的真实负荷数值之间的映射关系,得到反映该场景下日内负荷整体趋势且匹配预测日气象数据的区间预测结果,具体为:对于包含n个样本的训练集,输入特征矩阵为X=[x1,x2,

,x
n
]
T
,x
n
为第n个样本的输入向量,其长度为d,对应的输出响应为y=[y1,y2,

,y
n
]
T
,y
n
为第n个输出响应值;定义f(X)为x
n
对应的函数f(x1),f(x2),

,f(x
n
)构成的随机变量集合,且服从联合高斯分布,其高斯过程表示为:f(x):GP(m(x),k(x,x

))式中,x,x

均为随机变量,m(x)为均值函数,k(x,x...

【专利技术属性】
技术研发人员:岳首志洪海生邓祺许陈德罗锋
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1