一种基于分段斜率的负荷曲线形态聚类方法技术

技术编号:24579910 阅读:48 留言:0更新日期:2020-06-21 00:56
本发明专利技术涉及一种基于分段斜率的负荷曲线形态聚类方法,包括以下步骤:步骤S1:对智能电表的负荷分布进行采样,并对采样得到的负荷曲线进行特征处理;步骤S2:确定聚类的初始条件,根据负荷曲线数据来确定最优的

A clustering method of load curve shape based on segmented slope

【技术实现步骤摘要】
一种基于分段斜率的负荷曲线形态聚类方法
本专利技术涉及电力系统负荷数据聚类分析领域,特别是一种基于分段斜率的负荷曲线形态聚类方法。
技术介绍
随着智能电表普及程度的不断提高,电力企业积累了大量用户负荷数据。对这些负荷数据进行聚类分析可以将大量的计量数据转化为系统运行信息,从而提高智能配电网的可操作性。此外,聚类分析的结果也可以应用于需求侧管理、用户行为模式识别和电价设计。传统的K-means方法在负荷曲线聚类中得到了广泛的应用,该方法利用欧几里德距离被曲线间的相似性度量。然而欧几里德距离是一个绝对值距离,其无法准确区分曲线的升降趋势和幅度,而在电力系统运行中,曲线升降趋势和幅度代表了具体的用电行为,因此该方法需要进一步完善。部分专家提出了一些改进的方法,如将余弦相似性作为一种相似性度量方法或者利用离散小波变换对负荷曲线特征进行聚类。然而这些方法的核心仍然是欧几里德距离。它们以提高计算复杂度的代价实现了精度提升。此外,传统的K-means方法通常是通过人为主观设定分类组数或通过DBI、SSE等聚类评价指标来确定最优分类组数。前一种确定k值的方法的根据是使用者的经验,因此结果并不可靠,而后一种方法依赖于聚类评价指标,但聚类评价指标的种类非常多样,并且计算方法不一,因此该方法很可能会因为依据的指标不同导致结果不同。
技术实现思路
有鉴于此,本专利技术的目的是提出一种基于分段斜率的负荷曲线形态聚类方法,仅根据负荷曲线数据来确定分类组数和初始聚类中心,提高了电力系统中负荷聚类结果的稳定性和准确度。<br>本专利技术采用以下方案实现:一种基于分段斜率的负荷曲线形态聚类方法,包括以下步骤:步骤S1:对智能电表的负荷分布进行采样,并对采样得到的负荷曲线进行特征处理;步骤S2:确定聚类的初始条件,根据负荷曲线数据来确定最优的k个初始聚类中心;步骤S3:对各个负荷曲线,基于斜率进行形态相似性度量,并以此进行最终的聚类。进一步地,步骤S1具体包括以下步骤:步骤S11:对于一段由N个采样点构成的负荷曲线L={l1,l2,..,li,…,lN},li表示该曲线的第i个采样点的负荷值;负荷曲线L上第i个点和第i+1个点之间斜率si的集合表示为S={s1,s2,…si,...,s(N-1)};每个负荷曲线段的斜率方向ti用1,-1,0来表示,1表示斜率为正,曲线上升;-1表示斜率为负,曲线下降;0表示斜率为零,曲线无坡度,如下所示:用T={t1,t2,..,ti,…,t(N-1)}表示负荷曲线L中每个曲线分段的升降情况;步骤S12:负荷曲线a和负荷曲线b之间具有相同升降情况的曲线分段的数量d的计算方法如下:式中,Ta表示负荷曲线a的曲线分段升降情况集合,Tb表示负荷曲线b的曲线分段升降情况集合,表示负荷曲线a中第i个负荷曲线段的斜率方向,表示负荷曲线b中第i个负荷曲线段的斜率方向;当两条负荷曲线的d值越大时,曲线间的形态相似性越高。进一步地,步骤S2具体包括以下步骤:步骤S21:对于M条负荷曲线,根据式(2)计算任意两条负荷曲线之间的d值,构成矩阵E,矩阵E的第j列Ej表示负荷曲线j与其他负荷曲线之间的具有相同升降情况曲线段的数量,即Ej=[e1j,...,e(j-1)j,e(j+1)j,...,eMj],其中元素e1j表示负荷曲线1和负荷曲线j之间的d值;步骤S22:将矩阵Ej中的任一元素epj(p=1...M,p≠j)根据值的大小,从上到下降序排列;根据式(4)计算矩阵Ej的最大值偏差fj,并根据epj和fj,将矩阵Ej中的元素分为A~D四个区块:高相似区块A中,epj=max(Ej);相似区块B中,epj属于区间[max(Ej)–fj,max(Ej)];3)相异区块C中,epj属于区间[min(Ej),max(Ej)–fj]);4)高相异区块D中,epj=min(Ej);为了避免矩阵E中其他列对区块划分的影响,在式(5)中定义了全局偏差fta:式中,max(Ej)表示矩阵Ej中的最大值,即负荷曲线j与其他负荷曲线之间最大相同升降情况的曲线分段的数量,min(Ej)表示表示矩阵Ej中的最小值,即负荷曲线j与其他负荷曲线之间最小相同升降情况的曲线分段的数量;步骤S23:以矩阵E的max(epj)所在列对应的负荷曲线j作为第一个初始聚类中心,并根据聚类中心相异性原则以min(Ej)对应的负荷曲线作为第二个初始聚类中心;从矩阵E中移除属于第一个和第二个初始聚类中心的A、B区块的对应曲线,并从第二个聚类中心的D区块中找到最小值对应的负荷曲线作为第三个初始聚类中心;在剩余的负荷曲线里重复以上过程,直到某一初始负荷聚类中心的C、D区块内中没有负荷曲线为止,从而得到k个初始聚类中心。进一步地,步骤S3具体包括以下步骤:步骤S31:设负荷曲线q为某一初始聚类中心,表示负荷曲线a的第i个曲线段的斜率大小;式(6)表示负荷曲线a和初始聚类中心q之间的相似曲线段的平均差异度和相异曲线段的平均相异度式中,daq表示曲线a与曲线q之间具有相同升降情况的曲线分段的数量;当和的值越小时,两条曲线的形态越相近;分别计算负荷曲线a和k个初始聚类中心和分别得到最小值和步骤S32:利用式(7)和式(8)分别计算相似性平均偏差fs,ta和相异性平均偏差fd,ta;根据式(9)对初始聚类中心q的情况进行分类:集合X包含与负荷曲线a的相似曲线段具有最高相似度的初始聚类中心,集合Y包含与负荷曲线a的相异曲线段具有最高相异度的初始聚类中心;步骤S33:在实际中,负荷曲线段升降情况的差异反映了用户不同的用电行为,因此优先以相异曲线段的差异情况作为衡量指标,以便对相似的用电行为进行分类;设Z=X∩Y,若|Z|=1,则交叉点为最合适的结果;若|Z|=0,则初始聚类中心中具有的负荷曲线为最优结果;若|Z|>1,则交集部分中具有所对应的初始聚类中心为最优结果;将负荷曲线a分类到最优结果中,并对剩余待分类曲线执行同样的操作。与现有技术相比,本专利技术有以下有益效果:本专利技术避开了欧几里德距离的应用,而是提出利用曲线分段斜率作为相似性度量来实现负荷曲线形态聚类。与传统的K-均值算法和两种改进算法相比,本专利技术的方法通过捕捉智能计量负荷剖面的形状特征,极大程度地提高了聚类的精度和效率。具体实施方式下面结合实施例对本专利技术做进一步说明。应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其本文档来自技高网
...

【技术保护点】
1.一种基于分段斜率的负荷曲线形态聚类方法,其特征在于,包括以下步骤:/n步骤S1:对智能电表的负荷分布进行采样,并对采样得到的负荷曲线进行特征处理;/n步骤S2:确定聚类的初始条件,根据负荷曲线数据来确定最优的k个初始聚类中心;/n步骤S3:对各个负荷曲线,基于斜率进行形态相似性度量,并以此进行最终的聚类。/n

【技术特征摘要】
1.一种基于分段斜率的负荷曲线形态聚类方法,其特征在于,包括以下步骤:
步骤S1:对智能电表的负荷分布进行采样,并对采样得到的负荷曲线进行特征处理;
步骤S2:确定聚类的初始条件,根据负荷曲线数据来确定最优的k个初始聚类中心;
步骤S3:对各个负荷曲线,基于斜率进行形态相似性度量,并以此进行最终的聚类。


2.根据权利要求1所述的一种基于分段斜率的负荷曲线形态聚类方法,其特征在于,步骤S1具体包括以下步骤:
步骤S11:对于一段由N个采样点构成的负荷曲线L={l1,l2,..,li,…,lN},li表示该曲线的第i个采样点的负荷值;负荷曲线L上第i个点和第i+1个点之间斜率si的集合表示为S={s1,s2,…si,...,s(N-1)};每个负荷曲线段的斜率方向ti用1,-1,0来表示,1表示斜率为正,曲线上升;-1表示斜率为负,曲线下降;0表示斜率为零,曲线无坡度,如下所示:



用T={t1,t2,..,ti,…,t(N-1)}表示负荷曲线L中每个曲线分段的升降情况;
步骤S12:负荷曲线a和负荷曲线b之间具有相同升降情况的曲线分段的数量d的计算方法如下:






式中,Ta表示负荷曲线a的曲线分段升降情况集合,Tb表示负荷曲线b的曲线分段升降情况集合,表示负荷曲线a中第i个负荷曲线段的斜率方向,表示负荷曲线b中第i个负荷曲线段的斜率方向;当两条负荷曲线的d值越大时,曲线间的形态相似性越高。


3.根据权利要求2所述的一种基于分段斜率的负荷曲线形态聚类方法,其特征在于,步骤S2具体包括以下步骤:
步骤S21:对于M条负荷曲线,根据式(2)计算任意两条负荷曲线之间的d值,构成矩阵E,矩阵E的第j列Ej表示负荷曲线j与其他负荷曲线之间的具有相同升降情况曲线段的数量,即Ej=[e1j,...,e(j-1)j,e(j+1)j,...,eMj],其中元素e1j表示负荷曲线1和负荷曲线j之间的d值;
步骤S22:将矩阵Ej中的任一元素epj(p=1...M,p≠j)根据值的大小,从上到下降序排列;根据式(4)计算矩阵Ej的最大值偏差fj,并根据epj和fj,将矩阵Ej中的元素分为A~D四个区块:高相似区块A中,epj=max(Ej);相似区块B中,epj属于区间[max(Ej)–fj,max(Ej)];3)相异区块C中,epj属于区...

【专利技术属性】
技术研发人员:洪居华林毅王宽朱嘉远沈豫项康利郑欢刘林洪兰秀李源非马梓涵
申请(专利权)人:国网福建省电力有限公司经济技术研究院国网福建省电力有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1