一种改进的k-means异常负荷检测方法及系统技术方案

技术编号:33135450 阅读:25 留言:0更新日期:2022-04-17 00:59
本发明专利技术公开了一种改进的k

【技术实现步骤摘要】
一种改进的k

means异常负荷检测方法及系统


[0001]本专利技术涉及电力系统数据处理
,具体地说是一种改进的k

means异常负荷检测方法及系统。

技术介绍

[0002]目前,电力系统的迅速发展和电力改革的不断推进,使得电网结构和运行方式变得越来越复杂。配电网作为电网中重要的一环,不仅有着分布广、运行复杂以及规模大的特点,而且对于电力用户来说,配电网的安全运行是获得可靠高质量电能的关键。在配电网中,用户繁多,数据质量参差不齐。用户的负荷数据是否可靠准确,极大程度上影响着我国电力行业的进步与发展。但随着配电网数据规模的增大、量测系统的不完善以及传输通道的影响,电力负荷数据不可避免地会发生一些异常现象,如缺失点、连续零值、连续固定值、突增点、突降点、噪声异常负荷点等等。这些异常负荷不仅会对配电网的控制分析造成影响,更严重的是,电力系统调度员基于这些异常负荷产生的不正确判断有很大可能破坏系统的正常运行,进而破坏电力系统的安全稳定。为了保障电力系统安全运行与配电网的优化控制,对这些异常数据的检测是十分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种改进的k

means异常负荷检测方法,其特征在于,包括步骤:1)获取配电网负荷数据,得到负荷数据集;2)标准化处理负荷数据集,去除量纲对聚类的影响;并计算负荷数据集不同维度的权重;3)利用手肘法确定聚类个数K,并记录最佳聚类个数K时的聚类结果作为第一次聚类结果;4)计算每个数据之间的加权相异度,并计算相异度参数、总体数据的平均相异度以及总体数据的平均相异度参数,根据相异度参数剔除离群点;根据聚类中心与其他点相异度参数较大的原则,找出K个初始聚类中心;5)将聚类个数K与K个初始聚类中心输入到k

means算法中,利用k

means算法输出聚类结果;6)异常数据判定。2.根据权利要求1所述的一种改进的k

means异常负荷检测方法,其特征在于,步骤1)的具体内容为:采集配电网每个用户的日负荷数据,假设为n个,每1h为一点,即每日包含24个采样点的日负荷,作为负荷数据集X;将负荷数据集X转化为矩阵形式,行代表不同用户的日负荷数据,列代表不同时刻的负荷,数据维度为n
×
24。3.根据权利要求2所述的一种改进的k

means异常负荷检测方法,其特征在于,步骤2)中,负荷数据集不同维度的权重计算过程如下:21)计算维度权重P
ij
为第i个样本第j列属性占的比重,x
ij
为负荷数据集X的第i行第j列数据样本;22)计算信息熵E
j
为第j列属性的信息熵;23)计算权重w
j
为第j列属性的权重,0≤w
j
≤1,m代表24个时刻。4.根据权利要求1所述的一种改进的k

means异常负荷检测方法,其特征在于,步骤3)的具体内容如下:假设负荷数据集X分为K类,K取值范围在1至之间,对每一个K值进行k

means聚类,k

means聚类具体过程如下:首先k

means聚类会随机选择K个数据作为随机初始聚类中心c
i
,i=1,...K;然后通过计算每一个数据到每一个聚类中心的欧式距离,公式如下:
x
p
代表第p个用户负荷数据,c
i
代表随机初始聚类中心,j代表不同时刻,m代表24个时刻;根据类内距离最小化原则,将每一个数据划入到离它距离最近的类中,然后计算每个聚类中心的新值,公式如下:其中,c

i
代表新的聚类中心,M
p
代表第p个聚类,|M
p
|代表M
p
聚类中的数据的个数,p=1,2,...n,x代表第p个聚类中的数据,直到聚类中心不再发生变化为止,最后输出聚类结果;SSE公式如下:最后记录K与SSE的数据,并形成关系图,选取肘部对应的K作为最佳聚类数,记录最佳聚类个数K时的聚类结果为第一次聚类结果。5.根据权利要求3所述的一种改进的k

means异常负荷检测方法,其特征在于,步骤4)的具体内容如下:41)计算相异度式中,x
is
第i个用户第s时刻样本数据,x
js
代表第j个用户第s时刻样本数据;r
(s)ij
代表第i个用户与第j个用户在s时刻的相异度;x
rs
是所有用户的负荷在s时刻的所有值;42)计算样本数据x
i
与x
j
之间的加权相异度r
ij
式中,w
s
为s时刻的权重,w
s
乘上i用户与j用户在s时刻的相异度,得到i用户与j用户在s时刻的加权相异度,p代表24个时刻;43)得到相异度矩阵44)计算每个数据的相异度参数S
i
以及总体数据的平均相异度mean.r
式中,δ(z)是定义的函数;45)计算总体数据相异度参数平均值mean.S46)确定离群点,确定K个聚类中心S
t
<β*mean.S,其中,S
t
为异常数据的相异度参数,β∈(0,1);若满足以上公式则视为离群点之后,然后将负荷数据集X分为正常数据集U和离群数据集V,将正常数据集U中相异度参数S最大的数据点作为第一个初始聚类中心,然后将与该数据点之间的相异度小于平均相异度的所有数据点从U中删除,将剩下的数据点形成一个新的数据空间U*;然后再进行41)

...

【专利技术属性】
技术研发人员:陈峰陆海清郭云鹏叶炯章姝俊周升彧张晓周兴华张慧敏李磐旎华文陆承宇吴俊王松陆翌
申请(专利权)人:国网浙江省电力有限公司北京中恒博瑞数字电力科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1