System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进聚类模型的电力负荷数据异常识别方法技术_技高网

一种基于改进聚类模型的电力负荷数据异常识别方法技术

技术编号:40706063 阅读:6 留言:0更新日期:2024-03-22 11:05
一种基于改进聚类模型的电力负荷数据异常识别方法,从电力营销系统抽取历史96点负荷数据,构成原始数据数据处理,并对数据做标准化处理,然后构建异常识别模型,采用基于动态时间弯曲DTW距离的DTWK‑means聚类模型进行异常识别,接着采用手肘法选取聚类数目,最后构建异常识别模型,形成DTWK‑means聚类模型,计算每个非聚类中心与聚类中心之间的DTW距离,按照距离将非聚类中心点分配聚类中心,再重新计算每个新簇的均值作为新的类簇中心,计算SSE的值,直到SSE值不再改变,聚类完成。本发明专利技术可以自动快速诊断和精准辨识异常数据,及时纠偏;且本发明专利技术的常识别模型可不断学习完善,保证异常识别更精准更快速,从而提升电力企业的工作效率,还可以降低电网系统的运营成本。

【技术实现步骤摘要】

本专利技术涉及数据检测领域,尤其涉及一种应用于电力系统的基于改进聚类模型的对电力负荷数据异常进行识别的方法。


技术介绍

1、目前,随着国家电网建设的稳步推进,用户侧智能电表也随之不断升级,用电信息采集系统的采集频率逐渐提高,加上种类繁多的电力数据被实时采集,形成了数据体量大、结构类型杂、分布范围广等特点,为电力数据高效处理及分析带来困难。

2、而用电信息采集系统作为电力公司重要数据来源之一,其应用范围也在迅速扩大,同时对数据质量的要求也在逐步增高。在复杂的设备运行环境、多样的数据传输通道下,数据质量管理显得尤为重要。因此,针对设备的偶发性故障与通信误码等原因造成的毛刺数据(即不正常的数据,如突然增高、短期内增大等,引起连接处理的阻塞,请求处理时间变长),远程信道不稳定、营销换表业务等原因引发的间歇性采集失败,需要特别定制数据质量治理及数据完整性还原预测方案。

3、实时准确的电力负荷数据能为电力企业系统规划、电力负荷预测、客户用能分析等方面提供了重要参考价值,而异常数据(异常数据,即异常负荷数据,是指受各种非量化因素影响,获取到的电力负荷值在某一采集时刻或一段采集区间内出现不满足曲线规律性,差异较为明显的变异型数据)的检测与修复则是负荷数据分析处理的首要条件,因此,如何高效准确地从海量负荷数据中检测和修复异常数据显的尤为重要。

4、而目前我国电力企业的异常用电检测几乎都是采用超出阈值预警排查或根据用电数据库规则推断的方法,这种现有技术下传统的排查方法往往存在准确率和效率较低等问题。

5、经过长时间的工作总结和反馈,随着智能电表的逐步普及以及电网信息采集系统中的数据快速增长,用电信息采集异常几率逐渐增大,同时终端异常用电数据累计也越来越多,庞大而复杂的数据采集系统结构与海量的数据流,使得大量异常信息被掩盖而无法得到有效的检测。随着电力行业的不断发展,电网生成的数据量也越来越庞大,出现的用电异常数据也越来越多样化,仅仅靠传统的方法有时无法准确的对这些异常数据进行识别

6、此外,现有技术下负荷异常识别过程中,系统数据异常判断规则往往采用监督学习算法,梳理采集异常类型,户表数据异常,对不同的研究对象都进行独立的建模,这种操作会带来建模的困难,进一步增大计算的复杂度。


技术实现思路

1、为了解决上述问题,并能更加精准的识别负荷异常,提升电力公司工作人员的工作效率,降低公司运营成本,本专利技术以用户96点历史负荷用电数据为基础,利用无监督学习的方法,结合dtw距离的思想,提出了一种基于改进聚类模型的电力负荷数据异常识别方法,该识别方法作为一种dtwk-means聚类算法,构建用电异常数据识别模型,能有效精准地识别/校正突变、缺失、冻结等异常电表负荷数据。

2、本专利技术的一种基于改进聚类模型的电力负荷数据异常识别方法,其具体步骤如下所述:

3、1)数据处理:

4、从电力营销系统抽取历史96点负荷数据,构成原始数据集。为了消除数据单位量级的影响,对获取原始96点负荷数据做标准化处理;

5、2)构建异常识别模型:

6、采用一种基于动态时间弯曲dtw距离的dtwk-means聚类模型,并将其应用于实际的96点负荷曲线的异常识别中,本步骤中分为动态时间弯曲dtw距离设计和异常判别阈值两部分;

7、本步骤目的在于,传统的k-means算法利用欧式距离衡量样本之间的相似度,但是欧式距离不能很好的衡量两条曲线之间的相似度,为了使得k-means聚类算法能够更好的应用于96点负荷数据的聚类,本专利技术对传统的k-means算法进行改进,以动态时间弯曲dtw距离代替欧式距离。

8、3)采用手肘法选取聚类数目k:

9、随着聚类数目k的增大,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和sse自然会逐渐变小;当k小于真实聚类数时,由于k的增大会大幅增加每个簇的聚合程度,故sse的下降幅度会很大;而当k到达真实聚类数时,再增加k所得到的聚合程度回报会迅速变小,sse的下降幅度会骤减,然后随着k值的继续增大而趋于平缓,即sse和k的关系图是一个手肘的形状,而这个肘部对应的k值就是数据的真实聚类数;

10、4)构建异常识别模型:

11、利用上述步骤3)的手肘法确定最佳聚类数目k,选取k个样本点作为初始聚类中心,形成dtwk-means聚类模型,计算每个非聚类中心与聚类中心之间的dtw距离,作为两者之间的相似度值,按照距离的大小将非聚类中心点分配聚类中心,重新计算每个新簇的均值作为新的类簇中心,计算sse的值,直到sse值不再改变,本步骤结束,聚类完成。

12、根据本专利技术的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤1)中的“对获取原始96点负荷数据做标准化处理”,其具体为,将原始数据集中的不同位置数据变换到[0,1]的范围之内,该数据标准化处理的公式如下:

13、

14、式中:

15、xi为某个指标的任意值,xmin为该指标的最小值,xmax为该指标的最大值。

16、根据本专利技术的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤2)的基于动态时间弯曲dtw距离的dtwk-means聚类模型中的动态时间弯曲dtw距离设计,具体如下:

17、动态时间弯曲dtw通过弯曲时间轴来更好地对时间序列形态进行匹配映射的相似性度量方法,动态时间弯曲dtw距离克服了时间序列之间直接比较两点的局限性,并能够很好的处理不同序列长度、平移和缩放等问题,该动态时间弯曲dtw距离的定义如下:

18、

19、式中:

20、qi和cj分别为时间序列q、c中的点;

21、ddtw(q,c)表示序列q和c的dtw距离;

22、d(qi,cj)表示qi和cj两点之间的欧氏距离。

23、根据本专利技术的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤2)的基于动态时间弯曲dtw距离的dtwk-means聚类模型中的异常判别阈值,其具体为:

24、聚类之后,每个簇的异常阈值确定公式为:

25、

26、式中:

27、为任意样本点到该簇聚类中心点的dtw距离;

28、q为该簇中任意样本点;

29、c为该簇的聚类中心点。

30、根据本专利技术的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤3)的采用手肘法选取聚类数目k,其具体为:

31、手肘法的核心指标为误差平方和sse,公式如下:

32、

33、式中:

34、ci是第i个簇;

35、p是ci中的样本点;

36、mi是ci的质心,即ci中所有样本的均值;

37、误差平方和sse是所本文档来自技高网...

【技术保护点】

1.一种基于改进聚类模型的电力负荷数据异常识别方法,其具体步骤如下所述:

2.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤1)中的“对获取原始96点负荷数据做标准化处理”,其具体为,将原始数据集中的不同位置数据变换到[0,1]的范围之内,该数据标准化处理的公式如下:

3.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤2)的基于动态时间弯曲DTW距离的DTWK-means聚类模型中的动态时间弯曲DTW距离设计,具体如下:

4.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤2)的基于动态时间弯曲DTW距离的DTWK-means聚类模型中的异常判别阈值,其具体为:

5.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤3)的采用手肘法选取聚类数目K,其具体为:

6.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤4)的构建异常识别模型,其中的DTWK-means聚类模型的执行过程分为:“输入:96点负荷数据”和“输出:K个分群结果”两部分。

7.如权利要求6所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的DTWK-means聚类模型的执行过程,其具体为:

8.如权利要求7所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤7.3)的计算每个非聚类中心与聚类中心的的DTW距离,该步骤中按照距离大小的原则,将非聚类中心点分配给最近的聚类中心点。

9.如权利要求7所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤7.6)中的聚类完成之后,计算每个簇中的任意样本点与簇中心点的DTW距离D,若D>av_DTW,则该样本点为异常点,反之则为正常点。

10.如权利要求7所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的每个簇的异常点均需要进行识别。

...

【技术特征摘要】

1.一种基于改进聚类模型的电力负荷数据异常识别方法,其具体步骤如下所述:

2.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤1)中的“对获取原始96点负荷数据做标准化处理”,其具体为,将原始数据集中的不同位置数据变换到[0,1]的范围之内,该数据标准化处理的公式如下:

3.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤2)的基于动态时间弯曲dtw距离的dtwk-means聚类模型中的动态时间弯曲dtw距离设计,具体如下:

4.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤2)的基于动态时间弯曲dtw距离的dtwk-means聚类模型中的异常判别阈值,其具体为:

5.如权利要求1所述的一种基于改进聚类模型的电力负荷数据异常识别方法,其特征在于,所述的步骤3)的采用手肘法选取聚类数目k,其具体为:

6.如权利要求1所述的一种基于改进聚类模型的...

【专利技术属性】
技术研发人员:许堉坤王婧骅蒋超俞钧朱铮刘畅赵婉茹段玉玮邵竞徐子涵王越陈慧怡
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1