一种负荷异常值识别方法技术

技术编号:23892312 阅读:17 留言:0更新日期:2020-04-22 06:58
本发明专利技术涉及电力负荷数据挖掘技术领域,具体地说,涉及一种负荷异常值识别方法。其包括以下步骤:对负荷曲线进行用电模式分类;对属于正常用电模式的负荷曲线进行负荷水平分类;构建异常负荷数据域,对属于正常用电模式的负荷曲线异常值识别;利用上述异常负荷数据域的最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域,对属于异常用电模式的负荷曲线进行负荷异常值识别。本发明专利技术基于空间密度聚类法和K中心聚类法,可以对负荷数据进行合理分类,方便处理不同的用电模式以及相同用电模式下不同的负荷水平。中心极限定理和四分位差构建异常负荷数据域的方法,可以根据要求的置信度,灵活的调整异常负荷数据域的范围。

A method of identifying abnormal load value

【技术实现步骤摘要】
一种负荷异常值识别方法
本专利技术涉及电力负荷数据挖掘
,具体地说,涉及一种负荷异常值识别方法。
技术介绍
智能电表地安装使电力用户负荷记录由电量变为时序负荷曲线,与电量相比,电力时序负荷曲线中包含了用户在各时刻的用电行为和负荷水平信息。作为电能供应商提供能量管理服务和用户自身进行需求侧响应的重要依据,电力负荷曲线中的异常负荷值往往会对上述决策产生重大的影响。由于采集的电力负荷曲线中包含有海量数据,通过人工的方式很难实现对异常负荷值的准确识别,需要开发面向大规模数据的异常负荷值识别方法。由于电力负荷的分布未知,箱线图在异常值识别中获得了较广泛的应用。通过对数据本身所提供的最大值、最小值、上四分、中位数位数、下四分位数进行分析,基于四分位差,构建异常数据域,对异常负荷值进行识别。该方法简单易用,不会因为数据规模的增加而变得复杂。箱线图的主要不足之处在于,构建的异常数据域没有考虑负荷值在各时刻的局部密度特性。为了解决该问题,通常提前假设负荷数据所满足的分布特性,然后根据相应的累计密度函数来构建不同置信度下的异常负荷数据域;或者利用分布检验的方法对负荷数据的分布情况进行验证,在假设被接受后,通过累计密度函数构建不同置信度下的异常负荷数据域。上述解决方法存在以下问题:对于直接假定负荷数据分布的情况,由于用户的用电行为存在很大的随机性,用电行为会随着时间的推移和外部环境的变化而发生改变,很难准确的给出负荷数据的分布;对于先假设分布,然后进行分布检验,由于负荷数据中可能存在负荷异常值,在没有进行异常值识别之前,分布检验过程可能受到异常数据的影响,所以检验结果并不可靠。
技术实现思路
本专利技术的目的在于提供一种负荷异常值识别方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,一方面,本专利技术提供一种负荷异常值识别方法,包括以下步骤:步骤1:基于空间密度聚类法,对负荷曲线进行用电模式分类,分为正常用电模式和异常用电模式;步骤2:基于K中心聚类法,对正常用电模式进行负荷水平分类;步骤3:在不同的负荷水平下,针对各时刻负荷值的随机分布情况,基于中心极限定理和负荷值相对于聚类中心负荷偏差的四分位差,构建异常负荷数据域;步骤4:利用步骤3中所构建的负荷异常数据域,对正常用电模式中可能存在的异常负荷值进行识别;步骤5:结合步骤3中所形成的异常负荷数据域,利用异常负荷数据域最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域,对异常用电模式进行负荷异常值识别。作为优选,步骤1中,基于空间密度聚类法对用户用电模式进行分类具体步骤如下:步骤1.1:邻域内包含数据点最小数量Nmin的设定;步骤1.2:确定扫描半径ε。在选定Nmin之后,计算各负荷曲线与邻域内第Nmin个邻近负荷曲线的用电模式差异程度其中的计算公式为式中ya和yb表示两个不同的日负荷曲线,其向量形式均可表示为y=(x1,x2,…,xn)T,xi表示第i个时刻的负荷值;步骤1.3:准备历史负荷曲线集合D={y1,y2,…,yM},其中M为负荷曲线总数;步骤1.4:初始化核心对象集合分类数量c=0,未分类的样本集合Λ=D,类划分集合步骤1.5:对于负荷曲线yi(i=1,2,…,M),寻找核心对象;步骤1.6:如果核心对象集合则停止分类,进入步骤1.10,否则进入步骤1.7;步骤1.7:初始化类别序号c=c+1,从集合Ω中,随机挑选一个核心对象o,初始化当前核心对象队列Ωc={o},初始化当前分类集合Sc={o},更新未分类的样本集合Λ=Λ-{o};步骤1.8:如果则当前Sc生成完毕,更新S={S1,S2,…,Sc},Ω=Ω-Sc,转入步骤1.6,否则转入步骤1.9;步骤1.9:从Ωc中取出核心对象o',形成ε邻域样本集合Zε(o'),获得未分类样本且只属于集合Zε(o')的样本集合Δ=Zε(o')∩Λ,更新Ωc=Ωc∪(Δ∩Ω)-o'、Sc=Sc∪Δ和Λ=Λ-Δ,转入步骤1.8;步骤1.10:输出S={S1,S2,…,Sc}和Λ。作为优选,步骤1.5中,寻找核心对象步骤如下:①、计算用电模式差异程度,找到yi的ε领域子样本集Zε(yi);②、如果Zε(yi)包含的样本数量大于Nmin,则将样本yi加入核心对象集合Ω=Ω∪{yi}。作为优选,步骤2中,对正常用电模式进行负荷水平分类的具体步骤如下:步骤2.1:确定最优聚类数K,从使得子数据集内的数据点负荷水平高度相似,子数据集间负荷水平有较大差异度的角度出发,利用综合评估指标在聚类数目K∈[1,Kmax]中,选择使得取得最小值的K,即可作为子数据集期望的聚类数,在综合评估指标中,表示第k个子数据集中包含的负荷曲线yj与聚类中心之间的距离,Nk为子数据集包含负荷曲线的数量;表示K个子数据集之间负荷水平的差异度,其中,和均表示不同子数据集的聚类中心;步骤2.2:利用确定的负荷水平分类值K,对正常用电模式再次使用K中心聚类法进行负荷水平分类。作为优选,步骤2.1中,K中心聚类的详细步骤如下:步骤2.1.1:从待进行负荷水平分类的负荷曲线集合Si(i=1,2,…,c)中集中随机选择K条负荷曲线,作为初始中心点,并设定最大迭代次数;步骤2.1.2:将待分类的正常用电模式负荷曲线集合Si中的负荷曲线,指派到距离最近的中心点;步骤2.1.3:开始执行迭代,使得分类结果对应的欧式距离的和dK最小,其计算公式为作为优选,步骤2.1.3中,执行迭代具体步骤如下:步骤2.1.3.1:根据指派结果计算dK:如果是第一次进行指派,计算dK,并直接保存在变量中,该变量保存的是最小dK;如果不是第一次进行指派,计算dK,并将其保存在变量中,继续执行步骤2.1.3.2;步骤2.1.3.2:随机选择一个非中心点;步骤2.1.3.3:创建集合C,该集合保存该轮迭代指派结果,如果是第一次进行指派,将集合C直接保存在集合中,该集合保存最优分类结果;如果不是第一次进行指派,比较和如果则将集合C保存在集合中,根据随机选择的非中心点修改集合C中的结果,将随机选择非中心点和对应的中心点进行交换,为下一轮指派过程准备数据;步骤2.1.3.4:判断是否达到指定的最大迭代次数,如果达到则终止计算,输出最优分类结果否则执行下一轮迭代计算,转步骤2.1.3.1。作为优选,步骤3中,构建的异常负荷数据域方法为:对于第k个子数据集,在t时刻,基于置信度1-α下负荷期望值的置信区间,及负荷值相对于聚类中心负荷偏差的四分位差形成异常数据域式中Xt为负荷随机变量,为t时刻的负荷均值的样本均值,为t时刻的为修正样本方差,Nk为样本数量,tα/2(Nk-1)为自由度为Nk-1的t分布的上侧α/2分位数。与现有技术相比,本专利技术的有益效果在于:能够有效解决箱线图识别方法不考虑负荷值局部分布特性和因负荷数据分布未知而导致所提方法本文档来自技高网
...

【技术保护点】
1.一种负荷异常值识别方法,包括以下步骤:/n步骤1:基于空间密度聚类法,对负荷曲线进行用电模式分类,分为正常用电模式和异常用电模式;/n步骤2:基于K中心聚类法,对正常用电模式进行负荷水平分类;/n步骤3:在不同的负荷水平下,针对各时刻负荷值的随机分布情况,基于中心极限定理和负荷值相对于聚类中心负荷偏差的四分位差,构建异常负荷数据域;/n步骤4:利用步骤3中所构建的负荷异常数据域,对正常用电模式中可能存在的异常负荷值进行识别;/n步骤5:结合步骤3中所形成的异常负荷数据域,利用异常负荷数据域最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域,对异常用电模式进行负荷异常值识别。/n

【技术特征摘要】
1.一种负荷异常值识别方法,包括以下步骤:
步骤1:基于空间密度聚类法,对负荷曲线进行用电模式分类,分为正常用电模式和异常用电模式;
步骤2:基于K中心聚类法,对正常用电模式进行负荷水平分类;
步骤3:在不同的负荷水平下,针对各时刻负荷值的随机分布情况,基于中心极限定理和负荷值相对于聚类中心负荷偏差的四分位差,构建异常负荷数据域;
步骤4:利用步骤3中所构建的负荷异常数据域,对正常用电模式中可能存在的异常负荷值进行识别;
步骤5:结合步骤3中所形成的异常负荷数据域,利用异常负荷数据域最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域,对异常用电模式进行负荷异常值识别。


2.根据权利要求1所述的负荷异常值识别方法,其特征在于:步骤1中,基于空间密度聚类法对用户用电模式进行分类具体步骤如下:
步骤1.1:邻域内包含数据点最小数量Nmin的设定;
步骤1.2:确定扫描半径ε,在选定Nmin之后,计算各负荷曲线与邻域内第Nmin个邻近负荷曲线的用电模式差异程度其中的计算公式为式中ya和yb表示两个不同的日负荷曲线,其向量形式均可表示为y=(x1,x2,...,xn)T,xi表示第i个时刻的负荷值;
步骤1.3:准备历史负荷曲线集合D={y1,y2,…,yM},其中M为负荷曲线总数;
步骤1.4:初始化核心对象集合分类数量c=0,未分类的样本集合Λ=D,类划分集合
步骤1.5:对于负荷曲线yi(i=1,2,…,M),寻找核心对象;
步骤1.6:如果核心对象集合则停止分类进入步骤1.10,否则进入步骤1.7;
步骤1.7:初始化类别序号c=c+1,从集合Ω中,随机挑选一个核心对象o,初始化当前核心对象队列Ωc={o},初始化当前分类集合Sc={o},更新未分类的样本集合Λ=Λ-{o};
步骤1.8:如果则当前Sc生成完毕,更新S={S1,S2,…,Sc},Ω=Ω-Sc,转入步骤1.6,否则转入步骤1.9;
步骤1.9:从Ωc中取出核心对象o',形成ε邻域样本集合Zε(o'),获得未分类样本且只属于集合Zε(o')的样本集合Δ=Zε(o')∩Λ,更新Ωc=Ωc∪(Δ∩Ω)-o'、Sc=Sc∪Δ和Λ=Λ-Δ,转入步骤1.8;
步骤1.10:输出S={S1,S2,…,Sc}和Λ。


3.根据权利要求2所述的负荷异常值识别方法,其特征在于:步骤1.5中,寻找核心对象步骤如下:
①计算用电模式差异程度,找到yi的ε领域子样本集Zε(yi);
②如果Zε(yi)包含的样本数量大于Nmin,则将样本yi加入核心对象集合Ω=Ω∪{yi}。

【专利技术属性】
技术研发人员:李静程波王亮张世桃
申请(专利权)人:杭州海兴电力科技股份有限公司杭州粒合信息科技有限公司杭州海兴泽科信息技术有限公司宁波恒力达科技有限公司南京海兴电网技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1