一种负荷异常值识别方法技术

技术编号：23892312 阅读：17 留言：0更新日期：2020-04-22 06:58

本发明专利技术涉及电力负荷数据挖掘技术领域，具体地说，涉及一种负荷异常值识别方法。其包括以下步骤：对负荷曲线进行用电模式分类；对属于正常用电模式的负荷曲线进行负荷水平分类；构建异常负荷数据域，对属于正常用电模式的负荷曲线异常值识别；利用上述异常负荷数据域的最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域，对属于异常用电模式的负荷曲线进行负荷异常值识别。本发明专利技术基于空间密度聚类法和K中心聚类法，可以对负荷数据进行合理分类，方便处理不同的用电模式以及相同用电模式下不同的负荷水平。中心极限定理和四分位差构建异常负荷数据域的方法，可以根据要求的置信度，灵活的调整异常负荷数据域的范围。

A method of identifying abnormal load value

全部详细技术资料下载

【技术实现步骤摘要】
一种负荷异常值识别方法
本专利技术涉及电力负荷数据挖掘
，具体地说，涉及一种负荷异常值识别方法。
技术介绍
智能电表地安装使电力用户负荷记录由电量变为时序负荷曲线，与电量相比，电力时序负荷曲线中包含了用户在各时刻的用电行为和负荷水平信息。作为电能供应商提供能量管理服务和用户自身进行需求侧响应的重要依据，电力负荷曲线中的异常负荷值往往会对上述决策产生重大的影响。由于采集的电力负荷曲线中包含有海量数据，通过人工的方式很难实现对异常负荷值的准确识别，需要开发面向大规模数据的异常负荷值识别方法。由于电力负荷的分布未知，箱线图在异常值识别中获得了较广泛的应用。通过对数据本身所提供的最大值、最小值、上四分、中位数位数、下四分位数进行分析，基于四分位差，构建异常数据域，对异常负荷值进行识别。该方法简单易用，不会因为数据规模的增加而变得复杂。箱线图的主要不足之处在于，构建的异常数据域没有考虑负荷值在各时刻的局部密度特性。为了解决该问题，通常提前假设负荷数据所满足的分布特性，然后根据相应的累计密度函数来构建不同置信度下的异常负荷数据域；或者利用分布检验的方法对负荷数据的分布情况进行验证，在假设被接受后，通过累计密度函数构建不同置信度下的异常负荷数据域。上述解决方法存在以下问题：对于直接假定负荷数据分布的情况，由于用户的用电行为存在很大的随机性，用电行为会随着时间的推移和外部环境的变化而发生改变，很难准确的给出负荷数据的分布；对于先假设分布，然后进行分布检验，由于负荷数据中可能存在负荷异常值，在没有进行异常值识别之...

【技术保护点】
1.一种负荷异常值识别方法，包括以下步骤：/n步骤1：基于空间密度聚类法，对负荷曲线进行用电模式分类，分为正常用电模式和异常用电模式；/n步骤2：基于K中心聚类法，对正常用电模式进行负荷水平分类；/n步骤3：在不同的负荷水平下，针对各时刻负荷值的随机分布情况，基于中心极限定理和负荷值相对于聚类中心负荷偏差的四分位差，构建异常负荷数据域；/n步骤4：利用步骤3中所构建的负荷异常数据域，对正常用电模式中可能存在的异常负荷值进行识别；/n步骤5：结合步骤3中所形成的异常负荷数据域，利用异常负荷数据域最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域，对异常用电模式进行负荷异常值识别。/n

【技术特征摘要】
1.一种负荷异常值识别方法，包括以下步骤：
步骤1：基于空间密度聚类法，对负荷曲线进行用电模式分类，分为正常用电模式和异常用电模式；
步骤2：基于K中心聚类法，对正常用电模式进行负荷水平分类；
步骤3：在不同的负荷水平下，针对各时刻负荷值的随机分布情况，基于中心极限定理和负荷值相对于聚类中心负荷偏差的四分位差，构建异常负荷数据域；
步骤4：利用步骤3中所构建的负荷异常数据域，对正常用电模式中可能存在的异常负荷值进行识别；
步骤5：结合步骤3中所形成的异常负荷数据域，利用异常负荷数据域最大上限和最小下限构建用于识别异常用电模式中负异常负荷值的异常负荷数据域，对异常用电模式进行负荷异常值识别。

2.根据权利要求1所述的负荷异常值识别方法，其特征在于：步骤1中，基于空间密度聚类法对用户用电模式进行分类具体步骤如下：
步骤1.1：邻域内包含数据点最小数量Nmin的设定；
步骤1.2：确定扫描半径ε，在选定Nmin之后，计算各负荷曲线与邻域内第Nmin个邻近负荷曲线的用电模式差异程度其中的计算公式为式中ya和yb表示两个不同的日负荷曲线，其向量形式均可表示为y＝(x1,x2,...,xn)T，xi表示第i个时刻的负荷值；
步骤1.3：准备历史负荷曲线集合D＝{y1,y2,…,yM}，其中M为负荷曲线总数；
步骤1.4：初始化核心对象集合分类数量c＝0，未分类的样本集合Λ＝D,类划分集合
步骤1.5：对于负荷曲线yi(i＝1,2,…,M)，寻找核心对象；
步骤1.6：如果核心对象集合则停止分类进入步骤1.10，否则进入步骤1.7；
步骤1.7：初始化类别序号c＝c+1，从集合Ω中，随机挑选一个核心对象o,初始化当前核心对象队列Ωc={o},初始化当前分类集合Sc={o}，更新未分类的样本集合Λ=Λ-{o}；
步骤1.8：如果则当前Sc生成完毕，更新S={S1,S2,…,Sc}，Ω＝Ω-Sc，转入步骤1.6，否则转入步骤1.9；
步骤1.9：从Ωc中取出核心对象o'，形成ε邻域样本集合Zε(o')，获得未分类样本且只属于集合Zε(o')的样本集合Δ＝Zε(o')∩Λ，更新Ωc＝Ωc∪(Δ∩Ω)-o'、Sc＝Sc∪Δ和Λ＝Λ-Δ，转入步骤1.8；
步骤1.10：输出S＝{S1,S2,…,Sc}和Λ。

3.根据权利要求2所述的负荷异常值识别方法，其特征在于：步骤1.5中，寻找核心对象步骤如下：
①计算用电模式差异程度，找到yi的ε领域子样本集Zε(yi)；
②如果Zε(yi)包含的样本数量大于Nmin，则将样本yi加入核心对象集合Ω＝Ω∪{yi}。

【专利技术属性】
技术研发人员：李静，程波，王亮，张世桃，
申请(专利权)人：杭州海兴电力科技股份有限公司，杭州粒合信息科技有限公司，杭州海兴泽科信息技术有限公司，宁波恒力达科技有限公司，南京海兴电网技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人