一种基于密度筛选与K-均值聚类的反窃电预警方法及系统技术方案

技术编号:25990595 阅读:45 留言:0更新日期:2020-10-20 18:58
本发明专利技术公开了一种基于密度筛选与K‑均值聚类的反窃电预警方法及系统,其中方法包括:获取目标行业正常用户限定期间的用电数据作为训练样本;将训练样本进行归一化处理,获取经过处理的训练样本;基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数;将初始聚类中心和聚类数作为K‑均值聚类的初始值,基于K‑均值聚类对经过处理的训练样本进行聚类,获取目标行业典型负荷曲线;计算待检用户的负荷曲线与目标行业典型负荷曲线的负荷曲线的欧氏距离和余弦距离;基于欧氏距离和余弦距离确定待检用户的异常度指标;当异常度指标大于预先设定的异常阈值时,将待检用户判断为窃电嫌疑用户。

【技术实现步骤摘要】
一种基于密度筛选与K-均值聚类的反窃电预警方法及系统
本专利技术涉及反窃电
,更具体地,涉及一种基于密度筛选与K-均值聚类的反窃电预警方法及系统。
技术介绍
当前,一些不法个人和单位采取各种窃电手段,以达到节省生产成本,追求高利润的目的。在窃电手段方面,与以前的欠压、欠流等传统窃电方法相比,现有的窃电手段具有新的特点、手段更多元化、方法更隐蔽,且呈现出技术化和高科技化趋势,这使得国家蒙受巨大的经济损失。据统计,我国每年因窃电导致电力企业产生的损失高达200亿元,给国家造成巨大经济损失,同时社会供电秩序也深受影响。目前的窃电检测手段分为技术手段和管理手段,技术手段主要是通过加装反窃电装置,或在表计中增加反窃电模块。管理手段有设立稽查队伍、宣传相关法律知识等措施。但是这些手段时效性差、准确率低、人力物力投入大。因此国家相关电力部门必须展开反窃电预警工作,维护供电工作的正常秩序,降低电力企业的经济损失。在窃电检测和预警方法研究方面,国内外对用户用电行为分析采用得比较多的方法是聚类分析。该方法通过对用户负荷曲线进行聚类,得到了用户的负荷特征曲线,从负荷特征曲线中获取用户用电高峰时间、最大负荷等基本信息。随着智能电网的构建,负荷分类方法的研究越来越深入。在电力负荷聚类分析中,使用得较多的有:FCM算法、K-means算法。传统的K-means算法的聚类结果易受聚类数K值的影响,对初始聚类中心的选择依赖性也比较大,选择不同的初始聚类中心其聚类结果通常不一样,结果具有很大的不确定性,聚类指标往往会收敛于局部最优。目前对K-means算法的研究主要集中在两个方向:一是研究如何获得更好的初始聚类中心;二是研究如何获得最佳的聚类数,即最优的k值。然而K-means算法聚类结果易受值和初始聚类中心的影响,难以预测窃电嫌疑用户。
技术实现思路
本专利技术技术方案提供一种基于密度筛选与K-均值聚类的反窃电预警方法及系统,以解决如何基于密度筛选与K-均值聚类的进行反窃电预警的问题。为了解决上述问题,本专利技术提供了一种基于密度筛选与K-均值聚类的反窃电预警方法,所述方法包括:获取目标行业正常用户限定期间的用电数据作为训练样本;将所述训练样本进行归一化处理,获取经过处理的训练样本;基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数;将所述初始聚类中心和所述聚类数作为K-均值聚类的初始值,基于所述K-均值聚类对经过处理的训练样本进行聚类,获取目标行业典型负荷曲线;计算待检用户的负荷曲线与所述目标行业典型负荷曲线的负荷曲线的欧氏距离和余弦距离;基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标;当所述异常度指标大于预先设定的异常阈值时,将所述待检用户判断为窃电嫌疑用户。优选地,所述将所述训练样本进行归一化处理,获取经过处理的训练样本,包括:所述训练样本为Pw'={Xwi'}(i=1,2,...,s),Xwi'是第w个行业第i个用户的数据,s为该行业提取的用户数;对所述训练样本Pw'进行归一化处理,得到经过处理的训练样本Pw={Xwi}(i=1,2,...,s),归一化的公式为,式中,Xwi为第i个用户归一化后的训练样本的数据,Xwi'max、Xwi'min分别为第i个用户的归一化前的训练样本的最大数据和最小数据。优选地,所述基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数,包括:(1)计算训练样本空间Pw中任意两个训练样本点的欧氏距离d(Xwi,Xwj),d(Xwi,Xwj)=||Xwi-Xwj||2(2)式中,Xwi、Xwj分别为第w个行业用户i、j的数据;(2)计算训练样本空间Pw中所有样本点的平均距离Meandist,(3)计算每个训练样本点的密度参数Density(Xwi,Meandist),并形成密度参数集合D;上式中,所述密度参数表示的是以样本点Xwi为中心、平均距离Meandist为半径的范围内样本点的个数;(4)找出所述密度参数集合D中的最大值Dmax,并统计Dmax的数量N;如果N=1,找出所述密度参数集合Dmax所对应的样本点的数据Xwi,将此处的数据Xwi添加到初始中心候选集U中,并转到步骤(6)执行下一步操作;(5)若N>1,则说明密度最值点不唯一,则计算多个密度最值点(Xwi,Meandist)邻域内其余样本点与该最值点的距离之和sum,将计算所得的距离之和sum最小的密度最值点的数据Xwi添加到初始中心候选集U中;(6)将最值样本点的数据Xwi及(Xwi,Meandist)邻域内的样本点都删去;(7)重复步骤(3)至步骤(6),直到找出所有的初始候选中心。优选地,还包括:将初始中心候选集U的数据作为K-均值聚类的初始聚类中心和K值,基于所述K-均值聚类对训练样本空间Pw进行聚类,得到聚类结果Cw={Xwi,i=1,2,...,k},Xwi表示第w个行业的第i个类中心的数据,k为聚类类数;以所述聚类结果Cw作为目标行业的典型负荷曲线。优选地,计算待检用户的负荷曲线与待检用户所在行业的目标行业典型负荷曲线的欧氏距离和余弦距离,包括:首先要对待检用户的数据进行归一化处理,归一化处理和计算欧式距离的公式分别为式(1)和式(2),计算余弦距离的公式为;式中,X为待检用户某一天的负荷曲线数据。优选地,所述基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标,包括:基于所述欧式距离和余弦距离获取待检用户的异常度指标P,P=w1lgd+w2(1-J)(7)其中:d为待检用户与行业典型曲线欧氏距离,J为待测用户的余弦距离,w1与w2为加权系数。基于本专利技术的另一方面,本专利技术提供一种基于密度筛选与K-均值聚类的反窃电预警系统,所述系统包括:第一获取单元,用于获取目标行业正常用户限定期间的用电数据作为训练样本;处理单元,用于将所述训练样本进行归一化处理,获取经过处理的训练样本;第二获取单元,用于基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数;第三获取单元,用于将所述初始聚类中心和所述聚类数作为K-均值聚类的初始值,基于所述K-均值聚类对经过处理的训练样本进行聚类,获取目标行业典型负荷曲线;计算单元,用于计算待检用户的负荷曲线与所述目标行业典型负荷曲线的负荷曲线的欧氏距离和余弦距离;确定单元,用于基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标;结果单元,用于当所述异常度指标大于预先设定的异常阈值时,将所述待检用户判断为窃电嫌疑用户。优选地,所述处理单元用于将所述训练样本进行归一化处理,获取经过处理的训练样本,包括:所述训练样本为Pw'={Xwi'}(i=1,2,...,s),Xwi'是第w个行业第i个用户的数据,s为该行业提取本文档来自技高网
...

【技术保护点】
1.一种基于密度筛选与K-均值聚类的反窃电预警方法,所述方法包括:/n获取目标行业正常用户限定期间的用电数据作为训练样本;/n将所述训练样本进行归一化处理,获取经过处理的训练样本;/n基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数;/n将所述初始聚类中心和所述聚类数作为K-均值聚类的初始值,基于所述K-均值聚类对经过处理的训练样本进行聚类,获取目标行业典型负荷曲线;/n计算待检用户的负荷曲线与所述目标行业典型负荷曲线的负荷曲线的欧氏距离和余弦距离;/n基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标;/n当所述异常度指标大于预先设定的异常阈值时,将所述待检用户判断为窃电嫌疑用户。/n

【技术特征摘要】
1.一种基于密度筛选与K-均值聚类的反窃电预警方法,所述方法包括:
获取目标行业正常用户限定期间的用电数据作为训练样本;
将所述训练样本进行归一化处理,获取经过处理的训练样本;
基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数;
将所述初始聚类中心和所述聚类数作为K-均值聚类的初始值,基于所述K-均值聚类对经过处理的训练样本进行聚类,获取目标行业典型负荷曲线;
计算待检用户的负荷曲线与所述目标行业典型负荷曲线的负荷曲线的欧氏距离和余弦距离;
基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标;
当所述异常度指标大于预先设定的异常阈值时,将所述待检用户判断为窃电嫌疑用户。


2.根据权利要求1所述的方法,所述将所述训练样本进行归一化处理,获取经过处理的训练样本,包括:
所述训练样本为Pw'={Xwi'}(i=1,2,...,s),Xwi'是第w个行业第i个用户的数据,s为该行业提取的用户数;
对所述训练样本Pw'进行归一化处理,得到经过处理的训练样本Pw={Xwi}(i=1,2,...,s),归一化的公式为,



式中,Xwi为第i个用户归一化后的训练样本的数据,Xwi'max、Xwi'min分别为第i个用户的归一化前的训练样本的最大数据和最小数据。


3.根据权利要求2所述的方法,所述基于密度筛选法,获取经过处理的训练样本的初始聚类中心和聚类数,包括:
(1)计算训练样本空间Pw中任意两个训练样本点的欧氏距离d(Xwi,Xwj),
d(Xwi,Xwj)=||Xwi-Xwj||2(2)
式中,Xwi、Xwj分别为第w个行业用户i、j的数据;
(2)计算训练样本空间Pw中所有样本点的平均距离Meandist,



(3)计算每个训练样本点的密度参数Density(Xwi,Meandist),并形成密度参数集合D;



上式中,所述密度参数表示的是以样本点Xwi为中心、平均距离Meandist为半径的范围内样本点的个数;
(4)找出所述密度参数集合D中的最大值Dmax,并统计Dmax的数量N;如果N=1,找出所述密度参数集合Dmax所对应的样本点的数据Xwi,将此处的数据Xwi添加到初始中心候选集U中,并转到步骤(6)执行下一步操作;
(5)若N>1,则说明密度最值点不唯一,则计算多个密度最值点(Xwi,Meandist)邻域内其余样本点与该最值点的距离之和sum,



将计算所得的距离之和sum最小的密度最值点的数据Xwi添加到初始中心候选集U中;
(6)将最值样本点的数据Xwi及(Xwi,Meandist)邻域内的样本点都删去;
(7)重复步骤(3)至步骤(6),直到找出所有的初始候选中心。


4.根据权利要求3所述的方法,还包括:将初始中心候选集U的数据作为K-均值聚类的初始聚类中心和K值,基于所述K-均值聚类对训练样本空间Pw进行聚类,得到聚类结果Cw={Xwi,i=1,2,...,k},Xwi表示第w个行业的第i个类中心的数据,k为聚类类数;以所述聚类结果Cw作为目标行业的典型负荷曲线。


5.根据权利要求4所述的方法,计算待检用户的负荷曲线与待检用户所在行业的目标行业典型负荷曲线的欧氏距离和余弦距离,包括:
首先要对待检用户的数据进行归一化处理,归一化处理和计算欧式距离的公式分别为式(1)和式(2),计算余弦距离的公式为;



式中,X为待检用户某一天的负荷曲线数据。


6.根据权利要求5所述的方法,所述基于所述欧氏距离和所述余弦距离确定待检用户的异常度指标,包括:
基于所述欧式距离和余弦距离获取待检用户的异常度指标P,
P=w1lgd+w2(1-J)(7)
其中:d为待检用户与行业典型曲线欧氏距离,J为待测用户的余弦距离,w1与w2为加权系数。


7.一种基于密度筛选与K-均值聚类的反窃电预警系统,所述系统包括:
第一获取单...

【专利技术属性】
技术研发人员:杨艺宁薛阳刘厦杨恒王聪杨柳徐英辉林繁涛
申请(专利权)人:中国电力科学研究院有限公司国家电网有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1