一种用电特征指标降维与极限学习机算法进行窃电检测的方法技术

技术编号:20004459 阅读:51 留言:0更新日期:2019-01-05 17:25
本发明专利技术涉及一种用电特征指标降维与极限学习机算法进行窃电检测的方法,属于用户用电行为检测领域。本发明专利技术对用户用电历史数据分析,提取特征指标进行降维并结合局部离群因子、极限学习机算法对窃电行为进行检测。首先对用户的负荷数据进行分类,提出度量负荷曲线的四种指标并得出特征变量;其次在分类的基础上对提取出的特征变量进行降维,利用局部离群因子筛选出用电异常用户;最后采用窃电判别指标并提取主成分,将用电异常用户提取主成分后的窃电判别指标数据作为训练样本输入模型。本发明专利技术对窃电用户有很好的识别效果。

A Method of Electricity Theft Detection Based on Dimension Reduction of Electricity Characteristic Index and Limit Learning Machine Algorithms

The invention relates to a method for detecting electricity theft by dimensionality reduction of electricity characteristic index and limit learning machine algorithm, which belongs to the field of user electricity behavior detection. The invention analyses the user's electricity history data, extracts feature indexes, reduces dimension, and detects electricity theft by combining local outlier factor and extreme learning machine algorithm. Firstly, the user's load data are classified, and four indicators to measure the load curve are put forward and the characteristic variables are obtained. Secondly, the extracted characteristic variables are dimensionally reduced based on the classification, and the anomalous users are screened out by using local outlier factors. Finally, the discriminant indicators of electricity theft are adopted and the principal components are extracted, and the discriminant indicators of electricity theft after the anomalous users extract the principal components are extracted. Input model as training sample. The invention has good recognition effect for power stealing users.

【技术实现步骤摘要】
一种用电特征指标降维与极限学习机算法进行窃电检测的方法
本专利技术涉及一种用电特征指标降维与极限学习机算法的窃电检测方法,属于用户用电行为检测领域。
技术介绍
我国已经进入了全面建成智能电网阶段,随着智能电网的快速发展,用电信息采集系统及配电自动化系统逐渐完善,配用电数据呈现出数据量大、数据类型多、增长速度快等大数据特征。但窃电现象依然严重且手段先进,反窃电手段仍以人工稽核为主,存在工作量大、取证困难和缺乏针对性等问题。窃电作为影响电网发展的主要问题之一,不仅给国家经济造成了重大的损失,而且威胁着电网的安全运行,也是电力部门一直需要解决的问题。窃电行为作为一种非法行为,一直受到了电力部门的严厉打击。虽然国家颁布了相关法律法规,但是窃电问题仍然存在,而且这个问题也越来越突出。在窃电手段上既有常规的窃电方法,如干扰电能计量装置使其少计、绕过电能计量装置用电或者乱接线用电。又有一些新的高科技窃电方法,如高频干扰窃电、大功率无线信号窃电。在面对电网智能化发展时,传统的窃电手段存在着一些不足,通过改变计量装置或乱接电线进行窃电,通过人工排查很容易发现窃电行为。但是随着科技的发展,窃电手段越来越多样化且隐蔽性更强,并向着高科技化方向发展,高科技化窃电手段通过人工排查很难发现,比如,大功率无线信号窃电就是对电表的CPU进行干扰,使电表少计或者不计,还可以随时恢复电表计量。这些高科技的窃电手段都比较的隐蔽而且不容易发觉,窃电操作时间短,这就给窃电侦查带来了很大的困难。而传统的窃电检测主要是靠人工进行排查,而且往往都是窃电行为产生很长时间之后才被发现,这需要很高的代价和大量的人力资源。随着数据挖掘、机器学习等技术的发展,一些智能检测方法出现了,对用户的历史数据进行分析,挖掘出用户潜在的窃电行为,建立用电异常判别模型或规则。通过异常用电检测,及时的发现异常行为,提前采取相关的措施将损失降到最低。
技术实现思路
针对上述问题,本专利技术提出一种用电特征指标降维与极限学习机算法的窃电检测方法。对用户用电历史数据分析,提取特征指标进行降维并结合局部离群因子、极限学习机算法对窃电行为进行检测,实验证明该模型对电力计量自动化系统中的窃电用户有很好的识别效果。本专利技术采用了以下方案:一种用电特征指标降维与极限学习机算法的窃电检测方法按照下面步骤进行:(1)从电力计量自动化系统中提取用户负荷数据集,用户负荷数据集包括N个用户F个月的数据,每天采集次数为t次,用户负荷数据集为X={xfn(T),n=1,2,...,N,f=1,2,...,F,T=1,2,...,t};(2)对负荷数据进行清洗,剔除异常数据达到40%以上的用户,其中异常数据包括数据缺失和数据为负两部分,对保留的用户用电数据中出现异常的数据采用均值替换法替换异常值,为保证每个个体在分析过程中的地位相同,对数据进行极差归一化变换;(3)对清洗后的负荷数据进行计算,得到负荷数据在相同时间点的负荷曲线平均值,进而得到典型日负荷曲线xn=(x1,x2,...,xt),(n=1,2,...,N);(4)采用FCM算法对典型日负荷曲线进行分类,得到分类中心坐标矩阵,由中心坐标得出分类后的负荷特征曲线L=(l1,l2,...,lt);(5)基于典型日负荷曲线和分类后的负荷特征曲线判断出用电异常用户,具体为基于两种曲线提取出若干特征变量,对特征变量做主成分分析提取前两个主成分;这些主成分能够反应原始变量的大部分信息,以前两个主成分为坐标轴将用户散射到二维平面上并利用局部离群因子算法得出用电异常用户;(8)由得出的异常用户和部分正常用户作为样本集,随机选择正常用户,其数量相对于异常用户不要出现太少或者太多的情况即可。样本集随机分为训练样本和测试样本对极限学习机模型进行训练和测试;提取样本集的8类特征数据作为窃电判别指标,并用训练样本的8类特征数据对极限学习机模型进行训练,再利用训练后的极限学习机模型对测试样本对进行分类预测;(9)根据极限学习机模型分类预测结果判断是否为窃电用户。优选的,所述步骤(4)具体包括以下步骤:采用VPC和VXB两种指标,根据综合指标结果得出聚类数,综合指标定义如下:其中,WCI为综合指标,w1和w2分别为VPC和VXB对应的权重,具体的取值是根据实际情况来选择,VPC和VXB为指标结果;m为模糊权重指数,i∈[1,n],j∈[1,c],n为隶属度矩阵的列数即数据集用户数,c为隶属度矩阵的行数即类别数,vj为第j类的聚类中心,uij为个体xi属于第j类的模糊隶属度;根据上述公式取得综合指标WCI最小时对应的聚类数,得出聚类数之后,采用FCM算法对用户的典型日负荷曲线进行聚类;其中,s∈[1,c],vs是第s类的聚类中心,vj为第j类的聚类中心,模糊聚类目标函数J为:判断是否满足结束条件,满足则算法终止,否则继续计算模糊隶属度矩阵。优选的,步骤5中的特征变量分别为:用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合结果,用户每两个月的典型负荷曲线之间的欧氏距离,负荷率r1,日峰谷差率r2,峰期负载率r3,平期负载率r4,谷期负载率r5,负荷上升指标和负荷下降指标,用户典型日负荷序列的标准差,前后时间点的平均差值。用户的典型日负荷曲线与得出的负荷特征曲线的欧氏距离和相关系数的综合指标计算如下:用户典型负荷曲线xn=(x1,x2,...,xt)和负荷特征曲线L=(l1,l2,...,lt)之间的欧式距离定义为:变量xi与li的相关系数定义为:对两者采用权重法进行综合,综合结果wcd=w3C+w4D,其中,wcd为两者的综合结果,w3和w4分别为C和D对应的权重。负荷上升指标和负荷下降指标分别为:比较用户的负荷时间序列与简单平均移动序列Mt各个时间点的相对大小,小于Ft的点记为a1,a2,...,ah1,大于Mt的点记为b1,b2,...,bh2。前后时间点的平均差值此公式中计算的是典型负荷曲线前48个时间点与后48个时间点的平均差值。利用局部离群因子算法得出用电异常用户的过程为:首先计算对象p的k-距离(k-distance)对于任意的正整数k,对象p的k-距离,记为k-distance(p),定义为距离d(p,o)为p和对象o之间的距离:至少存在k个对象o'∈D\{p},使得d(p,o')≤d(p,o);至多存在k-1个对象o'∈D\{p},使得d(p,o')<d(p,o)。计算对象p的k-距离邻域(Nk-distance)已知p的k-距离k-distance(p),p的k-距离邻域包含所有与p的距离不超过k-distance(p)的对象,即Nk-distance(p)={q|d(p,q)≤k-distance(p)}计算可达距离,给定自然数k,对象p与对象o的可达距离为reach-distk(p,o)=max{k-distance(o),d(p,o)}计算对象p局部可达密度对象p的局部可达密度是对象p的MinPts邻域平均可达距离的倒数。最后计算对象p的局部离群因子局部离群因子表示异常程度,局部离群因子越大,则表示异常程度越高,即为用电异常用户。优选地,步骤(8)得出的样本集选用以下8类特征数据信息作为模型输入,当出现窃电特征时,其计量数据也会出现一定的本文档来自技高网
...

【技术保护点】
1.一种用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,包括以下步骤:(1)从电力计量自动化系统中提取用户负荷数据集,用户负荷数据集包括N个用户F个月的数据,每天采集次数为t次,用户负荷数据集为X={xfn(T),n=1,2,...,N,f=1,2,...,F,T=1,2,...,t};(2)对负荷数据进行清洗,剔除异常数据达到40%以上的用户,其中异常数据包括数据缺失和数据为负两部分,对保留的用户用电数据中出现异常的数据采用均值替换法替换异常值,再对数据进行极差归一化变换;(3)对清洗后的负荷数据进行计算,得到负荷数据在相同时间点的负荷曲线平均值,进而得到典型日负荷曲线xn=(x1,x2,...,xt),(n=1,2,...,N);(4)采用FCM算法对典型日负荷曲线进行分类,得到分类中心坐标矩阵,由中心坐标得出分类后的负荷特征曲线L=(l1,l2,...,lt);(5)基于典型日负荷曲线和分类后的负荷特征曲线判断出用电异常用户,具体为基于两种曲线提取出若干特征变量,对特征变量做主成分分析提取前两个主成分;以前两个主成分为坐标轴将用户散射到二维平面上并利用局部离群因子算法得出用电异常用户;(8)由得出的异常用户和部分正常用户作为样本集,分为训练样本和测试样本对极限学习机模型进行训练和测试;提取样本集的8类特征数据作为窃电判别指标,并用训练样本的8类特征数据对极限学习机模型进行训练,再利用训练后的极限学习机模型对测试样本对进行分类预测;(9)根据极限学习机模型分类预测结果判断是否为窃电用户。...

【技术特征摘要】
1.一种用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,包括以下步骤:(1)从电力计量自动化系统中提取用户负荷数据集,用户负荷数据集包括N个用户F个月的数据,每天采集次数为t次,用户负荷数据集为X={xfn(T),n=1,2,...,N,f=1,2,...,F,T=1,2,...,t};(2)对负荷数据进行清洗,剔除异常数据达到40%以上的用户,其中异常数据包括数据缺失和数据为负两部分,对保留的用户用电数据中出现异常的数据采用均值替换法替换异常值,再对数据进行极差归一化变换;(3)对清洗后的负荷数据进行计算,得到负荷数据在相同时间点的负荷曲线平均值,进而得到典型日负荷曲线xn=(x1,x2,...,xt),(n=1,2,...,N);(4)采用FCM算法对典型日负荷曲线进行分类,得到分类中心坐标矩阵,由中心坐标得出分类后的负荷特征曲线L=(l1,l2,...,lt);(5)基于典型日负荷曲线和分类后的负荷特征曲线判断出用电异常用户,具体为基于两种曲线提取出若干特征变量,对特征变量做主成分分析提取前两个主成分;以前两个主成分为坐标轴将用户散射到二维平面上并利用局部离群因子算法得出用电异常用户;(8)由得出的异常用户和部分正常用户作为样本集,分为训练样本和测试样本对极限学习机模型进行训练和测试;提取样本集的8类特征数据作为窃电判别指标,并用训练样本的8类特征数据对极限学习机模型进行训练,再利用训练后的极限学习机模型对测试样本对进行分类预测;(9)根据极限学习机模型分类预测结果判断是否为窃电用户。2.根据权利要求1所述的用电特征指标降维与极限学习机算法进行窃电检测的方法,其特征在于,所述步骤(4)具体包括以下步骤:采用VPC和VXB两种指标,根据综合指标结果得出聚类数,综合指标定义如下:其中,WCI为综合指标,w1和w2分别为VPC和VXB对应的权重,VPC和VXB为指标结果;m为模糊权重指数,i∈[1,n],j∈[1,c],n为隶属度矩阵的列数即数据集用户数,c为隶属度矩阵的行数即类别数,vj为第j类的聚类中心,uij为个体xi属于第j类的模糊隶属度;...

【专利技术属性】
技术研发人员:李川李梓欣李英娜
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1