一种窃电诊断方法及系统技术方案

技术编号:33849152 阅读:11 留言:0更新日期:2022-06-18 10:34
本发明专利技术公开了窃电诊断领域的一种窃电诊断方法及系统,包括采集当前时刻用户用电数据;将用户用电数据输入至已训练好的迭代决策树算法模型中,获取窃电诊断结果;所述迭代决策树算法模型采用下述方法训练获取:采集用户原始用电数据,用户原始用电数据包括:用户窃电行为用电数据和用户非窃电行为用电数据;利用原始用电数据构建训练集;采用训练集训练迭代决策树算法模型;本发明专利技术采用训练完成的模型对用户当前的用电数据进行诊断,得出是否有窃电行为的结论,该方法诊断对数据特征值数量有较低要求,同时提高了诊断的准确率。同时提高了诊断的准确率。同时提高了诊断的准确率。

【技术实现步骤摘要】
一种窃电诊断方法及系统


[0001]本专利技术属于窃电诊断
,具体涉及窃电诊断方法及系统。

技术介绍

[0002]一直以来,窃电行为严重扰乱了国家正常的用电秩序、经济运行,不仅困扰电力企业发展,还对电力网络稳定、人民用电安全造成了巨大的威胁。常见的窃电行为分为欠压法、欠流法、移相法、扩差法和无表法。
[0003]用户的窃电行为诊断涉及数据、变量较多,背景情况较为复杂,传统的诊断方法应对起来逐渐捉襟见肘。随着机器学习算法的普及和数据可用性的提升,越来越多的分类、回归、聚类等问题可以通过算法模型得到准确预测。在窃电诊断领域,已经出现了使用决策树、随机森林(Random Forest,RF)等机器学习算法的方法。普通的决策树算法很难平衡准确率和拟合度的关系,容易训练产生过拟合的模型,并且模型结构和参数过于简单,对新输入数据的预测准确率不足;随机森林算法更适合训练数据特征值过多的分类回归问题,它有放回的每次随机选取固定数量样本生成独立的决策树,一般随机森林算法会生成大量的无关联决策树,这些决策树形成随机森林共同对一个新的输入进行预测,最终结果少数服从多数,这个算法提高了准确率,但是对数据特征值数量有较高要求,如果实际数据只有很少的可用特征值,那么生成的随机森林里存在大量的冗余决策树,从而影响最终预测结果。

技术实现思路

[0004]本专利技术的目的在于提供一种窃电诊断方法及系统,采用迭代决策树的方法对用户窃电行为进行诊断,可以提高诊断的准确率。
[0005]为达到上述目的,本专利技术所采用的技术方案是:
[0006]第一方面,本专利技术提供了一种窃电诊断方法,包括:
[0007]采集当前时刻用户用电数据;
[0008]将用户用电数据输入至已训练好的迭代决策树算法模型中,获取窃电诊断结果;
[0009]所述迭代决策树算法模型采用下述方法训练获取:
[0010]采集用户原始用电数据,用户原始用电数据包括:用户窃电行为用电数据和用户非窃电行为用电数据;
[0011]利用原始用电数据构建训练集;
[0012]采用训练集训练迭代决策树算法模型。
[0013]优选的,所述用户原始用电数据包括按时间记录的用户用电和线损信息、用户线路异常发生的时间。
[0014]优选的,线路异常包括电能表的潮流反向、电流不平衡、电压逆相序、电源异常、断相、辅助电源掉电、负荷开关误动拒动、过流、欠压、失流、失压、飞走、倒走。
[0015]优选的,所述方法还包括:
[0016]构建训练集前,对用户原始用电数据进行特征提取,以获取与用户窃电行为和用
户非窃电行为相对应的特征值;
[0017]所述特征值包括:异常发生次数、异常事件发生时刻用电量变化率、异常事件发生时刻线损变化率、用户用电电压电流的均值和方差和用户基本信息。
[0018]优选的,用户基本信息包括用户的年龄、学历、性别、职业。
[0019]优选的,采用训练集训练迭代决策树算法模型的方法包括:
[0020]步骤A,对于每个窃电用户,y值设定为M1,对于每个非窃电用户,其y值设定为M2,x值是由所述特征值组成的N维向量,形成训练集:
[0021]D={(x1,y1),(x2,y2),...,(x
N
,y
N
));
[0022]步骤B,对训练集进行切分变量j和切分点s求解,得到的切分变量j和切分点s划分训练集为两个区域;两个区域的区域值为:
[0023][0024][0025]步骤C,重复调用步骤B,直到满足停止条件,得到一个完整的回归树:
[0026][0027]步骤D,将上述形成的回归树对训练集的预测结果和真实值相减得到残差,再将残差作为更新的y值,得到更新的训练集:
[0028]D={(x1,y1),(x2,y2),...,(x
N
,y
N
)}
[0029]重复调用步骤B、步骤C,迭代生成回归树,直到满足残差数组小于设定值。
[0030]优选的,对训练集进行切分变量j和切分点s的求解,包括:
[0031]假设得到一对切分变量j和切分点s,将整个训练集划分为两个区域:
[0032]R1(j,s)={x|x
(j)
≤s}和R2(j,s)={x|x
(j)
>s};
[0033]根据下列原则遍历所有切分变量j和切分点s,求解得到最小的一组结果:
[0034][0035]优选的,所述M1和M2属于自然数,且M1大于M2。
[0036]优选的,所述停止条件为循环迭代次数用尽或循环时间用尽。
[0037]第二方面,本专利技术提供了一种窃电诊断系统,包括:
[0038]数据采集单元:用于采集当前时刻用户用电数据;
[0039]结果获取单元:将用户用电数据输入至已训练好的迭代决策树算法模型中,获取窃电诊断结果;
[0040]其中,所述结果获取单元包括:
[0041]训练集构建单元:用于采集用户原始用电数据,并利用原始用电数据构建训练集;所述用户原始用电数据包括:用户窃电行为用电数据和用户非窃电行为用电数据;
[0042]训练单元:用于采用训练集训练迭代决策树算法模型。
[0043]与现有技术相比,本专利技术所达到的有益效果:
[0044]本专利技术通过电力公司数据库获取用户窃电行为用电数据和用户非窃电行为用电数据以及用户基本信息的用户原始用电数据,利用原始用电数据构建训练集;采用训练集训练迭代决策树算法模型,将用户用电数据输入至已训练好的迭代决策树算法模型中,获取窃电诊断结果;该方法诊断对数据特征值数量有较低要求,同时提高了诊断的准确率。
附图说明
[0045]图1是本专利技术实施例提供的一种窃电诊断系统的操作流程图;
[0046]图2是本专利技术实施例提供的一种窃电诊断方法的流程图。
具体实施方式
[0047]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0048]实施例一
[0049]如图1所示,一种窃电诊断方法,包括:
[0050]提取电力公司数据库的原始用电数据,原始用电数据包含用户窃电行为用电数据和用户非窃电行为用电数据,对用户原始用电数据进行特征提取,以获取与用户窃电行为和用户非窃电行为相对应的特征值,形成训练集,作为迭代决策树算法模型的训练数据;
[0051]原始用电数据包括按时间记录的用户用电和线损信息、用户线路异常发生的时间;线路异常包括电能表的潮流反向、电流不平衡、电压逆相序、电源异常、断相、辅助电源掉电、负荷开关误动拒动、过流、欠压、失流、失压、飞走、倒走。
[0052]根据原始用电数据提取的特征值包括:异常发生次数、异常事件发生时刻用电量变化率、异常事件发生时刻线损变化率、用户用电电压本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种窃电诊断方法,其特征在于,包括:采集当前时刻用户用电数据;将用户用电数据输入至已训练好的迭代决策树算法模型中,获取窃电诊断结果;所述迭代决策树算法模型采用下述方法训练获取:采集用户原始用电数据,用户原始用电数据包括:用户窃电行为用电数据和用户非窃电行为用电数据;利用原始用电数据构建训练集;采用训练集训练迭代决策树算法模型。2.根据权利要求1所述的一种窃电诊断方法,其特征在于,所述用户原始用电数据包括按时间记录的用户用电和线损信息、用户线路异常发生的时间。3.根据权利要求2所述的一种窃电诊断方法,其特征在于,线路异常包括电能表的潮流反向、电流不平衡、电压逆相序、电源异常、断相、辅助电源掉电、负荷开关误动拒动、过流、欠压、失流、失压、飞走、倒走。4.根据权利要求1所述的一种窃电诊断方法,其特征在于,所述方法还包括:构建训练集前,对用户原始用电数据进行特征提取,以获取与用户窃电行为和用户非窃电行为相对应的特征值;所述特征值包括:异常发生次数、异常事件发生时刻用电量变化率、异常事件发生时刻线损变化率、用户用电电压电流的均值和方差和用户基本信息。5.根据权利要求3所述的一种窃电诊断方法,其特征在于,用户基本信息包括用户的年龄、学历、性别、职业。6.根据权利要求3所述的一种窃电诊断方法,其特征在于,采用训练集训练迭代决策树算法模型的方法包括:步骤A,对于每个窃电用户,y值设定为M1,对于每个非窃电用户,其y值设定为M2,x值是由所述特征值组成的N维向量,形成训练集:D={(x1,y1),(x2,y2),...,(x
N
,y
N
)}步骤B,对训练集进行切分变量j和切分点...

【专利技术属性】
技术研发人员:王兴晨朱海东赵竟胡恩俊张庭玉黄保乐张盼
申请(专利权)人:南京华盾电力信息安全测评有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1