反窃电方法及系统技术方案

技术编号:24094521 阅读:95 留言:0更新日期:2020-05-09 09:39
本发明专利技术公开了一种反窃电方法及系统,方法包括:筛选出窃电样本,对已有窃电类别进行分类并对已有窃电样本和正常样本进行类别标记;排除正常样本形成疑似窃电样本集,并进行类别标记;针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型;将疑似窃电样本集数据输入疑似窃电识别模型,输出二分类的疑似窃电样本与疑似正常样本;根据疑似窃电识别模型输出结果与疑似窃电样本集的类别标记计算其识别准确率,并对模型参数进行反馈调整;根据调整后的模型参数确定自适应类识别的反窃电防御模拟模型;利用反窃电防御模拟模型对用户用电实时数据进行反窃电检测。本发明专利技术推动了反窃电技术研究和预警防控能力的提升,全面提升了综合反窃电侦查能力。

Method and system of anti stealing electricity

【技术实现步骤摘要】
反窃电方法及系统
本专利技术涉及一种反窃电方法及系统,属于电力信息处理

技术介绍
目前反窃电手段均是针对单一计量装置,缺乏一体化、集中式的反窃电体系,反窃电防御智能化水平低,防窃电装置单一,窃电行为发生甚至发生较长时间内,无法进行实时准确监测。针对上述问题,国网公司开展反窃电攻防演练,通过采用信息化技术,对用户窃电行为进行数据和回路特征模拟,构建攻防演练环境,在环境中模拟相关的系统、模型、人员等在窃电分析、取证、鉴定过程中的各项行为,达到对系统模型验证、对人员操作进行培训,对系统流程进行评估的目标,最终实现反窃电能力的评估。当前反窃电攻防御模拟基于用电信息采集系统数据展开反窃电研究工作,但数据处理方法多为人工经验基础上的浅层数据分析,难以发现各数据深层次的关联性;且现有采集数据存在海量无标签数据,对万级数量的电能表进行人工识别并标记效率低且存在主观误判;且反窃电知识数据库案例数据相对较少,即使对当前窃电类别进行完全识别,随着信息技术的不断发展,新的窃电类别将不断出现,仅依据反窃电知识数据库案例数据难以实现对新窃电类别的识别。针对上述问题,即基于浅层机器学习方法的异常用电数据分析已经不适用,无法发挥海量电能计量数据的优势,无法满足电网运营与管理的精准度要求。针对现有窃电异常数据分析感知能力薄弱、有效性与准确性较差等问题,亟需构建一种智能化、标准化的自适应类识别的反窃电防御措施。
技术实现思路
针现有技术的不足,本专利技术提出了一种反窃电方法及系统,其能够推动反窃电技术研究和预警防控能力提升,进而全面提升国网公司的综合反窃电侦查能力。本专利技术解决其技术问题采取的技术方案是:一方面,本专利技术实施例提供的一种反窃电方法,包括以下步骤:筛选出窃电样本,对已有窃电类别进行分类并对已有窃电样本和正常样本进行类别标记;排除正常样本形成疑似窃电样本集,并进行类别标记;针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型;将疑似窃电样本集数据输入疑似窃电识别模型,输出二分类的疑似窃电样本与疑似正常样本;根据疑似窃电识别模型输出结果与疑似窃电样本集的类别标记计算其识别准确率,并对模型参数进行反馈调整;根据调整后的模型参数确定自适应类识别的反窃电防御模拟模型;利用反窃电防御模拟模型对用户用电实时数据进行反窃电检测。作为本实施例一种可能的实现方式,所述排除正常样本形成疑似窃电样本集并进行类别标记的过程为:采用半监督k-NNM算法将部分标记的历史采集样本集进行聚类划分,排除与标记正常样本聚类的样本后,形成疑似窃电样本集,疑似窃电样本集包含部分标记窃电样本聚类的样本集和无标记样本的聚类样本集,将与有标记窃电样本聚类的样本集进行疑似窃电类别标记。作为本实施例一种可能的实现方式,所述采用半监督k-NNM算法将部分标记的历史采集样本集进行聚类划分过程具体包括以下步骤:31,在初始化阶段,基于历史采集的特征样本集为B′={b1′,b2′,…,bg′,…,b′G}及样本集内包含的有标记特征样本{bh′…}∈B,将有标记的特征样本归类,共计有k个类别则分为k+1个聚类,第k+1~k+a类为判别失败类,将样本聚类所得簇划分为C={c1,c2,…,ck,ck+1};32,计算每个无标记样本bi′一对一对应有标记样本bj′的距离,采用多维空间余弦相似度算法计算历史采集样本间的相似度:其中,m∈(1,2,…,M),M为特征数,选取cosθgh小于设定阈值L的样本bg′归入对应分类簇Cr=Cr∪{bg′},r∈{1,2,…,k+a}(2)对于未归入对应类的样本,将其归于第k+1~k+a类;33,对第k+1~k+a类内的样本数据进行均值识别:其中,是聚类簇Cr的均值向量;34,计算每个第k+1~k+a类无标记样本bg′与各聚类簇均值向量ur的距离l′gr=||bg′-ur||2,选取l′gr的最小的值r=argminr∈{1,2,…,k+1}lgr,将样本bg′归入该簇Cr=Cr∪{bg′},r∈{1,2,…,k};35,计算更新后的各聚类簇的均值向量ur与聚类分割阈值γ、z,并计算本轮的平方误差E,如果所有ur均未更新,则停止迭代,分类结果作为样本归类输出,转至步骤37;36,如果存在ur更新的数据,迭代次数w=w+1,①如果w<W,则返回步骤34,W为迭代次数阈值,②如果w=W,则选取首次归类和历次迭代平方误差E的最小值作为样本归类输出;37,根据样本归类输出,完成无标记样本的批量数据聚类与划分,并将与已标记正常样本聚类的样本数据剔除,形成高风险窃电样本集。作为本实施例一种可能的实现方式,所述针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型的过程为:基于历史采集样本集,提取标记的窃电样本集和正常用电样本集,针对窃电样本特征数据关联复杂且用电数据存在时序规律,采用GRU算法构建疑似窃电识别模型,通过对高风险窃电样本集进行窃电行为特征数据挖掘,以时间序列特征为输入,以神经网络提取并保留窃电样本用电数据的历史轨迹,并以实际正负样本的识别准确率构建损失函数,通过梯度下降对模型参数进行调整。作为本实施例一种可能的实现方式,所述采用GRU算法构建疑似窃电识别模型的过程为:基于高风险窃电样本集构建深度学习框架;设定优化函数;构建窃电识别模型,采用优化函数对输入层、隐藏层和输出层进行赋值;基于窃电样本和正常样本数据,采用梯度下降法对窃电识别模型进行训练;将训练后的窃电识别模型作为疑似窃电识别模型。作为本实施例一种可能的实现方式,所述根据疑似窃电识别模型的识别准确率对模型参数进行反馈调整的过程为:如果识别准确率小于准确率阈值,则进行参数反馈调整,调节半监督k-NNM的标记样本数据,将窃电样本识别验证数据反馈至疑似窃电识别模型,采用损失函数调节模型参数,如果识别准确率大于等于准确率阈值,则进入下一步。作为本实施例一种可能的实现方式,所述反窃电方法还包括以下步骤:对用户用电样本数据进行预处理,并将预处理后数据存入历史样本数据库。作为本实施例一种可能的实现方式,所述对用户用电样本数据进行预处理的过程为:通过用电信息采集系统收集各类典型用户用电数据样本,并以典型用户用电行为数据作为历史采集样本集,数据集包括用户窃电相关的各类特征数据,采用同一样本众数的方式进行缺失数据修复,并进行数据去噪、删除离群点和数据去冗余处理。另一方面,本专利技术实施例提供的一种反窃电系统,包括:样本筛选模块,用于筛选出窃电样本,对已有窃电类别进行分类并对已有窃电样本和正常样本进行类别标记;疑似窃电样本样本模块,用于排除正常样本形成疑似窃电样本集,并进行类别标记;模型构建模块,用于针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型;疑似窃电识别模型模块,用于本文档来自技高网...

【技术保护点】
1.一种反窃电方法,其特征是,包括以下步骤:/n筛选出窃电样本,对已有窃电类别进行分类并对已有窃电样本和正常样本进行类别标记;/n排除正常样本形成疑似窃电样本集,并进行类别标记;/n针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型;/n将疑似窃电样本集数据输入疑似窃电识别模型,输出二分类的疑似窃电样本与疑似正常样本;/n根据疑似窃电识别模型输出结果与疑似窃电样本集的类别标记计算其识别准确率,并对模型参数进行反馈调整;/n根据调整后的模型参数确定自适应类识别的反窃电防御模拟模型;/n利用反窃电防御模拟模型对用户用电实时数据进行反窃电检测。/n

【技术特征摘要】
1.一种反窃电方法,其特征是,包括以下步骤:
筛选出窃电样本,对已有窃电类别进行分类并对已有窃电样本和正常样本进行类别标记;
排除正常样本形成疑似窃电样本集,并进行类别标记;
针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型;
将疑似窃电样本集数据输入疑似窃电识别模型,输出二分类的疑似窃电样本与疑似正常样本;
根据疑似窃电识别模型输出结果与疑似窃电样本集的类别标记计算其识别准确率,并对模型参数进行反馈调整;
根据调整后的模型参数确定自适应类识别的反窃电防御模拟模型;
利用反窃电防御模拟模型对用户用电实时数据进行反窃电检测。


2.根据权利要求1所述的反窃电方法,其特征是,所述排除正常样本形成疑似窃电样本集并进行类别标记的过程为:采用半监督k-NNM算法将部分标记的历史采集样本集进行聚类划分,排除与标记正常样本聚类的样本后,形成疑似窃电样本集,疑似窃电样本集包含部分标记窃电样本聚类的样本集和无标记样本的聚类样本集,将与有标记窃电样本聚类的样本集进行疑似窃电类别标记。


3.根据权利要求2所述的反窃电方法,其特征是,所述采用半监督k-NNM算法将部分标记的历史采集样本集进行聚类划分过程具体包括以下步骤:
31,在初始化阶段,基于历史采集的特征样本集为B′={b′1,b′2,…,b′g,…,b′G}及样本集内包含的有标记特征样本{b′h…}∈B,将有标记的特征样本归类,共计有k个类别则分为k+1个聚类,第k+1~k+a类为判别失败类,将样本聚类所得簇划分为C={c1,c2,…,ck,ck+1};
32,计算每个无标记样本b′i一对一对应有标记样本b′j的距离,采用多维空间余弦相似度算法计算历史采集样本间的相似度:



其中,m∈(1,2,…,M),M为特征数,选取cosθgh小于设定阈值L的样本b′g归入对应分类簇
Cr=Cr∪{b′g},r∈{1,2,…,k+a}(2)
对于未归入对应类的样本,将其归于第k+1~k+a类;
33,对第k+1~k+a类内的样本数据进行均值识别:



其中,是聚类簇Cr的均值向量;
34,计算每个第k+1~k+a类无标记样本b′g与各聚类簇均值向量ur的距离l′gr=||b′g-ur||2,选取l′gr的最小的值r=argminr∈{1,2,…,k+1}lgr,将样本b′g归入该簇Cr=Cr∪{b′g},r∈{1,2,…,k};
35,计算更新后的各聚类簇的均值向量ur与聚类分割阈值γ、z,并计算本轮的平方误差E,如果所有ur均未更新,则停止迭代,分类结果作为样本归类输出,转至步骤37;
36,如果存在ur更新的数据,迭代次数w=w+1,
①如果w<W,则返回步骤34,W为迭代次数阈值,
②如果w=W,则选取首次归类和历次迭代平方误差E的最小值作为样本归类输出;
37,根据样本归类输出,完成无标记样本的批量数据聚类与划分,并将与已标记正常样本聚类的样本数据剔除,形成高风险窃电样本集。


4.根据权利要求1所述的反窃电方法,其特征是,所述针对疑似窃电样本集构建基于GRU算法的疑似窃电识别模型的过程为:
基于历史采集样本集,提取标记的窃电样本集和正常用电样本集,针对窃电样本特征数据关联复杂且用电数据存在时序规律,采用GRU算法构建疑似窃电识别模型,通过对高风险窃电样本集进行窃电行为特征数据挖掘,以时间序列特征为输入,以神经网络提取并保留窃电样本用电数据的历史轨迹,并以实际正负样本的识别准确率构建损失函数,通过梯度下降对模型参数进行调整。


5.根据权利要求4所述的反窃电方法,其特征是,所述采用GRU算法构建疑似窃电识别模型的过程为:
基于高风险窃电样本集构建深度学习框架;
设定优化函数;
构建窃电识别模型,采用优化函数对输入层、隐藏层和输出层进行赋值;
基于窃电样本和正常样本数据,采用梯度下降法对窃电识别模型进行训练;
将训练后的窃电识别模型作为疑似窃电识别模型。


6.根据权利要求5所述的反窃电方法,其特征是,所述根据疑似窃电识别模型的识别准确率对模型参数进行反馈调整的过程为:
如果识别准确率小于准确率阈值,则进行参数反馈调整,调节半监督k-NNM的标记样本数据,将窃电样本识别验证数据反馈至疑似窃电识别模型,采用损失函数调节模型参数,如果识别准确率大于等于准确率阈值,则进入下一步。


7.根据权利要求1-6任意一项所述的反窃电方法,其特征是,还包括以下步骤:
对用户用电样本数据进行预处理,并将预处理后数据存入历史样本数据库。


8.根据权利要求7所述的反窃电方法,其特征是,所述对用户用电样本数据进行预处理的过程为:通过用电信息采集系统收集各类典型用户用电数据样本,并以典型用户用电行为数据作为历史采集样本集,数据集...

【专利技术属性】
技术研发人员:董贤光张志代燕杰陈祉如杜艳王平欣王清李琮琮朱红霞王者龙徐新光杨剑郭亮梁波于超徐子骞
申请(专利权)人:国网山东省电力公司电力科学研究院国网山东省电力公司国家电网有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1