当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于三元组孪生网络的窃电检测方法技术

技术编号:30324778 阅读:20 留言:0更新日期:2021-10-10 00:03
本发明专利技术公开了一种基于三元组孪生网络的窃电检测方法,包括如下步骤:对用电数据进行数据预处理,得到原始数据集;利用格拉姆角场实现用电序列图像化,获取到用电特征图像;将用电特征图像拆分成训练数据集和测试数据集;在训练数据集中随机选取样本组,对三元组孪生神经网络进行训练;从训练集中划分一部分作为支撑集,根据测试数据集与支撑集内两类样本间的总欧式距离,利用训练好的三元组孪生神经网络判断测试样本的类别。本发明专利技术将三元组孪生神经网络作为小样本深度学习算法,可以在数据集内仅有少量样本的情况下获得较强的泛化能力,可帮助工程人员正确判断窃电用户,为治理用户窃电问题提供针对性的理论指导,应用价值和前景巨大。景巨大。景巨大。

【技术实现步骤摘要】
一种基于三元组孪生网络的窃电检测方法


[0001]本专利技术涉及窃电检测
,具体涉及一种基于三元组孪生网络的窃电检测方法。

技术介绍

[0002]用户的窃电行为直接造成供电企业的大量的经济损失。据统计,仅在2019年1月至7月,国家电网公司处罚的窃电案例总计追回电量高达5.78亿千瓦时,挽回经济损失17.39亿元,因此对窃电行为的精准打击成为了供电企业工作的重点。
[0003]近年来由于智能电网高速发展,高级计量架构(Advanced Metering Infrastructure,AMI)大量部署提供了海量高精度用电计量数据,为数据驱动型窃电识别算法的研究奠定了坚实的基础。在数据驱动型窃电检测领域,国内外学者已开展了大量的研究,主要的窃电检测算法可以分为以下2类:基于状态估计的窃电检测算法与基于人工智能技术的窃电检测算法。基于状态估计的窃电检测方法是建立在电网各节点的电压与功率特性上,结合潮流方程约束来估计用户的用电状态。然而该方法要求掌握详细的网络拓扑结构,并在配电网关键位置添加计量装置,投入工程应用的局限性较大,因而促进了基于人工智能技术的窃电检测算法的发展。一些学者提出了多层次非负稀疏编码和支持向量机(SupportVector Machine,SVM)的窃电检测方法、基于深度循环神经网络的窃电检测方法和Bagging异质集成学习算法。然而由于在实际情况下,居民窃电案例的发生概率极低,导致了窃电样本的数据量极少,传统的人工智能算法难以充分学习居民窃电行为特征,容易产生模型过拟合现象,使得上述方法的应用受到一定的限制。针对上述问题,大量文献提出了小样本学习方法。一些学者提出使用数据过采样算法,如随机过采样、合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)算法和自适应综合过采样方法(Adaptive Synthetic Sampling,ADASYN)算法扩充数据集,再利用传统深度学习算法进行识别。然而由于过采样算法的思想是简单的随机复制样本或使用插值的方式生成新样本,若随机复制样本则更容易产生模型过拟合现象,而如果使用插值生成新样本,则容易放大数据噪声,导致生成样本不符合实际样本分布情况。有学者提出利用朴素贝叶斯模型解决小样本数据的分类问题。然而由于朴素贝叶斯模型假设属性之间相互独立,因而对输入的样本特征有较高的要求,需要依据一定的专家经验。

技术实现思路

[0004]专利技术目的:为了克服现有技术中存在的特征提取能力差、小样本场景下识别正确率低的问题,提供一种基于三元组孪生网络的窃电检测方法。
[0005]技术方案:为实现上述目的,本专利技术提供一种基于三元组孪生网络的窃电检测方法,包括如下步骤:
[0006]S1:对用电数据进行数据预处理,得到原始数据集;
[0007]S2:基于原始数据集,利用格拉姆角场实现用电序列图像化,获取到用电特征图
像;
[0008]S3:将用电特征图像拆分成训练数据集和测试数据集;
[0009]S4:在训练数据集中随机选取样本组,对三元组孪生神经网络进行训练;
[0010]S5:从训练集中划分一部分作为支撑集,根据测试数据集与支撑集内两类样本间的总欧式距离,利用训练好的三元组孪生神经网络判断测试样本的类别。
[0011]进一步地,所述步骤S1中数据预处理的方法流程为:
[0012]A1:对用户用电数据进行异常值处理;
[0013]A2:将用电数据降采样至采样间隔达到设定时间值;
[0014]A3:从数据集中截取用户设定时间范围内的正常用电与窃电数据。
[0015]进一步地,所述步骤S2具体包括如下步骤:
[0016]B1:使用分段聚合近似(Piecewise aggregate approximation,PAA)对原始时间序列进行降维处理;
[0017]B2:将降维处理后的时间序列转换到极坐标内;
[0018]B3:使用格拉姆和角场(Gramian SummationAngular Field,GASF)对时间序列进行图像化;
[0019]B4:将图像化后的所得数据进行标准化处理,获取到用电特征图像。
[0020]进一步地,所述步骤B1中分段聚合近似的算法公式如下:
[0021][0022]式中,q
j
表示原始时间序列,长度为k*i;表示聚合后的时间序列,长度为i。
[0023]进一步地,所述步骤B3中利用格拉姆和角场进行图像化处理的表达式如下:
[0024][0025]由上式可见,矩阵内每一个元素值都是其行索引与列索引角度和的余弦值。
[0026]进一步地,所述步骤S4中样本组包含锚样本、正样本和负样本,其中,锚样本与正样本属于同一类,而锚样本与负样本属于不同类,对三元组孪生神经网络的训练方法为:将样本组作为三元组孪生网络的输入样本,利用权值共享的三个卷积神经网络提取各样本的特征,并在最后一层中输出。
[0027]进一步地,所述步骤S4中三元组孪生神经网络的的损失函数如式所示:
[0028]L
t
=max[||v
a

v
p
||2‑
||v
a

v
n
||2+threshold,0][0029]式中,v
a
、v
p
和v
n
分别表示样本组中的锚样本、正样本以及负样本,||v
a

v
p
||2表示锚样本与正样本之间的欧式距离,而||v
a

v
n
||2表示锚样本与负样本之间的欧式距离。
[0030]本专利技术截取用户一周的用电量数据并使用格拉姆角场实现序列图像化,使其更好的体现序列中不同时刻间的关联性,再随机选取包含锚样本、正样本和负样本的样本组作为样本数据,通过模型训练最小化同类样本间距离,扩大非同类样本间距离,最终通过测试样本与支撑集内两类样本间的总欧式距离判断测试样本的类别。由于三元组孪生神经网络在传统孪生网络对比损失函数的基础上进行了改进,不仅对训练样本本身的特征进行提取,还对同类样本对的相似性与非同类样本对的差异性进行了学习,因而提高了样本特征
的提取能力,在小样本情况下拥有较高的辨识正确率。
[0031]本专利技术将改进和优化后的三元组孪生神经网络作为小样本深度学习算法,不仅提取了输入样本的特征进行学习,还对同类样本的相似性与非同类样本间的差异性规律进行了学习,因而可以在数据集内仅有少量样本的情况下获得较强的泛化能力。
[0032]有益效果:本专利技术与现有技术相比,具备如下优点:
[0033]1、三元组孪生网络的损失函数综合考虑了同类样本对与非同类样本的分布情况,使得训练时每次梯度下降的方向均与网络构造的两类样本的分布情况相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于三元组孪生网络的窃电检测方法,其特征在于,包括如下步骤:S1:对用电数据进行数据预处理,得到原始数据集;S2:基于原始数据集,利用格拉姆角场实现用电序列图像化,获取到用电特征图像;S3:将用电特征图像拆分成训练数据集和测试数据集;S4:在训练数据集中随机选取样本组,对三元组孪生神经网络进行训练;S5:从训练集中划分一部分作为支撑集,根据测试数据集与支撑集内两类样本间的总欧式距离,利用训练好的三元组孪生神经网络判断测试样本的类别。2.根据权利要求1所述的一种基于三元组孪生网络的窃电检测方法,其特征在于,所述步骤S1中数据预处理的方法流程为:A1:对用户用电数据进行异常值处理;A2:将用电数据降采样至采样间隔达到设定时间值;A3:从数据集中截取用户设定时间范围内的正常用电与窃电数据。3.根据权利要求1所述的一种基于三元组孪生网络的窃电检测方法,其特征在于,所述步骤S2具体包括如下步骤:B1:使用分段聚合近似对原始时间序列进行降维处理;B2:将降维处理后的时间序列转换到极坐标内;B3:使用格拉姆和角场对时间序列进行图像化;B4:将图像化后的所得数据进行标准化处理,获取到用电特征图像。4.根据权利要求3所述的一种基于三元组孪生网络的窃电检测方法,其特征在于,所述步骤B1中分段聚合近似的算法公式如下:式中,q
j
表示原始时间序列,长度为k*i;表示聚合后的时间序列,长度为i。5.根据权利要求3所述的一种基于三元组孪生网络的窃电检测方法,其特征在于,所述步骤B3中利用格拉姆和角场进行图像化处理的表达式如下:由上式可见,矩阵内每一个元素值都是其行索引与列索引角度和的余弦值。6.根据权利要求1所述的一种基于三元组孪生网络的窃电检测方法,其特征在于,所述步骤S4中样本组包含锚样...

【专利技术属性】
技术研发人员:梅飞顾佳琪张家堂裴鑫陈子平
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1