一种基于迁移学习的窃电检测方法技术

技术编号:34609651 阅读:38 留言:0更新日期:2022-08-20 09:14
本发明专利技术公开了一种基于迁移学习的窃电检测方法,所述方法包括:获取目标域测试集、源域数据集和目标域训练集;对目标域测试集、源域数据集和目标域训练集进行预处理;将源域数据集划分训练集和测试集;搭建源域和目标域神经网络模型;对源域神经网络模型进行预训练和评估;将源域神经网络模型的参数迁移到目标域神经网络模型进行初始化;训练目标域神经网络模型;对目标域测试集进行窃电检测分类。本发明专利技术能够在少量含有窃电状态标签用电数据的情况下,通过迁移学习技术根据用电数据短时间内准确识别窃电用户,克服深度学习方法依赖大量带窃电状态标签数据的问题;另外,以日、周、月周期数据作为神经网络模型的输入,提高窃电检测模型的性能。模型的性能。模型的性能。

【技术实现步骤摘要】
一种基于迁移学习的窃电检测方法


[0001]本专利技术涉及窃电检测
,具体涉及一种基于迁移学习的窃电检测方法。

技术介绍

[0002]窃电给电力公司、社会、国家带来非常严重的后果和伤害。窃电不仅在各个国家每年造成巨大的经济损失,而且还会影响电网的稳定性。随着智能电网的发展,电力系统逐渐实现数字化,海量的用户用电数据将被获得,为基于深度学习进行窃电检测提供了基础。然而,单个智能电表不具备窃电检测功能,只能提供大量无窃电状态标签的用电数据,如果需要根据大量智能电表提供的海量用电数据鉴别用户窃电状态并为每个用户设置窃电状态标签,需要巨大的人力成本。因此,带有窃电状态标签的用电数据数量很少,导致依赖数据标签的深度学习窃电检测方法在实际情况下难以得到有效训练,不能发挥其检测性能,无法正确检测出窃电用户。

技术实现思路

[0003]本专利技术为克服上述现有技术要求用电数据包含大量窃电状态标签导致的训练数据量不足的问题,提出一种基于迁移学习的窃电检测方法。
[0004]本专利技术的首要目的是为解决上述技术问题,本专利技术的技术方案如下:
[0005]一种基于迁移学习的窃电检测方法,其特征在于,包括以下步骤:
[0006]S1:获取检测目标区域内所有用户的子表读数,构建目标域测试集D
target
;将目标区域划分为多个分区域,检测分区域总表读数,并根据分区域总表读数、分区域内所有用户子表读数、电能技术损耗和误差阈值判断分区域是否存在窃电,并设置窃电状态标签,构建源域数据集D
source
;获取少量历史用户的用电数据及其窃电状态标签,构建目标域训练集D
train

[0007]S2:将步骤S1所述的目标域测试集、源域数据集、目标域训练集分别进行数据预处理,将其中所有用电数据序列分别以日、周、月为时间周期转化为用电数据矩阵,然后进行缺失值恢复、数据清洗、数据归一化;
[0008]S3:将步骤S2所述的源域数据集划分为源域训练集和源域测试集;
[0009]S4:搭建源域和目标域CNN神经网络模型,所述CNN神经网络模型包括三个输入层、多个卷积层和多个全连接层;
[0010]S5:使用源域训练集对源域CNN神经网络模型进行预训练,使用源域测试集对源域CNN神经网络模型进行评估;
[0011]S6:保存步骤S5评估合格的源域CNN神经网络模型参数,并将其迁移到待训练的目标域CNN神经网络模型中,对目标域CNN神经网络模型参数进行初始化;
[0012]S7:采用目标域训练集中所有用户的用电数据及其对应的窃电状态标签对步骤S6所述已初始化的目标域CNN神经网络模型进行训练;
[0013]S8:将目标域测试集中所有用户的用电数据输入到步骤S7训练的目标域CNN神经
网络模型,分类用户类型,寻找目标区域内窃电用户。
[0014]本方案中,步骤S1所述的目标域测试集D
target
、源域数据集D
source
和目标域训练集D
train
,其具体组成步骤如下:
[0015]S101:记录目标区域内所有用户子表的读数作为对应用户的用电数据,并构建目标域测试集D
target
如下:
[0016][0017]其中,d
m
表示用户m的用电数据序列;d
m,n
表示用户m第n个采样记录的数据;
[0018]S102:将目标区域划分为多个分区域,检测分区域总表读数,作为分区域用电数据如下:
[0019][0020]其中,d
sub,g
表示分区域g的用电数据序列;d
sub,g,n
表示分区域g第n个采样记录的数据;
[0021]S103:按所在区域将各个分区域内的用户子表读数相加,得到各个分区域用户总用电数据如下:
[0022][0023]其中,d
reg,g
表示分区域g的用户总用电数据序列;d
reg,g,n
表示分区域g第n个采样记录的数据;
[0024]S104:计算各个分区域总表到用户子表之间输电线路的电能技术损耗d
TL,g
;根据下式计算各分区域的窃电状态标签:
[0025][0026]其中,y
reg,g
表示分区域g的窃电状态标签,y
reg,g
=1表示为窃电状态,y
reg,g
=0表示为正常状态;α为误差阈值;
[0027]S105:将各个分区域的用户总用电数据序列及其窃电状态标签组合构建源域数据集D
source

[0028][0029]S106:根据少量历史用户的用电数据及其窃电状态标签,构建目标域训练集D
train
如下:
[0030][0031]其中,d
his,k
表示历史用户k的用电数据序列;d
his,k,n
表示历史用户k第n个采样记录的数据;y
his,k
表示历史用户k的窃电状态标签。
[0032]本方案中,步骤S2所述的数据预处理,其具体组成步骤如下:
[0033]S201:针对步骤S1所述的目标域测试集、源域数据集和目标域训练集,将其中所有用电数据序列分别以日、周、月为时间周期,转化为用电数据矩阵,所述用电数据矩阵的每一行代表单个时间周期内的用电数据,构建日周期数据矩阵D
day
、周周期数据矩阵D
week
、月周期数据矩阵D
month
如下:
[0034][0035][0036][0037]其中,o表示电表采样的天数;p表示电表采样的周数;q表示电表采样的月数;
[0038]S202:将日周期数据矩阵D
day
、周周期数据矩阵D
week
、月周期数据矩阵D
month
进行缺失值恢复、数据清洗、数据归一化处理。
[0039]本方案中,步骤S4所述的搭建源域和目标域CNN神经网络模型,其具体组成步骤如下:
[0040]S401:所述的CNN神经网络模型有三个输入层,包括日周期数据输入X
day
、周周期数据输入X
week
和月周期数据输入X
month
,其大小分别为o
×
(24
×
60/n)、p
×
(24
×
60
×
7/n)和q
×
(24
×
60
×
30/n);
[0041]S402:分别使用多个卷积层对三组输入数据进行卷积操作:
[0042]S1=f(WX
day
+b)
[0043]S2=f(WX
w本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习的窃电检测方法,其特征在于,包括以下步骤:S1:获取检测目标区域内所有用户的子表读数,构建目标域测试集D
target
;将目标区域划分为多个分区域,检测分区域总表读数,并根据分区域总表读数、分区域内所有用户子表读数、电能技术损耗和误差阈值判断分区域是否存在窃电,并设置窃电状态标签,构建源域数据集D
source
;获取少量历史用户的用电数据及其窃电状态标签,构建目标域训练集D
train
;S2:将步骤S1所述的目标域测试集、源域数据集、目标域训练集分别进行数据预处理,将其中所有用电数据序列分别以日、周、月为时间周期转化为用电数据矩阵,然后进行缺失值恢复、数据清洗、数据归一化;S3:将步骤S2所述的源域数据集划分为源域训练集和源域测试集;S4:搭建源域和目标域CNN神经网络模型,所述CNN神经网络模型包括三个输入层、融合层、多个卷积层和多个全连接层;S5:使用源域训练集对源域CNN神经网络模型进行预训练,使用源域测试集对源域CNN神经网络模型进行评估;S6:保存步骤S5评估合格的源域CNN神经网络模型参数,并将其迁移到待训练的目标域CNN神经网络模型中,对目标域CNN神经网络模型参数进行初始化;S7:采用目标域训练集中所有用户的用电数据及其对应的窃电状态标签对步骤S6所述已初始化的目标域CNN神经网络模型进行训练;S8:将目标域测试集中所有用户的用电数据输入到步骤S7训练的目标域CNN神经网络模型,分类用户类型,寻找目标区域内窃电用户。2.根据权利要求1所述的一种基于迁移学习的窃电检测方法,其特征在于,步骤S1所述的目标域测试集D
target
、源域数据集D
source
和目标域训练集D
train
,其具体组成步骤如下:S101:记录目标区域内所有用户子表的读数作为对应用户的用电数据,并构建目标域测试集D
target
如下:其中,d
m
表示用户m的用电数据序列;d
m,n
表示用户m第n个采样记录的数据;S102:将目标区域划分为多个分区域,检测分区域总表读数,作为分区域用电数据如下:其中,d
sub,g
表示分区域g的用电数据序列;d
sub,g,n
表示分区域g第n个采样记录的数据;S103:按所在区域将各个分区域内的用户子表读数相加,得到各个分区域用户总用电数据如下:
其中,d
reg,g
表示分区域g的用户总用电数据序列;d
reg,g,n
表示分区域g第n个采样记录的数据;S104:计算各个分区域总表到用户子表之间输电线路的电能技术损耗d
TL,g
;根据下式计算各分区域的窃电状态标签:其中,y
reg,g
表示分区域g的窃电状态标签,y
reg,g
=1表示为窃电状态,y
reg,g
=0表示为正常状态;α为误差阈值;S105:将各个分区域的用户总用电数据序列及其窃电状态标签组合构建源域数据集D
source
:S106:根据少量历史用户的用电数据及其窃电状态标签,构建目标域训练集D
train
如下:其中,d
his,k
表示历史用户k的用电数据序列;d
his,k,n
表示历史用户k第n个采样记录的数据;y
his,k
表示历史用户k的窃电状态标签。3.根据权利要求1所述的一种基于迁移学习的窃电检测方法,其特征在于,步骤S2所述的数据预处理,其具体组成步骤如下:S201:针对步骤S1所述的目标域测试集、源域数据集和目标域训练集,将其中所有用电数据序列分别以日、周、月为时间周期,转化为...

【专利技术属性】
技术研发人员:邓全镔陈思哲章云
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1