一种基于扩展数据库与融合模型的窃电行为识别方法技术

技术编号:39195855 阅读:8 留言:0更新日期:2023-10-27 08:42
一种基于扩展数据库与融合模型的窃电行为识别方法,通过分析传感器等获取的电力数据对窃电行为进行识别。窃电行为在电力应用中属于低频事件,数据量在总数据中处于少数数据的地位,但是在融合模型学习过程中,数据量过少,无法对模型进行有效的训练,因此采用深度学习模型在窃电行为识别方面应用非常有限。本发明专利技术针对此问题,提出了对窃电数据进行模拟插值的方式,主要通过对于窃电数据的特征分析,生成与窃电数据特征近似的模拟数据,形成窃电数据与正常用电数据达到合理比例数据集,通过数据集对融合模型进行训练,最终实现模型对于窃电行为的识别。结果表明,该发明专利技术能够解决窃电行为分析中,窃电数据较少导致的模型无法有效训练的问题。练的问题。练的问题。

【技术实现步骤摘要】
一种基于扩展数据库与融合模型的窃电行为识别方法


[0001]本专利技术设计防止窃电领域,尤其是一种基于扩展数据库与融合模型的窃电行为识别方法。

技术介绍

[0002]窃电行为对国家经济和资源造成重大损失,给电网的安全运行带来极大的隐患,威胁到人民群众的生命和财产安全。尽管这种电力损失是由少数消费者造成的,但它降低了公用事业公司的盈利能力和能源效率,导致所有用户的成本增加,并产生诸如减载、工业常规阻碍和通货膨胀等问题。智能电网可以通过数据分析技术显着减少这种损失。通过分析窃电用户的智能电网数据,包括用户的用电量,用电时段等信息,识别窃电用户。通过深度学习的方法能够根据数据的信息状态,多角度识别窃电用户,学习的模型对于窃电用户的数据变化具有明显的适应度。但识别过程中,数据的呈现与目标识别的效果之间存在一定的矛盾,主要变现为:窃电用户属于少数人员,窃电数据在总数据量中处于少量的存在,数据量过少导致依据此数据量学习,进而识别窃电用户变得困难,识别效率和识别率都较为低下,而这又是主要应该解决的问题。目前,电网公司主要通过延长数据获取时间,增大数据获取量来解决此问题,但是此种方法通过放任窃电用户的行为,用以收集更多数据,不是最佳的方法,且有可能造成隐患的扩大。

技术实现思路

[0003]针对上述存在的问题,本专利技术提出一种基于深度学习技术的窃电用户识别系统。包括获取电力系统的用电信息、针对信息数据进行提取、变换、归一化等过程、根据表征窃电的特征数据进行进行异常数据插值拓展构建数据库、利用数据库训练CNN(卷积神经网络)与LSTM(长短期记忆网络)、训练后的模型对用电信息数据具有明显的识别效果,且克服了窃电信息数据量少,分布不均匀的问题。具有分类速度快,识别率高的,数据输入量低的特点。
[0004]为了实现上述目的,本专利技术所采用的技术方案如下:一种基于深度学习技术的窃电用户识别系统包括以下步骤:步骤S1:使用电力信息获取系统,其中包括:主控制器、检测模块、电力线载波通信模块、主从控制器等获取用电电力信息。
[0005]步骤S2:将获取的样本数据信息按照k均值聚类的方法,进行分析。
[0006]步骤S3:将数据分为绝对正常用电数据和疑似窃电数据,窃电数据三大类。
[0007]步骤S4:将疑似窃电用电数据,窃电用电数据进行合并,任选其中的多组组合,根据组合的数据类型,进行数据的插值,生成更多的与检测数据具有相同表征特征的插值数据。
[0008]步骤S5: 将原始窃电数据库和插值生成的数据库构建窃电库信息。
[0009]步骤S6: 将插值后的窃电数据库与采集获得正常用电数据库构成综合数据库。
[0010]步骤S7:将全部数据集按照8:2分割成为训练集和测试集。
[0011]步骤S8: 训练CNN

LSTM的融合模型。
[0012]步骤S9: 构建窃电用户发觉模型。
[0013]步骤S10:验证模型效果,调整模型参数。
[0014]步骤S11:确定模型。
[0015]通过本专利技术提出的方法,针对窃电数据量少不易识别的问题,通过对原始数据特征的分析,构建拓展数据集;使用CNN

LSTM组合决策方法,使用拓展后的数据集对CNN

LSTM模型进行训练的所提出窃电用户识别模型表现了较高的识别准确度,实现窃电行为的快速识别。
[0016]本专利技术的有益效果是,通过对数据集的目标特征点进行预处理,提高表征值的数量,训练模型,使得CNN

LSTM混合模型对于窃电行为具有更好的识别效果。
附图说明
[0017]下面结合附图和实施例对本专利技术进一步说明。
[0018]图1是算法流程图;图2是窃电数据插值过程;
实施方式
[0019]为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述。附图中给出了本专利技术的若干个实施例。但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术的公开内容更加透彻全面。
[0020]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制于本专利技术。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0021]【实施例1】如图1所示,模块1表示通过传感器、载波通信模块等获取原始用电信息;原始用电信息中含有大量的混杂数据,使用K均值聚类的方法,通过设定K=3,将数据聚类为正常用电信息用模块5表示、疑似窃电信息用模块3表示、窃电信息用模块4表示;疑似窃电信息与窃电信息合并为原始窃电数据库用模块6表示;为了拓展原始窃电数据库,选取其中的成对通过公式插值模型(模块7)生成相同数据类型的窃电数据;通过插值补充后的窃电信息数据库用模块8表示;此时窃电模块数据库与正常用电信息库的信息量达到6:4;构建合成综合数据库用模块9表示;将该数据库分为训练数据库用模块10表示;验证数据库用模块11表示;训练数据库作为CNN

LSTM综合模型用模块12表示;实现窃电用户发觉目标模型用模块13表示;最后用验证数据库用模块11表示对CNN

LSTM模型进行验证,修正相关的权重值,进一步细化形成确定模型用模块15表示。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于扩展数据库与融合模型的窃电行为识别方法。包括以下步骤:步骤S1:使用电力信息获取系统,其中包括:主控制器、检测模块、电力线载波通信模块、主从控制器等获取用电电力信息;步骤S2:将获取的样本数据信息按照k均值聚类的方法,进行分析;步骤S3:将数据分为绝对正常用电数据和疑似窃电数据,窃电数据三大类;步骤S4:将疑似窃电用电数据,窃电用电数据进行合并,任选其中的多组组合,根据组合的数据类型,进行数据的插值,生成更多的与检测数据具有相同表征特征的插值数据;步骤S5:将原始窃电数据库和插值生成的数据库构建窃电库信息;步骤S6:将插值后的窃电数据库与采集获得正常用电数据库构成综合数据库;步骤S7:将全部数据集按照8:2分割成为训练集和测试集;步骤S8:训练CNN

LSTM的融合模型;步骤S9:构建窃电用户发觉模型;步骤S10:验证模型效果,调整模型参数;步骤S11:确定模型。2.根据权利1要求所述的一种基于扩展数据库与融合模型的窃电行为识别方法,其特征在于:步骤S4

【专利技术属性】
技术研发人员:程建新刘再红王尧柱欧阳正朱伟鸿
申请(专利权)人:深圳市同昌汇能科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1