一种自编码网络及其训练方法、异常用电检测方法和系统技术方案

技术编号:19746289 阅读:24 留言:0更新日期:2018-12-12 04:55
本发明专利技术公开了一种自编码网络及其训练方法、异常用电检测方法和系统,其中训练方法包括:采用滑动窗口对样本电力数据进行拼接,得到训练样本集,对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,未被标记的训练样本为无标签样本;利用无标签样本对自编码网络进行无监督训练,得到自编码网络的初始化参数,然后将自编码网络的编码层得到的离散的类别标签当作分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络。然后利用训练好的自编码网络对待测用户的电力数据进行检测,判断待测用户是否异常用电。本发明专利技术能够在低密度电力数据中挖掘异常信息,避免噪声数据干扰,提高异常检测准确度。

【技术实现步骤摘要】
一种自编码网络及其训练方法、异常用电检测方法和系统
本专利技术属于用电行为分析
,更具体地,涉及一种自编码网络及其训练方法、异常用电检测方法和系统。
技术介绍
异常用电检测是电网安全用电的重要支撑。在电网运行中,无论计量装置故障或用户窃电,均会导致无法采集用户真实的用电数据,这些用电数据称为异常用电数据。用电数据异常会影响电网的调度与管理,以及供电安全,并使电力部门承受巨大损失。因此,对异常用电检测具有重要意义,通过主动发现用电数据异常,能够及时对异常的计量装置维修或窃电用户进行补缴电费和惩罚,既能够降低电力损失,更重要的是保证电网的运行安全。伴随智能电网的建成,电力数据在当今互联网背景下体现了大数据的关键要素:体量大、类型多。面对海量用电数据,虽然电力部门采用统计学以及数据挖掘相关方法进行初步检测,但误报很多,凸显“数据海量,信息匮乏”的问题。当前异常用电检测方法仍存在以下问题:(1)海量用电数据易受噪声干扰,现有方法检测效率太低,出现大量误判。(2)由于人力物力受限,现场勘查抽检效率较低,大部分为无标签样本,有标签的样本较少,监督学习只能用于小样本训练,对大规模用电数据其条件难以满足。同时,异常样本远远小于正常样本,样本严重不均衡,无论监督学习还是无监督学习方法,模型的训练存在很大难度,容易导致误判。(3)异常用电种类繁多,且表现形式分散、模糊,人工特征建模困难,人工建立的特征模型精度无法满足应用要求。而且现有的异常用电特征判定阈值的设定主观性太强,可伸缩性较差,对于用户用电情况多样化难以进行区分。可见,传统的检测方法已经无法满足需求,如何对用电大数据进行深入分析挖掘,有效检测异常用电,已成为电网发展的必然要求。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种自编码网络及其训练方法、异常用电检测方法和系统,由此解决现有技术存在模型的训练存在很大难度、检测效率太低,出现大量误判的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种自编码网络的训练方法,包括:(1)获取样本电力数据,对样本电力数据进行预处理;(2)采用滑动窗口对预处理后的样本电力数据进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本;(3)利用无标签样本对自编码网络进行无监督训练,得到自编码网络的初始化参数,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络。进一步地,预处理包括过滤噪声数据、填补缺失数据以及归一化。进一步地,自编码网络的隐藏层包括一个离散的类别标签和一个连续的高斯变量,所述自编码网络还包括噪声层。进一步地,步骤(2)包括:采用滑动窗口在预处理后的样本电力数据中滑动,得到k天的数据,k天的数据包括k天的三相电压、三相电流、总有功功率和总功率因数,将k天的三相电压、三相电流、总有功功率和总功率因数进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本。进一步地,步骤(3)包括:利用无标签样本对自编码网络的每一层进行无监督训练,将每一层的训练结果作为下一层的输入,得到自编码网络的初始化参数,采用随机梯度下降算法结合BP反向传播算法对初始化参数进行调整,得到最优的自编码网络,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络。按照本专利技术的另一方面,提供了一种训练好的自编码网络,所述训练好的自编码网络由上述一种深度自编码网络的训练方法训练得到。按照本专利技术的另一方面,提供了一种基于自编码网络的异常用电检测方法,包括:(1)获取样本电力数据,对样本电力数据进行预处理;(2)采用滑动窗口对预处理后的样本电力数据进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本;(3)利用无标签样本对自编码网络进行无监督训练,得到自编码网络的初始化参数,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络;(4)利用训练好的自编码网络对待测用户的电力数据进行检测,判断待测用户是否异常用电。进一步地,步骤(4)包括:将待测用户的电力数据进行预处理后输入训练好的自编码网络,得到类别标签,对于类别标签沿横坐标取最大值索引,若最大值索引为1,表明检测为异常用电,若最大值索引为0,表明检测为正常用电。按照本专利技术的另一方面,提供了一种基于自编码网络的异常用电检测系统,其特征在于,包括:数据预处理模块,用于获取样本电力数据,对样本电力数据进行预处理;样本标记模块,用于采用滑动窗口对预处理后的样本电力数据进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本;模型训练模块,用于利用无标签样本对自编码网络进行无监督训练,得到自编码网络的初始化参数,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络;异常检测模块,用于利用训练好的自编码网络对待测用户的电力数据进行检测,判断待测用户是否异常用电。进一步地,异常检测模块将待测用户的电力数据进行预处理后输入训练好的自编码网络,得到类别标签,对于类别标签沿横坐标取最大值索引,若最大值索引为1,表明检测为异常用电,若最大值索引为0,表明检测为正常用电。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:(1)本专利技术无需人工提取用电特征,解决人工特征建模精度无法满足需求的难题,并自适应电力数据仅有小样本的有标签数据、正常异常样本分布不均衡的情况,能够在低密度电力数据中挖掘异常信息的,同时避免噪声数据的干扰,提高异常检测的准确度。(2)本专利技术通过海量无标签数据进行网络的无监督学习,利用深度学习网络的多层非线性网络实现自动提取特征,网络的自适应性能有效解决特征提取困难、阈值选取主观性强等问题。并在编码层加入噪声层,防止网络学习过拟合。在此基础上,充分利用小样本的有标签样本进行网络的有监督学习。本专利技术既充分利用无标签和有标签样本,又能自动提取特征,在低密度电力数据中挖掘异常信息的同时避免噪声数据的干扰,提高异常检测的准确度,减小误判,降低现场排查的成本,保证电力公司的高效运营。附图说明图1是本专利技术实施例提供的总体流程图;图2是本专利技术实施例提供的对样本电力数据进行预处理的流程图;图3是本专利技术实施例提供的自编码网络的结构图;图4是本专利技术实施例提供的训练网络的流程图;图5是本专利技术实施例提供的异常用电检测的流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术本文档来自技高网
...

【技术保护点】
1.一种自编码网络的训练方法,其特征在于,包括:(1)获取样本电力数据,对样本电力数据进行预处理;(2)采用滑动窗口对预处理后的样本电力数据进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本;(3)利用无标签样本对自编码网络进行无监督训练,得到自编码网络的初始化参数,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络。

【技术特征摘要】
1.一种自编码网络的训练方法,其特征在于,包括:(1)获取样本电力数据,对样本电力数据进行预处理;(2)采用滑动窗口对预处理后的样本电力数据进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本;(3)利用无标签样本对自编码网络进行无监督训练,得到自编码网络的初始化参数,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络。2.如权利要求1所述的一种自编码网络的训练方法,其特征在于,所述预处理包括过滤噪声数据、填补缺失数据以及归一化。3.如权利要求1或2所述的一种自编码网络的训练方法,其特征在于,所述自编码网络的隐藏层包括一个离散的类别标签和一个连续的高斯变量,所述自编码网络还包括噪声层。4.如权利要求1或2所述的一种自编码网络的训练方法,其特征在于,所述步骤(2)包括:采用滑动窗口在预处理后的样本电力数据中滑动,得到k天的数据,k天的数据包括k天的三相电压、三相电流、总有功功率和总功率因数,将k天的三相电压、三相电流、总有功功率和总功率因数进行拼接,得到训练样本集,根据现场勘察结果对训练样本集中包含被勘察用户的训练样本进行标记,得到有标签样本,训练样本集中未被标记的训练样本为无标签样本。5.如权利要求1或2所述的一种自编码网络的训练方法,其特征在于,所述步骤(3)包括:利用无标签样本对自编码网络的每一层进行无监督训练,将每一层的训练结果作为下一层的输入,得到自编码网络的初始化参数,采用随机梯度下降算法结合BP反向传播算法对初始化参数进行调整,得到最优的自编码网络,然后将自编码网络的编码层得到的离散的类别标签当作一个分类器,利用有标签样本对分类器进行有监督训练,更新编码层参数,得到训练好的自编码网络。6.一种训练好的自编码网络,其特征在于,所述训练好的自编码网络由权利要求1-5任一所述的一种深度自编码网络的训练方法训练得到。7.一种基于自编码网络的异常用电...

【专利技术属性】
技术研发人员:王非陈文娴张灿
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1