一种基于BiGAN和SVDD的异常用电行为检测装置制造方法及图纸

技术编号:34522319 阅读:21 留言:0更新日期:2022-08-13 21:12
本发明专利技术提供一种基于BiGAN和SVDD的异常用电行为检测装置,所述装置包括:BiGAN单元包括三个部分:生成器,编码器和判别器,该单元的目标是将高维度数据用较低维度的特征进行表征;SVDD单元主要通过寻找核空间最小超球面来逼近正常采样数据,建立异常用电行为检测模型;交替更新单元实现BiGAN单元和SVDD单元的交替更新训练,使得BiGAN单元提取更加适合的特征数据用于SVDD中异常用电行为检测模型的建立。本发明专利技术提供的基于BiGAN和SVDD的异常用电行为检测装置和方法不仅可以克服用电测量数据高维度和数据类别严重不均衡带来的挑战,且可实现特征提取和异常检测方法的交替更新,提高异常用电行为检测精确度。常用电行为检测精确度。常用电行为检测精确度。

【技术实现步骤摘要】
一种基于BiGAN和SVDD的异常用电行为检测装置


[0001]本专利技术涉及数据分析
,尤其涉及一种基于BiGAN和SVDD的异常用电行为检测装置。

技术介绍

[0002]在电力系统中,异常用电行为(如窃电行为)带来的能源消耗在系统总能耗中所占的比例不可忽略。研究表明,全世界范围内由异常用电造成的经济损失达960亿美元。如窃电这一恶劣行为不仅导致较高的电价和高昂的政府补贴,且一些高危的非法电源连接不仅会造成国家的公共安全危机,甚至威胁电力公司财务的可持续性发展。
[0003]为了检测异常用电行为从而减少相应的经济损失,当前急需有效的异常用电行为检测装置和方法。因电费是根据电价和负荷情况(计费系统中的仪表读数)联合获取的,窃电行为通常通过操纵负荷情况来实现电力欺诈和攻击,因此,从理论上讲,可以通过对负荷情况进行详细的数据分析来鉴别可能存在的电力欺诈和窃电行为。目前,越来越多的智能电表和高级计量基础设施大大提高了所测负荷情况的分辨率,这为电力公司提供了更多深入了解用户的消费模式和使用行为的机会,这些信息都可以被用到电力欺诈和窃电行为的检测中。但当前对异常用电行为的检测依然存在以下挑战:
[0004]1.测量数据的高维度:挑战之一是现有模型处理高维数据的能力有限。如上所述,部署智能电表极大提高了负荷情况的分辨率,这不仅为深入了解用户消费模式开辟了新方式,而且大大增加了异常用电行为检测模型要处理数据的维度。然而当前大多数异常用电行为检测模型仍然基于传统分类器,而这些传统模型由于缺乏在高维空间中学习复杂函数的能力,因此在处理高维问题时泛化能力非常受限。
[0005]2.可用数据类别严重不均衡:异常用电行为检测的另一挑战是可用数据的类别严重不均衡。实际上,异常用电用户的数量和实际电力用户相比较而言非常少,电力公司在线检查时只能采样到非常少的异常用电用例。例如,在2001年,美国亚利桑那公共服务公司检测到仪表篡改比例仅为0.72%。异常用电行为数据的缺乏导致了在异常用电行为检测时数据类别的严重不均衡。

技术实现思路

[0006]有鉴于此,本专利技术设计了一种基于双向生成对抗网络(Bidirectional generative adversarial networks,BiGAN)和支持向量数据描述(Support vector data description,SVDD)的异常用电行为检测装置,这种装置不仅可以克服用电测量数据高维度和数据类别严重不均衡带来的挑战,且可实现特征提取和异常检测方法的交替更新,提高异常用电行为检测精确度。
[0007]为达到上述目的,本专利技术提供如下技术方案:
[0008]一种一种基于BiGAN和SVDD的异常用电行为检测装置,所述装置是基于双向生成对抗网络(BiGAN)和支持向量数据描述(SVDD)的异常用电行为检测装置,所述装置包括:
[0009]BiGAN单元,该单元包括三个部分:生成器,编码器和判别器,该单元的目标是将高维度数据用较低维度的特征进行表征;
[0010]SVDD单元,该单元根据BiGAN单元中编码器提取的数据特征,通过寻找核空间最小超球面逼近正常采样数据,建立异常用电行为检测模型;
[0011]交替更新单元,用于实现BiGAN单元和SVDD单元的交替更新训练,使得BiGAN单元提取更加适合的特征数据用于SVDD中异常用电行为检测模型的建立。
[0012]其中,BiGAN单元的三个组成部分生成器,编码器和判别器的功能分别为:生成器的目的是生成能够欺骗判别器的虚假样本数据;判别器的主要目的则是尽可能判断输入样本是真实数据,还是生成器生成的虚假样本数据;编码器的作用和生成器相反,可将数据样本映射回隐空间中,因此编码器可以作为特征提取器进行数据降维。
[0013]其中,SVDD单元属于一类分类器,出现异常用电行为的用户数量和实际电力用户相比较而言非常少,电力公司在线检查时只能采样到非常少的窃电用例,因此SVDD通过寻找核空间最小超球面来逼近正常数据,从而建立异常用电行为检测模型。
[0014]其中,所述的交替更新单元,通过BiGAN单元和SVDD单元相互协作的方式来进行异常用电行为检测,同时克服高维数据和数据类别不均衡的挑战,具体来说,在解决SVDD后,可将所有采样数据到超球面中心的距离定义为损失函数来调整BiGAN的编码器,之后再将编码器提取的数据特征发送到SVDD中,两种方法交替协作从而更好地对原始采样数据进行表征以更加精准地区分正常和异常用电行为。
[0015]其中,所述BiGAN由生成器g,判别器D和编码器ε组成,生成器g试图将一个从已知分布P
z
中采样的低维度随机噪声z转换成一个虚假样本在这种情况下,判别器D就很难从中区分出真实样本X,编码器ε可将真实样本X映射为低维变量f
p
,f
p
=ε(X),此时可将X和f
p
组合成联合对(X,f
p
),同时z和相应的也可以组成成联合对则BiGAN的训练目标为:
[0016][0017]其中和分别表示(X,f
p
)和的联合分布。
[0018]其中,因BiGAN输入的电力数据是时间序列,长短期记忆网络(Long and short term memory networks,LSTM)作为循环神经网络的一种,在时间序列任务的训练上性能较好,故选择LSTM作为编码器和生成器维度降低和增大的基本方法。
[0019]其中,对应LSTM,给定[y1,...,y
t
]作为循环神经网络的输入,则对时间τ=1,...,t:
[0020]i
τ
=σ(w
ix
.y
τ
+w
ih
.h
τ
‑1+w
ic
.c
τ
‑1+b
i
)
[0021]f
τ
=σ(w
fx
.y
τ
+w
fh
.h
τ
‑1+w
fc
.c
τ
‑1+b
f
)
[0022]c
τ
=f
τ

c
τ
‑1+i
τ

tanh(w
zx
.y
τ
+w
zh
.h
τ
‑1+b
z
)
[0023]o
τ
=σ(w
ox
.y
τ
+w
oh
.h
τ
‑1+w
oc
.c
τ
‑1+b
o
)
[0024]h
τ
=o
τ

tanh本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于BiGAN和SVDD的异常用电行为检测装置,其特征在于,所述装置是基于双向生成对抗网络(BiGAN)和支持向量数据描述(SVDD)的异常用电行为检测装置,所述装置包括:BiGAN单元,该单元包括三个部分:生成器,编码器和判别器,该单元的目标是将高维度数据用较低维度的特征进行表征;SVDD单元,该单元根据BiGAN单元中编码器提取的数据特征,通过寻找核空间最小超球面逼近正常采样数据,建立异常用电行为检测模型;交替更新单元,用于实现BiGAN单元和SVDD单元的交替更新训练,使得BiGAN单元提取更加适合的特征数据用于SVDD中异常用电行为检测模型的建立。2.如权利要求1所述的装置,其特征在于,BiGAN单元的三个组成部分生成器,编码器和判别器的功能分别为:生成器的目的是生成能够欺骗判别器的虚假样本数据;判别器的主要目的则是尽可能判断输入样本是真实数据,还是生成器生成的虚假样本数据;编码器的作用和生成器相反,可将数据样本映射回隐空间中,因此编码器可以作为特征提取器进行数据降维。3.如权利要求1所述的装置,其特征在于,SVDD单元属于一类分类器,出现异常用电行为的用户数量和实际电力用户相比较而言非常少,电力公司在线检查时只能采样到非常少的窃电用例,因此SVDD通过寻找核空间最小超球面来逼近正常数据,从而建立异常用电行为检测模型。4.如权利要求1所述的装置,其特征在于,所述的交替更新单元,通过BiGAN单元和SVDD单元相互协作的方式来进行异常用电行为检测,同时克服高维数据和数据类别不均衡的挑战,具体来说,在解决SVDD后,可将所有采样数据到超球面中心的距离定义为损失函数来调整BiGAN的编码器,之后再将编码器提取的数据特征发送到SVDD中,两种方法交替协作从而更好地对原始采样数据进行表征以更加精准地区分正常和异常用电行为。5.如权利要求2所述的装置,其特征在于,所述BiGAN由生成器g,判别器D和编码器ε组成,生成器g试图将一个从已知分布P
z
中采样的低维度随机噪声z转换成一个虚假样本中采样的低维度随机噪声z转换成一个虚假样本在这种情况下,判别器D就很难从中区分出真实样本X,编码器ε可将真实样本X映射为低维变量f
p
,f
p
=ε(X),此时可将X和f
p
组合成联合对(X,f
p
),同时z和相应的也可以组成成联合对则BiGAN的训练目标为:其中P
Xfp
和分别表示(X,f
p
)和的联合分布。6.如权利要求5所述的装置,其特征在于,因BiGAN输入的电力数据是时间序列,长短期记忆网络(Long and short term memory networks,LSTM)作为循环神经网络的一种,在时间序列任务的训练上性能较好,故选择LSTM作为编码器和生成器维度降低和增大的基本方法。7.如权利要求6所述的装置,其特征在于,对应LSTM,给定[y1,...,y
t
]作为循环神经网
络的输入,则对时间τ=1,...,t:i
τ
=σ(w
ix
.y
τ
+w
ih
.h
τ
‑1+w
ic
.c
τ
‑1+b
i
)f
τ
=σ(w
fx
.y
τ
+w
fh
.h
τ
‑1+w
fc
.c
τ
‑1+b
f
)c
τ
=f
τ

【专利技术属性】
技术研发人员:唐奕明谢鸿博戚银城
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1