基于变分自编码器的低压台区线损率异常检测方法及装置制造方法及图纸

技术编号:32514153 阅读:27 留言:0更新日期:2022-03-02 11:05
本发明专利技术公开一种基于变分自编码器的低压台区线损率异常检测方法及装置,利用随机矩阵理论对线损数据进行相关性分析;筛选出线损率影响因子,构建低压台区线损率影响因子指标体系;建立基于变分自编码器的线损率异常检测模型,在隐空间内对输入特征进行建模;采样出异常特征,将产生重构数据的重构概率与阈值相比较对异常值进行识别。本发明专利技术实现了对海量线损数据的异常检测,能够为异常台区识别提供参考,同时为低压台区线损精细化管理提供了新的思路。思路。思路。

【技术实现步骤摘要】
基于变分自编码器的低压台区线损率异常检测方法及装置


[0001]本专利技术涉及电力配电领域,具体涉及一种基于变分自编码器的低压台区线损率异常检测方法及装置。

技术介绍

[0002]随着社会进步,电能的适用范围越来越广,同时其使用情况也是评估国家发展情况的重要标杆之一。电能在传输过程中,会通过各种电力元件输送给用户,由于在这些电力元器件中存在阻抗,因此电能在到达用户的过程中会损失一部分有功,这部分有功损失就是线损。
[0003]低压台区线损率的高低反映着线损管理水平的高低,它作为线损管理的重要组成部分,降低线损率、节约运行成本、使电网可以经济运行是线损管理部门的长期挑战。对线损率进行异常检测的研究,才能对其进行精细化管理,及时锁定异常台区,排查异常原因,提供可靠的故障维护措施,以更好的进行计划管理和设备管理。
[0004]传统的异常检测算法可以分为两大类:基于概率统计的异常检测和基于邻近度的异常检测。基于概率统计的异常检测基本步骤为先假设样本数据服从一定的分布,再计算每个点符合该分布的概率,得出异常数据。基于邻近度的异常检测适用于高维数据,但随着数据维度的升高,基于邻近度的异常检测计算复杂度和时间复杂度增加。
[0005]近年来,随着深度学习的日益发展,为研究思路开辟了一条新路径。深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术,其基本特点是模仿大脑的神经元之间传递,处理信息的模式。目前,深度学习已经在语音识别,自然语言处理,人脸识别,游戏开发等方面取得了优秀的实践结果。其中,变分自编码器模型将深度学习与概率统计相结合,是无监督学习中的一种重要模型。变分自编码器通过重构概率最小化以达到异常检测的目的,利用两个神经网络建立两个概率密度分布模型:一个用于原始输入数据的变分推断,生成隐变量的变分概率分布,称为推断网络;另一个根据生成的隐变量变分概率分布,还原生成原始数据的近似概率分布,称为生成网络。

技术实现思路

[0006]针对现有技术中存在的问题,本专利技术提供了一种基于变分自编码器的低压台区线损率异常检测方法及装置,利用随机矩阵理论对线损数据进行相关性分析,筛选出线损率影响因子,构建低压台区线损率影响因子指标体系,然后建立基于变分自编码器的线损率异常检测模型,在隐空间内对输入特征进行建模,采样出异常特征,将产生重构数据的重构概率与阈值相比较对异常值进行识别。本专利技术实现了对海量线损数据的异常检测,能够为异常台区识别提供参考,同时为低压台区线损精细化管理提供了新的思路。
[0007]本专利技术提出一种基于变分自编码器的低压台区线损率异常检测方法,所述方法包括以下步骤:
[0008]S1:输入台区运行数据,利用随机矩阵理论对线损数据进行相关性分析;
[0009]S2:筛选出线损率影响因子,构建低压台区线损率影响因子指标体系;
[0010]S3:建立基于变分自编码器的线损率异常检测模型,在隐空间内对输入特征进行建模;
[0011]S4:采样出异常特征,将产生重构数据的重构概率与阈值相比较对异常值进行识别。
[0012]优选地,所述台区运行数据包括:城网农网类型、运行容量、居民户数、非居民户数、居民容量、非居民容量、综合倍率、配变户均供电容量、月平均负载率、理论线损率、日功率因数、日最大负载率、日有功电量、日无功电量、总供电量、日上网电量、日发电量。
[0013]优选地,所述步骤S1包括:
[0014]生成状态数据矩阵Z
n1
,该矩阵每一行对应每一个台区i天的线损率;
[0015]选取一个影响因素,形成影响因素矩阵Z
n2
,该矩阵每一行表示该影响因素i天的数值;
[0016]引入随机矩阵N,该矩阵为非负的随机数矩阵,与矩阵Z
n2
形式相同,服从正态分布,构建实验矩阵Z和对比矩阵Z
N
如下所示:
[0017][0018]对两个矩阵分别用设定的滑动窗口进行采样,滑动窗口行数与矩阵Z相同,对每次采样窗口中的数据进行平均谱半径的计算,直到滑动窗口经过矩阵中全部数据,形成平均谱半径序列。
[0019]优选地,其特征在于,
[0020]平均谱半径差表示为:
[0021][0022]K
MSR,Z(N)
(t),K
MSR,Z
(t)分别表示实验矩阵Z平均谱半径曲线和对比矩阵Z
N
平均谱半径曲线,对平均谱半径差值进行积分计算得到相关特性指标S
MSR

[0023][0024]S
MSR
能够定性表示影响因素与线损率的相关程度。
[0025]优选地,所述变分自编码器模型是一种包含隐变量的生成模型,假设在高维空间z中存在隐变量z可以对Z中的先验P(z)采样,存在一组确定性函数f(z;θ),其中θ为参数向量,其目标在于优化θ使得z在从P(z)中采样时可以更大概率的得到近似于X的数据,其公式表达为:P(X)=∫P(X|z;θ)P(z)dz,
[0026]优化上述模型,转化为使Q(z|x)的分布N(z|μ(x;θ),σ(x;θ))尽可能逼近P(z)的分布N(0,1),其中
[0027]Q(z|x)=N(z|μ(x;θ),σ(x;θ))
[0028]μ和σ为任意确定性函数,参数θ从数据中学习得到。
[0029]优选地,所述步骤S3包括:
[0030]S31:确定变分自编码器的损失函数,根据公式
[0031][0032]将二进制交叉熵与KL散度作为变分自编码器的损失函数对模型进行优化,其中,μ和σ为任意确定性函数;
[0033]S32:使用构建好的变分自编码器模型对输入数据进行训练,通过训练得到变分自编码器的默认参数σ(i),μ(i);
[0034]S33:根据σ(i),μ(i)得到关于z的正态分布N(μ(i),σ(i))并从中抽取样本L;
[0035]S34:对抽取样本中的每一个数据z进行解码操作得到X

,并将其和X相比较,计算重构概率并在此基础上设置阈值。
[0036]优选地,所述步骤S4包括:
[0037]将测试集数据输入到训练好的变分自编码器模型中,并根据步骤S34中得到的阈值,结合公式
[0038][0039]对测试集的数据进行分类,重构概率大于阈值的为正常数据,小于阈值的为异常数据。
[0040]优选地,所述步骤S4进一步地包括:
[0041]将线损影响因子指标体系与线损率作为变分自编码器模型的输入数据进行训练,模型完成训练后将测试集输入,得到异常检测结果。
[0042]优选地,所述步骤S4进一步包括:
[0043]所述异常检测模型对每个线损样本进行编码与解码操作,根据样本中相关数据的变化情况动态的得到重构概率,将重构概率与阈值相比较,更为准确的得到异常数据信息。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于变分自编码器的低压台区线损率异常检测方法,其特征在于,所述方法包括以下步骤:S1:输入台区运行数据,利用随机矩阵理论对线损数据进行相关性分析;S2:筛选出线损率影响因子,构建低压台区线损率影响因子指标体系;S3:建立基于变分自编码器的线损率异常检测模型,在隐空间内对输入特征进行建模;S4:采样出异常特征,将产生重构数据的重构概率与阈值相比较对异常值进行识别。2.根据权利要求1中所述的方法,其特征在于:所述台区运行数据包括:城网农网类型、运行容量、居民户数、非居民户数、居民容量、非居民容量、综合倍率、配变户均供电容量、月平均负载率、理论线损率、日功率因数、日最大负载率、日有功电量、日无功电量、总供电量、日上网电量、日发电量。3.根据权利要求2中所述的方法,其特征在于,所述步骤S1包括:生成状态数据矩阵Z
n1
,该矩阵每一行对应每一个台区i天的线损率;选取一个影响因素,形成影响因素矩阵Z
n2
,该矩阵每一行表示该影响因素i天的数值;引入随机矩阵N,该矩阵为非负的随机数矩阵,与矩阵Z
n2
形式相同,服从正态分布,构建实验矩阵Z和对比矩阵Z
N
如下所示:对两个矩阵分别用设定的滑动窗口进行采样,滑动窗口行数与矩阵Z相同,对每次采样窗口中的数据进行平均谱半径的计算,直到滑动窗口经过矩阵中全部数据,形成平均谱半径序列。4.根据权利要求3所述的方法,其特征在于,平均谱半径差表示为:K
MSR,Z(N)
(t),K
MSR,Z
(t)分别表示实验矩阵Z平均谱半径曲线和对比矩阵Z
N
平均谱半径曲线,对平均谱半径差值进行积分计算得到相关特性指标S
MSR
:S
MSR
能够定性表示影响因素与线损率的相关程度。5.根据权利要求4所述的方法,其特征在于,所述变分自编码器模型是一种包含隐变量的生成模型,假设在高维空间Z中存在隐变量z可以对Z中的先验P(z)采样,存在一组确定性函数f(z;θ),其中θ为参数向量,其目标在于优化θ使得z在从P(z)中采样时可以更大概率的得到近似于X的数据,其公式表达为:P(X)=∫P(X|z;θ)P(z)dz,优化上述模型,转化为使Q(z|x)的分布N(z|μ(x;θ),σ(x;θ))尽可能逼近P(z)的分布N(0,1),其中Q(z|x)=N(z|μ(x;θ),σ(x;θ))μ和σ为任意确定性函数,参数θ从数据中学习得到。6.根据权利要求5所述的方法,其特征在于,所述步骤S3包括:S31:确定变分自编码器的损失函数,根据公式
将二进制交叉熵与KL散度作为变分自编码器的损失函数对模型进行优化;S32:使用构建好的变分自编码器模型对输入数据进行训练,通过训练得到变分自编码器的默认参数σ(i),μ(i);S33:根据σ(i),μ(i)得到关于z的正态分布N(μ(i),σ(i))并从中抽取样本L;S34:对抽取样本中的每一个数据z进行解码操作得到X

,并将其和X相比较,计算重构概率并在此基础上设置阈值。7.根据权利要求6所述的方法,其特征在于,所述步骤S4包括:将测试集数据输入到训练好的变分自编码器模型中,并根据步骤S34中得到的阈值,结合公式对测试集的数据进行分类,重构概率大于阈值的为正常数据,小于阈值的为异常数据。8.根据权利要求7所述的方法,其特征在于,所述步骤S4进一步地包括:将线损影响因子指标体系与线损率作为变分自编码器模型的输入数据进行训练,模型完成训练后将测试集输入,得到异常检测结果...

【专利技术属性】
技术研发人员:朱正谊许洪华朱红马洲俊钱欣周冬旭施萱轩徐荆州
申请(专利权)人:国网江苏省电力有限公司南京供电分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1