一种基于VAE-LSTM的低压配电网拓扑结构异常检测方法、装置及系统制造方法及图纸

技术编号:37365612 阅读:10 留言:0更新日期:2023-04-27 07:12
本发明专利技术公开了一种基于VAE

【技术实现步骤摘要】
一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法、装置及系统


[0001]本专利技术涉及低压配电网拓扑结构校验
,具体是涉及一种基于VAE和LSTM的低压配电网拓扑结构异常检测方法、装置及系统。

技术介绍

[0002]电力公司通常使用GIS系统记录、维护配电网设备的地理坐标及其拓扑连接关系。低压用户由于现场接线复杂、数据流大、因负荷不均衡导致运行方式改变、户变关系变动较多、原始数据缺失和质量较差,缺乏有效手段校核人工录入的数据等问题,造成了计算机系统中配电网拓扑数据的错误。针对用户所属台区或配变所属馈线记录错误问题,专门组织人员实地巡测,耗费大量人力物力,准确性也不高。因此,研究低压配电网拓扑结构校验技术有很大的必要性。
[0003]目前现有的低压配电网拓扑结构校验方法中,多是从高级量测体系(Advanced Metering Infrastructure,AMI)中获取待校验台区用户最近一段时间的电压序列数据,通过计算数据之间的相关系数来度量不同用户电压曲线之间的相似性。
[0004]在中国专利技术专利CN201911100635.8中公开了一种基于改进k值聚类算法的低压配电网拓扑校验方法及系统,对低压用户电压数据进行基于数据点密度的噪声处理产生高密度数据集,(计算每个数据结点到其余结点的欧氏距离的距离数集,若其值大于平均值则判断为噪声数据进行删除,否则加入高密度数据集D中;)在高数据密度集中采用自适应k值选择算法,初始设置k值为2,将欧式距离最大的2条边作为初始聚类中心,根据初始聚类中心,以皮卡尔系数计算其余数据点与聚类中心的相似系数,将相似系数大于相似系数阈值作为归类依据完成聚类D

。在其余初始中心中对剩余的高密度数据D

D'进行聚集完成初始聚类。若存在一个初始聚类中心没有分配到数据点或者高密度数据集中数据点聚类后并未完全分配,则增加k值得新的初始聚类中心,迭代计算至高密度数据中数据全部被分配得到正确的台区分类数据,实现对低压拓扑结构进行校验。
[0005]在中国专利技术专利CN202010431318.0也公开了一种基于环域离群点检测的低压拓扑结果校验方法,通过计算台区表计的电表功率突变量数据,使用均值漂移聚类算法形成台区总表、分支表箱和用户电表隶属关系消除量级差距的影响,利用皮卡尔相关系数作为相关性度量来衡量用户间电压曲线的相似性,从一个随机中心点开始,将与其距离小于r的数据点记为新集合,将新集合概率加1得加和向量,中心向加和向量方向移动迭代直至集合向量收敛,其最终向量值和其余聚类的向量值距离若小于阈值,则将其集合加入其余聚类集中,否则形成新的聚类集。重复上述步骤直至所有点均被标记访问,将实际的拓扑结构与校验后的拓扑结构进行对比分析,找出校验错误的局部拓扑进行相关研究。
[0006]在上述两种拓扑校验算法中,均采用基于邻近度的异常检测算法,但是随着数据维度的升高,基于邻近度的异常检测计算复杂度和时间复杂度增加,难以适应大数据计算的要求。低压用户电压用户是一种时间序列数据,传统的邻近算法直接用于异常检测会忽
略某些数据特征并且受数据噪声影响大。

技术实现思路

[0007]本专利技术的目的在于提供一致基于VAE

LSTM的低压配电网拓扑结构异常检测方法、装置及系统,以解决低压配电网拓扑校验中检测结果受噪声影响大,难以适用于大数据计算和检测精度不高的技术问题。
[0008]为实现上述目的,本专利技术采取的技术方案如下:
[0009]本专利技术提供了一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其包括如下步骤:
[0010]步骤1、收集一个台区内台区用户的历史正常低压时序数据、历史异常低压时序数据,对用户低压数据进行数据预处理;将历史数据按预设的比例分割为训练集、测试集和验证集,其中训练集和验证集中均为用户的历史正常低压时序数据;
[0011]步骤2、建立VAE

LSTM模型;
[0012]步骤3、将训练集输入基于VAE

LSTM的模型中进行训练,得到训练后的模型;
[0013]步骤4、将验证集输入VAE

LSTM模型对模型进行优化,将优化后的模型放入收集终端中;
[0014]步骤5、对于后续接受的数据,输入模型进行测试,若模型数据的数据与原始数据的差值超过阈值,则认定为异常数据,并将异常检测的结果输出至前端。
[0015]进一步的,所述步骤1中,设定时序窗口大小固定为L,对用户电表的电压时序数据取n段长度为L的序列构成模型输入数据:X={x1,x2,...,x
n
},每次都提取n段长度为L的电压时序数据构成数据集,数据集中按照设定比将对历史数据划分为训练集、验证集和测试集,其中,训练集和验证集中数据只包括正常的低压用户电压时序数据。
[0016]进一步的,所述步骤1中,低压数据进行数据预处理步骤包括:
[0017]对低压时序数据进行归一化处理:i从1到n遍历生成各个r
i
,R={r1,r2,...,r
n
}为生成的归一化序列:
[0018][0019]f
i
=f
i
‑1‑
β(f
i
‑1‑
max(x
i
)+min(x
i
))
[0020][0021]其中,参数α,β为相邻时间序列的关系因子,参数d和f分别为基线校正和比例因子,在归一化过程中自适应变化。在初次训练模型中,对两个参数遍历搜索找到最佳的参数值,R={r1,r2,...,r
n
}为生成的归一化序列;
[0022]在生成的归一化序列组成的数据集中按照一定比例分割为训练集和验证集和测试集,其中训练集和验证集只包含历史正常的低压时序数据,测试集中包含历史异常的低压时序数据。
[0023]进一步的,所述步骤2中,建立VAE模型提取短窗口内电压时序数据的局部特征和建立LSTM模型提取长时依赖关系;将第i个窗口的编码作为一个低维的隐变量输入,输入到LSTM模型中,然后预测下一个隐变量,再经过VAE解码器形成重建窗口数据,通过计算重构
误差作为异常检测的分数。
[0024]进一步的,所述VAE模型包括3层神经网络,即输入层、隐层和输出层;其中输入层到隐层是一个编码器,以n个连续的局部窗口电压时序数据R={r1,r2,...,r
n
}作为输入,通过编码器映射到潜在空间用低维的隐变量表示;从隐层到输出层是一个解码器,解码器通过隐层中的隐变量重构输入形成与输入时序电压数据R逼近的数据X

作为输出;
[0025]在编码和解码过程中,通过编码器得到输入的时序电压数据的隐变量分布参数φ、θ,再从N(0,1)中随机取很小的数ε,把随机数ε联合隐变量分布本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其特征在于包括如下步骤:步骤1、收集一个台区内台区用户的历史正常低压时序数据、历史异常低压时序数据,对用户低压数据进行数据预处理;将历史数据按预设的比例分割为训练集、测试集和验证集,其中训练集和验证集中均为用户的历史正常低压时序数据;步骤2、建立VAE

LSTM模型;步骤3、将训练集输入基于VAE

LSTM的模型中进行训练,得到训练后的模型;步骤4、将验证集输入VAE

LSTM模型对模型进行优化,将优化后的模型放入收集终端中;步骤5、对于后续接受的数据,输入模型进行测试,若模型数据的数据与原始数据的差值超过阈值,则认定为异常数据,并将异常检测的结果输出至前端。2.根据权利要求1所述的一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其特征在于,所述步骤1中,设定时序窗口大小固定为L,对用户电表的电压时序数据取n段长度为L的序列构成模型输入数据:X={x1,x2,...,x
n
},每次都提取n段长度为L的电压时序数据构成数据集,数据集中按照设定比将对历史数据划分为训练集、验证集和测试集,其中,训练集和验证集中数据只包括正常的低压用户电压时序数据。3.根据权利要求1所述的一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其特征在于,所述步骤1中,低压数据进行数据预处理步骤包括:对低压时序数据进行归一化处理:i从1到n遍历生成各个r
i
,R={r1,r2,...,r
n
}为生成的归一化序列:f
i
=f
i
‑1‑
β(f
i
‑1‑
max(x
i
)+min(x
i
))其中,参数α,β为相邻时间序列的关系因子,参数d和f分别为基线校正和比例因子,在归一化过程中自适应变化;在初次训练模型中,对两个参数遍历搜索找到最佳的参数值,R={r1,r2,...,r
n
}为生成的归一化序列;在生成的归一化序列组成的数据集中按照一定比例分割为训练集和验证集和测试集,其中训练集和验证集只包含历史正常的低压时序数据,测试集中包含历史异常的低压时序数据。4.根据权利要求1所述的一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其特征在于,所述步骤2中,建立VAE模型提取短窗口内电压时序数据的局部特征和建立LSTM模型提取长时依赖关系;将第i个窗口的编码作为一个低维的隐变量输入,输入到LSTM模型中,然后预测下一个隐变量,再经过VAE解码器形成重建窗口数据,通过计算重构误差作为异常检测的分数。5.根据权利要求1或4所述的一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其特征在于,所述VAE模型包括3层神经网络,即输入层、隐层和输出层;其中输入层到隐层是一个编码器,以n个连续的局部窗口电压时序数据R={r1,r2,...,r
n
}作为输入,通过编码
器映射到潜在空间用低维的隐变量表示;从隐层到输出层是一个解码器,解码器通过隐层中的隐变量重构输入形成与输入时序电压数据R逼近的数据X

作为输出;在编码和解码过程中,通过编码器得到输入的时序电压数据的隐变量分布参数φ、θ,再从N(0,1)中随机取很小的数ε,把随机数ε联合隐变量分布参数φ、θ,得先验概率分布p
θ
(z),然后根据条件概率分布函数p
θ
(z|V)解码得到重构的时序电压数据。6.根据权利要求1或4所述的一种基于VAE

LSTM的低压配电网拓扑结构异常检测方法,其特征在于,所述LSTM模型由四个内置的交互层组成,其中:第一个交互层为遗忘门,确定和删除上一层隐藏层输出不需要的信息;遗忘门f
t
计算方法为:f
t
=σ(W
f
·
[h
t
‑1,x
t
]+b
f
)式中f
t
表示遗忘门,x
t
为当前节点信息,h
t
‑1为历史隐藏信息,W
f
为遗忘门的权重矩阵,b
f
为遗忘门偏置量,σ(
·
)表示sigmoid函数;第二个交互层称为输入门,通过对遗忘门中对上一层信息进行取舍后,与当前网络输入信息的乘积来控制输入门i
t
:i
t
=σ(W
i
·
[h
t
‑1,x
t
]+b
i
)式中i
t
为输入门,W
i
为输入门...

【专利技术属性】
技术研发人员:王大鹏吕鹏飞张悦汤延来张佳宁戴冰于泳董鹏林经伟孙艳超曲翀
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1