一种基于WGAN-GP的数据驱动型配电网故障数据增强方法技术

技术编号：41294738 阅读：4 留言：0更新日期：2024-05-13 14:44

本发明专利技术公开了一种基于WGAN‑GP的数据驱动型配电网故障数据增强方法，包括以下步骤：采集含有缺失的原始配电网工况数据，并补齐缺失值；根据系统预警标签对原始配电网工况数据中包含的故障数据进行筛选分类；对不同故障类别的电力数据分别进行线性归一化处理，作为模型输入，搭建WGAN‑GP模型并设置参数；将待增强的配电网缺失故障数据进行线性插值以及归一化处理后，输入WGAN‑GP模型中，得到增强后的配电网故障数据。本方法可以对配电网故障数据进行增强，生成与原始配电网工况数据中包含的故障数据分布高度相似的高质量数据，解决配电网故障诊断中数据集不平衡的问题。为实现及时准确的配电网故障诊断提供坚实的基础。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于配电网异常事件数据增强与分析领域，具体涉及一种基于wgan-gp的数据驱动型配电网故障数据增强方法。

技术介绍

1、随着电能逐渐成为众多行业的基础能源，电网侧负荷需求日趋增长，配电网的运行面临日趋复杂的风险，配电网故障频发。人工智能算法的迅速发展为配电网故障诊断提供了可行的方案，但是其依赖海量数据的支撑，在配电网量测体系内存在的数据集极不平衡，配电网故障运行数据极少，难以支撑人工智能算法。通过对配电网停电数据增强与分析的研究，支撑复杂环境下对量测不完备、不准确的配电网进行及时、准确的停电故障诊断是推动智能化、数据驱动型配电网的发展以及保障优质电力的热点研究课题。

2、缺失数据的增强或扩充的问题通常可以归类到统计学的插值问题，对该问题的研究主要包括三个阶段：第一个阶段为传统的数学方法包括直接删除缺失值、均值填充法、多项式插值等。这些算法简便易行，但仅对丢失数据前后小范围内的数据敏感，无法从大的时间尺度上感知数据的内在关联，导致数据重构精度低；第二个阶段为基于概率统计模型的数据增强方法，包括极大似然估计、蒙特卡罗模拟和马尔可夫链等，但是由于该方法依赖于特定的分布假设，所以可能会出现分布不匹配的情况；第三个阶段为基于机器学习和深度学习的数据增强方法：机器学习方法包括随机森林、变分自编码器、循环神经网络等，但是机器学习模型的选择与原始数据集的质量直接相关，需要先验知识；其次，机器学习模型难以捕捉实际运行工况下复杂配电网的数据分布特征，生成高质量的样本可能需要花费大量的计算成本和资源。随着新一代人工智能技术的快速

技术实现思路

1、本专利技术针对现有配电网工况数据集不平衡、配电网缺失数据增强技术不足的问题，以深度学习为导向，提供一种基于wgan-gp的数据驱动型配电网故障数据增强方法。

2、本专利技术采用的技术方案如下：一种基于wgan-gp的数据驱动型配电网故障数据增强方法，包括以下步骤：

3、步骤1、采集配电系统中含有部分缺失以及部分异常值的原始配电网工况数据，采用插值法补齐原始配电网工况数据，完成原始数据集的构建；所述原始数据集中带有系统预警标签、台区变压器id标签以及故障日期标签；所述系统预警标签为配电系统对故障类型的判断；台区变压器id标签为配电系统中变压器的唯一编号；

4、步骤2、对原始数据集进行数据维度信息的扩充，得到扩充数据集；所述扩充数据集中扩充后新增的数据为无标签数据；

5、步骤3、根据原始数据集中系统预警标签、变压器id标签以及故障日期标签对扩充数据集进行故障数据筛选与分类，并将分类后的扩充数据集作为故障数据集；

6、步骤4、对所述故障数据集进行归一化预处理，将归一化处理后的故障数据集作为训练集；

7、步骤5、建立wgan-gp模型，所述wgan-gp模型包括生成器、判别器以及惩罚机制；

8、步骤6、将训练集输入到wgan-gp模型中进行训练，完成训练后从生成器中批量得到样本数据；对样本数据进行反归一化处理，得到与原始数据集分布相似的仿真数据集，实现配电网故障数据增强。

9、作为本专利技术的优选方案，所述步骤1中采用插值法补齐原始配电网工况数据，具体为：

10、原始配电网工况数据当中存在缺失数据以及部分异常数据，原始配电网工况数据为按照配电系统运行时序记录不同时刻配电网运行数据，采样频率为f分钟/次，一天共1440/f个数据，在补齐数据时以天为单位，采用空白缺失值按照时序替代原始数据当中量测的异常值；采用线性插值法补齐空白缺失值以及原始配电网工况数据中缺失的部分，得到完整的原始数据集。

11、作为本专利技术的优选方案，所述步骤2中，对原始数据集进行数据维度信息的扩充具体为：

12、分别将原始数据集中的每一维度数据前后作差，得到的差值作为新的维度信息，为生成式对抗网络提供更充足的数据：

13、cnew,j＝ci,j-ci,j-1,j＝2,3,4,...

14、其中i代表原始数据集维度个数，j代表原始数据集中数据的序列号，new代表扩充数据集中新的维度。

15、作为本专利技术的优选方案，所述步骤3中，依据故障数据集标签对扩充数据集进行数据筛选与分类具体为：

16、首先根据台区变压器id标签以及故障日期标签筛选出扩充数据集中发生故障当天所有运行数据；其次根据配电系统预警标签对经过筛选的运行数据进行分类，共分为四类故障数据：总开关跳闸故障、分支回路开关跳闸故障、缺相运行故障、弱异常特征故障；其中总开关代表控制整个系统的主要开关，用于控制整个系统的供电和断电；分支回路开关是用于控制电力系统中不同分支路供电和断电的开关；缺相运行是指配电网电流或者电压在运行过程中某相缺失；弱异常特征故障是指无法从数据或是逻辑上直观的判断其是否发生故障。

17、作为本专利技术的优选方案，所述步骤4中，对故障数据集归一化处理采用线性归一化方法将故障数据映射至[-1,1]区间，具体算法如下：

18、

19、其中，xi,new代表经过归一化后得到的数据集，xi代表故障数据集,xi,max,xi,min分别代表故障数据集第i个特征中的最大值和最小值。

20、作为本专利技术的优选方案，所述步骤5中建立的包括生成器、判别器以及惩罚机制的wgan-gp模型，其中生成器和判别器均采用全连接神经网络，生成器的输入为服从标准正态分布的随机噪声，所述随机噪声经过生成器的隐藏层线性变换后输出为指定大小的数据；判别器网络的输入由生成器生成的数据以及真实数据组成，经过判别器网络的隐藏层线性变换后，输出为指定大小的矩阵，所述矩阵代表生成数据是真实数据的概率得分；所述惩罚机制具体为：

21、

22、其中e代表数学期望，d代表判别器，g代表生成器，代表单个具体的真实数据，表示取样于真实数据，z代表服从标准正态分布的随机噪声，从噪声集pz(z)当中取样得到；表示判别器对真实数据的判断结果，g(z)表示生成器生成的数据，d(g(z))代表判别器对生成数据的判断结果；λ代表惩罚项系数；▽代表微分算子，p(x)表示真实数据空间和真实数据空间任意两点连线上任意点所构成的中间区域，x取样于该区域；▽xd(x)表示对p(x)中的判别器判别结果d(x)求导；p表示范数；

23、在搭建的wgan-gp模型生成器网络和判别器网络中初始学习率分别设置为lr_g和lr_d，同时采用学习率单步衰减策略保证网络稳定收敛；批量载入数据的大小设置为batchsize，设置生成器网络共k1层；判别器网络共k2层；迭代次数为n次；单次迭代中判别器网络训练次数为n_d以及生成器网络训练次数为n_g；选取均值、标准差以及wasserstein距离作为衡量生成数据和真实数据之间分布的指标。

24、作为本专利技术的优选方案，所述步骤6中，将训练集输入wgan-gp模型中训练网本文档来自技高网...

【技术保护点】

1.一种基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤1中采用插值法补齐原始配电网工况数据，具体为：

3.根据权利要求1所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤2中，对原始数据集进行数据维度信息的扩充具体为：

4.根据权利要求1所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤3中，依据故障数据集标签对扩充数据集进行数据筛选与分类具体为：

5.根据权利要求1所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤4中，对故障数据集归一化处理采用线性归一化方法将故障数据映射至[-1,1]区间，具体算法如下：

6.根据权利要求1所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤5中建立的包括生成器、判别器以及惩罚机制的WGAN-GP模型，其中生成器和判别器均采用全连接神经网

7.根据权利要求6所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤6中，将训练集输入WGAN-GP模型中训练网络，具体包括以下步骤：

8.根据权利要求7所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤6.2中，分别选取随机采集的一对真假样本来计算判别器损失函数，根据两点确定一条直线的原则：这两点的连线上任意一点的梯度都将被限制在1以内，满足1-Lipschitz约束条件；

9.根据权利要求1所述基于WGAN-GP的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤6中，与原始数据集分布相似的数据集，从数据整体分布来看，相似的数据集与原始数据集分布的标准差相对误差不超过7.35％，均值相对误差不超过1.14％；在随机抽取的故障场景下观察数据的局部分布，生成的相似的数据集与原始数据集之间的KL散度小于等于0.04。

...

【技术特征摘要】

1.一种基于wgan-gp的数据驱动型配电网故障数据增强方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述基于wgan-gp的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤1中采用插值法补齐原始配电网工况数据，具体为：

3.根据权利要求1所述基于wgan-gp的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤2中，对原始数据集进行数据维度信息的扩充具体为：

4.根据权利要求1所述基于wgan-gp的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤3中，依据故障数据集标签对扩充数据集进行数据筛选与分类具体为：

5.根据权利要求1所述基于wgan-gp的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤4中，对故障数据集归一化处理采用线性归一化方法将故障数据映射至[-1,1]区间，具体算法如下：

6.根据权利要求1所述基于wgan-gp的数据驱动型配电网故障数据增强方法，其特征在于，所述步骤5中建立的包括生成器、判别器以及惩罚机制的wgan-gp模型，其中生成器和判别器均采用全连接神经网络，生成器的输入为服从标准正态分布的随机噪声，所述随机...

【专利技术属性】
技术研发人员：杨强，郭凯彬，陈源奕，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人