故障样本生成方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：40562450 阅读：11 留言：0更新日期：2024-03-05 19:25

本发明专利技术实施例涉及一种故障样本生成方法、装置、电子设备及可读存储介质，所述方法包括：获取历史样本数据；依据历史样本数据所属的不同参数类型进行分类；依据分类结果对历史样本数据进行预处理；构建生成对抗网络模型；采用预处理后的历史样本数据对生成对抗网络模型进行训练；将随机噪音输入训练好的生成对抗网络模型生成故障样本。本发明专利技术实施例提供的技术方案，通过采用不同的编码策略针对异构故障数据中常见的不同数据类型，使得所有数据类型的样本都能被模型有效处理；通过对生成对抗网络模型的改进，使得改进后的模型可以生成丰富的故障样本，解决了现有技术中样本库数据不平衡，故障样本数量总体偏少或者某类故障样本数量较小的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及故障诊断，尤其涉及一种故障样本生成方法、装置、电子设备及可读存储介质。

技术介绍

1、电力系统中变电设备是电网输配电的重要节点，其运行稳定性和可靠性对整个系统的电能质量和供电保障起着至关重要的作用。但是，由于变电设备的特殊运行环境和工作要求，往往存在着复杂的故障类型和多样的故障表现形式，给设备的故障检修和维护带来了很大的挑战，同时也给电力系统的安全运行带来了很大的风险。

2、在变电设备故障诊断中，存在着因故障类型发生概率和频次不同导致的样本不均衡问题和因故障类型多样性导致的数据异构问题。这些问题使得传统的机器学习算法难以有效地应用于变电设备故障诊断中。一方面，传统的故障样本数量往往较少，难以覆盖所有故障情况；另一方面，正常样本数远大于故障样本数，导致训练集数据不平衡，故障诊断模型很难得到好的性能满足实际应用的需求。在处理多类别数据或数据类别不确定的情况下，模型通常很难学习到与数据本身有意义的特征表示，因而难以实现准确的故障诊断。

技术实现思路

1、基于现有技术的上述情况，本专利技术实施例的目的在于提供一种故障样本生成方法、装置、电子设备及可读存储介质，可以生成兼具高质量与多样性的异构故障样本，以满足变电设备高可靠系统故障样本生成的要求。

2、为达到上述目的，根据本专利技术的一个方面，提供了一种故障样本生成方法，包括步骤：

3、获取历史样本数据；

4、依据所述历史样本数据所属的不同参数类型进行分类；

5、

6、构建生成对抗网络模型；

7、采用预处理后的历史样本数据对所述生成对抗网络模型进行训练；

8、将随机噪音输入训练好的生成对抗网络模型生成故障样本。

9、进一步的，所述不同参数类型包括浮点型连续变量数据、整数型连续变量数据、无序类别变量数据和层次类别变量数据；所述依据分类结果对所述历史样本数据进行预处理包括：

10、对无序类别变量数据进行第一编码处理；

11、对层次类别变量数据进行第二编码处理。

12、进一步的，所述第一编码处理包括独热编码处理。

13、进一步的，所述第二编码处理包括：

14、将待处理历史样本数据中的每个类别映射为对应的整数标签；

15、按照类别的等级依次对所述标签进行编码。

16、进一步的，所述生成对抗网络模型包括生成器、第一鉴别器和第二鉴别器；

17、所述生成器用于生成样本数据；

18、所述第一鉴别器用于区分生成的样本数据是否真实；

19、所述第二鉴别器用于区分生成的样本数据是否为故障样本；

20、对所述生成对抗网络模型进行训练，包括：

21、对所述第二鉴别器进行训练，得到训练好的第二鉴别器；

22、对所述生成器和所述第一鉴别器进行交替训练，得到训练好的生成对抗网络模型。

23、进一步的，所述交替训练包括对所述生成器和所述第一鉴别器进行交替迭代优化；其中，

24、固定所述生成器时，所述第一鉴别器的损失函数为：

25、

26、固定所述第一鉴别器时，所述生成器的损失函数为：

27、

28、其中，pdata是表示历史样本数据x的数据分布，pz是随机噪音z服从的高斯分布，d(x)表示历史样本数据被第一鉴别器判断为真实样本的概率，d(g(z))表示生成的样本数据被第一鉴别器判断为真实样本的概率，f(g(z))表示生成的样本数据被第二鉴别器判断为非故障类样本的概率；表示x来自真实数据分布的期望，表示z来自高斯分布的期望；第一鉴别器的损失函数的目标是最大化误差函数，以区分真实数据与生成数据，生成器的损失函数是最小化误差函数，以生成和真实数据分布更接近的数据样本。

29、进一步的，所述方法还包括生成器根据待生成数据的不同参数类型进行数据编码处理，包括：

30、对整数型连续变量数据进行取整处理；

31、对层次类别变量数据设置输出范围，并进行取整处理；

32、对无序类别变量数据，采用如下公式进行处理：

33、

34、其中，h＝(h1，h2，……hd)表示维度为d的待处理数据，g＝(g1，g2，……gd)表示维度为d的独立同分布随机向量，每个维度均符合gumbel分布；y′＝(y1，y2，……yd)表示进行处理后的数据；τ表示编码控制参数，τ趋近于0时，y′趋近于原始输出，τ趋近于∞时，y′趋近于均匀分布。

35、根据本专利技术的第二个方面，提供了一种故障样本生成装置，包括：

36、数据获取模块，用于获取历史样本数据；

37、数据分类模块，用于依据所述历史样本数据所属的不同参数类型进行分类；

38、数据预处理模块，用于依据分类结果对所述历史样本数据进行预处理；

39、模型构建模块，用于构建生成对抗网络模型；

40、模型训练模块，用于采用预处理后的历史样本数据对所述生成对抗网络模型进行训练；

41、故障样本生成模块，用于将随机噪音输入训练好的生成对抗网络模型生成故障样本。

42、根据本专利技术的第三个方面，提供了一种电子设备，其特征在于，包括：

43、处理器；和

44、存储器，其上存储有可执行代码，当所述可执行代码被处理器执行时，执行如本专利技术第一个方面所述的方法。

45、根据本专利技术的第四个方面，提供了一个或多个机器可读存储介质，其上存储有可执行代码，其特征在于，当所述可执行代码被处理器执行时，执行如本专利技术第一个方面所述的方法。

46、综上所述，本专利技术实施例提供了一种故障样本生成方法、装置、电子设备及可读存储介质，所述方法包括：获取历史样本数据；依据所述历史样本数据所属的不同参数类型进行分类；依据分类结果对所述历史样本数据进行预处理；构建生成对抗网络模型；采用预处理后的历史样本数据对所述生成对抗网络模型进行训练；将随机噪音输入训练好的生成对抗网络模型生成故障样本。本专利技术实施例提供的技术方案，通过采用不同的编码策略针对异构故障数据中常见的不同数据类型，使得所有数据类型的样本都能被模型有效处理；以及通过对生成对抗网络模型的改进，使得改进后的模型可以生成丰富的合成故障样本，解决了现有技术中样本库数据不平衡，故障样本数量总体偏少或者某类故障样本数量较小而无法使得诊断系统能够准确识别不同类型故障的技术问题。

本文档来自技高网...

【技术保护点】

1.一种故障样本生成方法，其特征在于，包括步骤：

2.根据权利要求1所述的方法，其特征在于，所述不同参数类型包括浮点型连续变量数据、整数型连续变量数据、无序类别变量数据和层次类别变量数据；所述依据分类结果对所述历史样本数据进行预处理包括：

3.根据权利要求2所述的方法，其特征在于，所述第一编码处理包括独热编码处理。

4.根据权利要求2所述的方法，其特征在于，所述第二编码处理包括：

5.根据权利要求2所述的方法，其特征在于，所述生成对抗网络模型包括生成器、第一鉴别器和第二鉴别器；

6.根据权利要求5所述的方法，其特征在于，所述交替训练包括对所述生成器和所述第一鉴别器进行交替迭代优化；其中，

7.根据权利要求5所述的方法，其特征在于，所述方法还包括生成器根据待生成数据的不同参数类型进行数据编码处理，包括：

8.一种故障样本生成装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

10.一个或多个机器可读存储介质，其上存储有可执行代码，其特征在于，当所述可执行代码被处理

...

【技术特征摘要】

1.一种故障样本生成方法，其特征在于，包括步骤：

3.根据权利要求2所述的方法，其特征在于，所述第一编码处理包括独热编码处理。

4.根据权利要求2所述的方法，其特征在于，所述第二编码处理包括：

5.根据权利要求2所述的方法，其特征在于，所述生成对抗网络模型包括生成器、第一鉴别器和第二...

【专利技术属性】
技术研发人员：杨帆，王鹏博，李昕衡，赵琦，魏蜀吾，陈蕾，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人