一种输变电设备图像数据增广方法技术

技术编号:34889056 阅读:11 留言:0更新日期:2022-09-10 13:47
本发明专利技术公开了一种输变电设备图像数据增广方法,属于数据增广技术领域,目的在于提供一种输变电设备图像数据增广方法,解决现有增广技术图像质量差,容易出现鲁棒性弱、过拟合,拟合随机性过大的问题。其通过在生成网络G和鉴别网络D中均引入自注意力模块,对噪声的鲁棒性很强,能有效减少噪声对梯度更新的影响,使得网络生成的图像清晰度、多样性和局部细节都有明显的提高;同时在生成网络G和鉴别网络D的输入数据中加入条件变量c,使其变成有监督的学习,既提高了训练网络的收敛速度,也避免了由于网络过度自由化,而造成无法生成有效的图像数据的问题。本发明专利技术适用于输变电设备图像数据增广方法。数据增广方法。数据增广方法。

【技术实现步骤摘要】
一种输变电设备图像数据增广方法


[0001]本专利技术属于数据增广
,具体涉及一种输变电设备图像数据增广方法。

技术介绍

[0002]输变电设备的运行状态监测是输电线路巡检运维工作的重要组成部分,电力巡检人员通常需要人工观察大量的图像来识别电力设备状态,这种方式低效且易出错,所以近些年来,使用深度学习中的神经网络技术智能分析巡检图像大大提高了巡检人员的工作效率。但同时目前的输变电设备图像数据集仍存在种类少、图像多样性差、精度饱和等缺点,故需要通过对现有图像做各种变换来得到相似的数据集,即数据增广技术,数据增广可以提高模型的泛化能力,从而提升图像识别率,目前关于数据增广技术仍存在以下问题:
[0003]1、传统的数据增广技术主要有平移、翻转、旋转、抖动和模糊等,但经过上述传统方法得到的图像数据用于训练提取特征,容易出现鲁棒性弱、过拟合等问题;
[0004]2、为了更好地防止模型过拟合,可以使用生成对抗网络(GAN)来进行图像数据增广,但传统的生成对抗网络训练收敛速度慢,且容易出现梯度突变和梯度消失的问题,训练稳定性差;
[0005]3、由于GAN的训练过程极其复杂且需要庞大的计算量,导致其生成的图像质量差,分辨率低。
[0006]4、由于传统的生成对抗网络训练过程缺乏监督信息的指导,拟合过程的随机性很大。同时由于生成对抗网络的学习能力有限,导致其只模拟出真实数据的一部分或者完全无法模拟真实的样本数据,产生模式上的缺陷,即模式坍塌。

技术实现思路

[0007]本专利技术的目的在于:提供一种输变电设备图像数据增广方法,解决现有增广技术图像质量差,容易出现鲁棒性弱、过拟合,拟合随机性过大的问题。
[0008]本专利技术采用的技术方案如下:
[0009]一种输变电设备图像数据增广方法,包括以下步骤:
[0010](1)将特征图输入生成网络G;
[0011](2)生成网络G吸收随机噪声z和条件变量c,生成网络G的四层卷积网络输出生成样本;
[0012](3)生成样本与加入条件变量c的真实样本输入到鉴别网络D中,鉴别网络D的第二和第三卷积层中设置自注意力模块,鉴别网络D判断输入的图像真伪,输出二元概率分布,
[0013]鉴别过程的损失函数可以表示为:
[0014][0015]其中,p
data
(x)表示真实样本的分布,p
z
(z)表示随机噪声z假样本的分布;
[0016]生成网络G和鉴别网络D进行交替训练,在生成网络G和鉴别网络D交替训练加入条
件变量c,在每一个epoch中,先固定鉴别网络D开始训练生成网络G,直到生成的样本达到想要的效果,即调整生成网络G的参数,使得log(1

D(G(z|c)))期望最小化,然后再固定生成网络G开始训练鉴别网络D,使得log D(x|c)+log(1

D(G(z|c)))的期望最大化,直到所有epoch执行完毕,训练结束,输出生成样本,完成图像数据增广。
[0017]进一步地,所述步骤(2)中,生成网络G输出生成样本的具体步骤为:
[0018](2.1)输入的特征图通过生成网络G的第二和第三卷积层中的自注意力模块,将特征图变为f(x)、g(x)和h(x)三个特征空间,f(x)、g(x)和h(x)均为1x1卷积;
[0019](2.2)将f(x)的输出转置并和g(x)的输出相乘,再经过softmax归一化得到一个注意力图;
[0020](2.3)将得到的注意力图和h(x)逐像素点相乘,得到注意力特征图,得到的注意力特征图即为生成样本。
[0021]综上所述,由于采用了上述技术方案,本专利技术的有益效果是:
[0022]1、本专利技术中,生成网络G和鉴别网络D之间通过对抗学习的方式不断地提升生成器的生成质量和判别器的判别能力,大幅提高了网络的特征提取能力,实现输变电设备图像数据的增广。
[0023]2、本专利技术中,在生成网络G和鉴别网络D中均引入自注意力模块,将自注意力机制引入到生成对抗网络中,即在生成器和判别器的网络设计的内部加入自注意力层,自注意力层实际上就是将隐藏层得到的特征图与它自身的转置相乘,让任意两个位置的像素发生关系,这样就可以得到任意两个像素之间的依赖关系,从而得到全局特征,对噪声的鲁棒性很强,能有效减少噪声对梯度更新的影响,使得网络生成的图像清晰度、多样性和局部细节都有明显的提高。
[0024]3、本专利技术中,同时在生成网络G和鉴别网络D的输入数据中加入条件变量c,即在生成器的输入端将待生成样本的类别信息作为监督信号传入到生成模型中作为约束,给生成器和判别器添加额外信息加快收敛速度,使其变成有监督的学习,既提高了训练网络的收敛速度,也避免了由于网络过度自由化,而造成无法生成有效的图像数据的问题。
附图说明
[0025]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:
[0026]图1为本专利技术的整体流程示意图;
[0027]图2为本专利技术生成网络G的处理流程图;
具体实施方式
[0028]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。
[0029]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护
的专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]一种输变电设备图像数据增广方法,包括以下步骤:
[0031](1)将特征图输入生成网络G;
[0032](2)生成网络G吸收随机噪声z和条件变量c,生成网络G的四层卷积网络输出生成样本;
[0033](3)生成样本与加入条件变量c的真实样本输入到鉴别网络D中,鉴别网络D的第二和第三卷积层中设置自注意力模块,鉴别网络D判断输入的图像真伪,输出二元概率分布,
[0034]鉴别过程的损失函数可以表示为:
[0035][0036]其中,p
data
(x)表示真实样本的分布,p
z
(z)表示随机噪声z假样本的分布;
[0037]生成网络G和鉴别网络D进行交替训练,在生成网络G和鉴别网络D交替训练加入条件变量c,在每一个epoch中,先固定鉴别网络D开始训练生成网络G,直到生成的样本达到想要的效果,即调整生成网络G的参数,使得log(1

D(G(z|c)))期望最小化,然后再固定生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种输变电设备图像数据增广方法,其特征在于,包括以下步骤:(1)将特征图输入生成网络G;(2)生成网络G吸收随机噪声z和条件变量c,生成网络G的四层卷积网络输出生成样本;(3)生成样本与加入条件变量c的真实样本输入到鉴别网络D中,鉴别网络D的第二和第三卷积层中设置自注意力模块,鉴别网络D判断输入的图像真伪,输出二元概率分布,鉴别过程的损失函数可以表示为:其中,p
data
(x)表示真实样本的分布,p
z
(z)表示随机噪声z假样本的分布;生成网络G和鉴别网络D进行交替训练,在生成网络G和鉴别网络D交替训练加入条件变量c,在每一个epoch中,先固定鉴别网络D开始训练生成网络G,直到生成的样本达到想要的效果,即调整生成网络G的参数,使得log(1

D(...

【专利技术属性】
技术研发人员:陈亮刘垚宏李诚徐彤易伟喻婷杨斯旭唐海东汪晓帆
申请(专利权)人:国网四川省电力公司眉山供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1