基于为图像添加噪声的图像数据增强方法及装置制造方法及图纸

技术编号:38125709 阅读:15 留言:0更新日期:2023-07-08 09:29
本公开涉及图像处理技术领域,提供了一种基于为图像添加噪声的图像数据增强方法及装置。该方法包括:获取待数据增强的图像数据集;利用图像扩散模型的扩散过程为图像数据集中的目标图像连续多次添加噪声,得到目标图像对应的第一噪声图像;利用图像扩散模型的逆扩散过程预测在扩散过程中添加的多个噪声,并在第一噪声图像中依次除去预测的多个噪声,得到目标图像对应的还原后的第一去噪图像;利用目标图像和第一去噪图像生成数据增强后的图像数据集。采用上述技术手段,解决现有技术中,传统数据增强方法得到的图像缺乏真实性的问题。数据增强方法得到的图像缺乏真实性的问题。数据增强方法得到的图像缺乏真实性的问题。

【技术实现步骤摘要】
基于为图像添加噪声的图像数据增强方法及装置


[0001]本公开涉及图像处理
,尤其涉及一种基于为图像添加噪声的图像数据增强方法及装置。

技术介绍

[0002]在计算机视觉领域,图像数据增强技术是一种常用的方法,用于丰富训练数据集,提升模型的泛化能力。现有的图像数据增强方法通常通过对原始图像进行一系列仿射变换来生成新的图像数据。常用的仿射变换包括随机旋转、翻转、剪裁等。比如现有的图像数据增强方法是从原始图像中随机选择一个区域进行剪裁,对剪裁后的图像进行随机旋转,轻微拉伸或翻转,将变换后的图像添加到训练数据集中。这种方法的主要缺点是缺乏真实性,由于随机变换并不能准确地再现实际应用中图像的变化,不能有效地模拟实际应用中的视觉和环境变化,例如光线、视角等的变化等,因此生成的图像往往并不真实(生成的图像缺乏真实性,可以理解为数据增强得到的图像不符合实际应用场景中图像的变化)。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:传统数据增强方法得到的图像缺乏真实性的问题。

技术实现思路

[0004]有鉴于此,本公开实施例提供了一种基于为图像添加噪声的图像数据增强方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,传统数据增强方法得到的图像缺乏真实性的问题。
[0005]本公开实施例的第一方面,提供了一种基于为图像添加噪声的图像数据增强方法,包括:获取待数据增强的图像数据集;利用图像扩散模型的扩散过程为图像数据集中的目标图像连续多次添加噪声,得到目标图像对应的第一噪声图像;利用图像扩散模型的逆扩散过程预测在扩散过程中添加的多个噪声,并在第一噪声图像中依次除去预测的多个噪声,得到目标图像对应的还原后的第一去噪图像;利用目标图像和第一去噪图像生成数据增强后的图像数据集。
[0006]本公开实施例的第二方面,提供了一种基于为图像添加噪声的图像数据增强装置,包括:获取模块,被配置为获取待数据增强的图像数据集;扩散模块,被配置为利用图像扩散模型的扩散过程为图像数据集中的目标图像连续多次添加噪声,得到目标图像对应的第一噪声图像;逆扩散模块,被配置为利用图像扩散模型的逆扩散过程预测在扩散过程中添加的多个噪声,并在第一噪声图像中依次除去预测的多个噪声,得到目标图像对应的还原后的第一去噪图像;增强模块,被配置为利用目标图像和第一去噪图像生成数据增强后的图像数据集。
[0007]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0008]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0009]本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过获取待数据增强的图像数据集;利用图像扩散模型的扩散过程为图像数据集中的目标图像连续多次添加噪声,得到目标图像对应的第一噪声图像;利用图像扩散模型的逆扩散过程预测在扩散过程中添加的多个噪声,并在第一噪声图像中依次除去预测的多个噪声,得到目标图像对应的还原后的第一去噪图像;利用目标图像和第一去噪图像生成数据增强后的图像数据集,因此,采用上述技术手段,可以解决现有技术中,传统数据增强方法得到的图像缺乏真实性的问题,进而使得数据增强得到的图像符合实际应用场景中图像的变化。
附图说明
[0010]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本公开实施例的应用场景的场景示意图;
[0012]图2是本公开实施例提供的一种基于为图像添加噪声的图像数据增强方法的流程示意图;
[0013]图3是本公开实施例提供的一种基于为图像添加噪声的图像数据增强装置的结构示意图;
[0014]图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0015]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0016]下面将结合附图详细说明根据本公开实施例的一种基于为图像添加噪声的图像数据增强方法和装置。
[0017]图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104以及网络105。
[0018]终端设备101、102和103可以是硬件,也可以是软件。当终端设备101、102和103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备101、102和103为软件时,其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备101、102和103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
[0019]服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备
发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器104可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本公开实施例对此不作限制。
[0020]需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,其可以是为终端设备101、102和103提供各种服务的各种电子设备。当服务器104为软件时,其可以是为终端设备101、102和103提供各种服务的多个软件或软件模块,也可以是为终端设备101、102和103提供各种服务的单个软件或软件模块,本公开实施例对此不作限制。
[0021]网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near Field Communication,NFC)、红外(Infrared)等,本公开实施例对此不作限制。
[0022]用户可以通过终端设备101、102和103经由网络105与服务器104建立通信连接,以接收或发送信息等。需要说明的是,终端设备101、102和103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于为图像添加噪声的图像数据增强方法,其特征在于,包括:获取待数据增强的图像数据集;利用图像扩散模型的扩散过程为所述图像数据集中的目标图像连续多次添加噪声,得到所述目标图像对应的第一噪声图像;利用所述图像扩散模型的逆扩散过程预测在所述扩散过程中添加的多个噪声,并在所述第一噪声图像中依次除去预测的多个噪声,得到所述目标图像对应的还原后的第一去噪图像;利用所述目标图像和所述第一去噪图像生成所述数据增强后的图像数据集。2.根据权利要求1所述的方法,其特征在于,所述利用图像扩散模型的扩散过程为所述图像数据集中的目标图像连续多次添加噪声,得到所述目标图像对应的第一噪声图像,包括:通过以下方式计算每次添加噪声后的目标图像:基于上一次添加噪声后的目标图像和上一次采样得到的基础噪声,通过噪声计算公式计算得到本次添加噪声后的目标图像,其中,上一次采样得到的基础噪声是上一次添加噪声时从高斯噪声中采样得到的,所述高斯噪声为满足高斯分布的噪声。3.根据权利要求2所述的方法,其特征在于,噪声计算公式为:x
t
是第t次添加噪声后的目标图像,x
t
‑1是第t

1次添加噪声后的目标图像,β
t
为常数,β
t
取值范围在0~1之间,∈
t
‑1是第t

1次采样得到的基础噪声,当t等于1时,x0是目标图像,当添加噪声的次数为N,x
N
是所述目标图像对应的第一噪声图像。4.根据权利要求1所述的方法,其特征在于,包括:通过利用所述图像扩散模型处理所述目标图像的次数,控制所述目标图像对应的第一去噪图像的数量,控制所述数据增强后的图像数据集的规模。5.根据权利要求1所述的方法,其特征在于,所述利用图像扩散模型的扩散过程为所述图像数据集中的目标图像连续多次添加噪声,得到所述目标图像对应的第一噪声图像之前,所述方法还包括:获取训练数据集;利用图像扩散模型的扩散过程为所述训练数据集中的训练图像连续多次添加噪声,得到所述训练图像对应的第二噪声图像;利用所述图像扩散模型的逆扩散过程预测在所述扩散过...

【专利技术属性】
技术研发人员:暴宇健汪骞
申请(专利权)人:北京龙智数科科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1