【技术实现步骤摘要】
生成样本图像的方法、装置、设备、存储介质和程序产品
本公开的实施例主要涉及人工智能领域,尤其是计算机视觉领域。更具体地,本公开的实施例涉及用于生成样本图像的方法、装置、设备、计算机可读存储介质以及计算机程序产品。
技术介绍
一直以来,机器学习都对数据有着极高的要求。通常来说,用于训练机器学习模型的数据往往都需要经过大量预处理与人工标注,因此这些数据的获取往往都十分昂贵。为了缓解数据不足的问题,数据扩充则是一种行之有效的技巧。数据扩充是指在原数据集的基础上,通过一些简单的操作来对现有的训练数据集进行数据扩充,以达到丰富训练数据集的目的,进而在该扩充后的数据集上训练的模型性能能够得到大幅提升。对于计算机视觉领域而言,传统的数据扩充技术依赖于像素级别的操作,例如,拼接不同图像以构建新的样本图像。然而,这样的扩充技术所成本的样本图像真实性较差,其也难以被用于训练用于处理底层视觉任务(例如图像超分或图像去噪)的图像处理模型。
技术实现思路
本公开的实施例提供了一种生成样本图像的方案。在本公开的第一方 ...
【技术保护点】
1.一种用于生成样本图像的方法,包括:/n获取第一图像和与所述第一图像对应的第二图像,所述第一图像和所述第二图像具有相同的分辨率,并且所述第二图像具有比所述第一图像更高的图像质量;/n确定所述第一图像的第一频域表示和所述第二图像的第二频域表示之间的频谱差异;/n基于所述频谱差异,利用所述第二频域表示的至少一部分来更新所述第一频域表示;以及/n基于经更新的所述第一频域表示,生成样本图像。/n
【技术特征摘要】
1.一种用于生成样本图像的方法,包括:
获取第一图像和与所述第一图像对应的第二图像,所述第一图像和所述第二图像具有相同的分辨率,并且所述第二图像具有比所述第一图像更高的图像质量;
确定所述第一图像的第一频域表示和所述第二图像的第二频域表示之间的频谱差异;
基于所述频谱差异,利用所述第二频域表示的至少一部分来更新所述第一频域表示;以及
基于经更新的所述第一频域表示,生成样本图像。
2.根据权利要求1所述的方法,还包括:
基于所述样本图像,构建用于训练图像处理模型的训练数据集。
3.根据权利要求2所述的方法,其中所述训练数据集至少包括基于所述第二图像和所述样本图像构建的训练图像对。
4.根据权利要求2所述的方法,其中所述训练数据集至少包括基于所述第二图像和第三图像构建的训练图像对,所述第三图像是基于对所述样本图像下采样所生成的。
5.根据权利要求1所述的方法,其中所述第一频域表示和所述第二频域表示是基于离散余弦变换DCT或离散傅立叶变换DFT所生成的。
6.根据权利要求1所述的方法,其中确定所述频谱差异包括:
确定所述第一频域表示中的频谱元素与所述第二频域表示中的对应频谱元素之间的元素差异,以确定所述频谱差异。
7.根据权利要求1所述的方法,其中利用所述第二频域表示的至少一部分来更新所述第一频域表示包括:
基于所述频谱差异从所述第二频域表示中确定第一组频谱元素;以及
利用所述第一组频谱元素更新所述第一频域表示中与所述第一组频谱元素相对应的第二组频谱元素。
8.根据权利要求7所述的方法,其中所述频谱差异包括与多个频谱区域相对应的多个区域频谱差异,并且基于所述频谱差异从所述第二频域表示中确定所述第一组频谱元素包括:
基于所述多个区域频谱差异,从所述多个频谱区域中确定预定数目的频谱区域;以及
从所述第二频域表示中确定与所述预定数目的频谱区域对应的所述第一组频谱元素。
9.根据权利要求8所述的方法,其中基于所述多个频谱差异从所述多个频谱区域中确定预定数目的频谱区域包括:
基于所述多个区域频谱差异,确定与所述多个频谱区域对应的多个选择概率;以及
基于所述多个选择概率,从所述多个频谱区域中选择所述预定数目的频谱区域。
10.根据权利要求9所述的方法,其中所述多个频谱区域是基于所述第二图像的分辨率所确定的。
11.根据权利要求8所述的方法,其中所述区域频谱差异是基于所述第一频域表示在相应频谱区域的频谱元素与所述第二频域表示在所述相应频谱区域内的频谱元素之间的差异的均值所确定的。
12.根据权利要求7所述的方法,其中利用所述第一组频谱元素更新所述第一频域表示中与所述第一组频谱元素相对应的第二组频谱元素包括:
利用所述第一组频谱元素的值和第二组频谱元素的值的加权和,替换所述第一频域表示中的所述第二组频谱元素。
13.根据权利要求12所述的方法,其中用于所述加权和是基于随机权重所确定的。
14.根据权利要求1所述的方法,其中所述第一图像是基于对与所述第二图像对应的第四图像上采样所生成的,所述第四图像具有比所述第二图像更低的分辨率。
15.根据权利要求1所述的方法,其中所述第一图像和所述第二图像呈现至少部分相同的视觉内容。
16.根据权利要求1所述的方法,其中所述图像质量指示以下中的至少一项:图像的清晰度、图像的噪声数目或图像的...
【专利技术属性】
技术研发人员:肖安,郭天宇,韩凯,王云鹤,许春景,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。