一种基于低通滤波生成图片掩码学习方法及装置制造方法及图纸

技术编号:37277412 阅读:9 留言:0更新日期:2023-04-20 23:44
本申请提供一种基于低通滤波生成图片掩码学习方法及装置,该方法包括:获取原始图片;对原始图片进行裁剪,得到裁剪图片;将裁剪图片输入至编码器和解码器,得到输出特征;根据输出特征与目标特征,确定损失函数;其中,目标特征为原始图片通过低通滤波得到的特征;优化损失函数,以完成优化网络。该方案可以实现提升现有图片掩码学习方法性能,但不引人额外计算量,还保持结构的简洁。还保持结构的简洁。还保持结构的简洁。

【技术实现步骤摘要】
一种基于低通滤波生成图片掩码学习方法及装置


[0001]本专利技术属于优化调度
,特别涉及一种基于低通滤波生成图片掩码学习方法及装置。

技术介绍

[0002]现有的图片掩码学习方法,如MAE(Masked Autoencoders,掩码自编码器)、CAE(Context Autoencoder,上下文自编码器)、MaskFeat(Masked Feature Prediction,掩蔽特征预测)等。
[0003]为了提升现有图片掩码学习方法的性能,涌现出一批改进方法,但是这些方法有以下两种缺点:1)引入了额外的计算量,2)使得整个预训练的流程变得更加复杂。

技术实现思路

[0004]本说明书实施例的目的是提供一种基于低通滤波生成图片掩码学习方法及装置,实现在提升现有图片掩码学习方法性能的同时,不引人额外计算量,还保持结构的简洁。
[0005]为解决上述技术问题,本申请实施例通过以下方式实现的:
[0006]第一方面,本申请提供一种基于低通滤波生成图片掩码学习方法,该方法包括:
[0007]获取原始图片;
[0008]对原始图片进行裁剪,得到裁剪图片;
[0009]将裁剪图片输入至编码器和解码器,得到输出特征;
[0010]根据输出特征与目标特征,确定损失函数;其中,目标特征为原始图片通过低通滤波得到的特征;
[0011]优化损失函数,以完成优化网络。
[0012]在其中一个实施例中,目标特征为原始图片通过低通滤波得到的特征,包括:
[0013]通过快速傅里叶变换将原始图片变换到频域空间,得到频谱图;
[0014]将频谱图与理想低通滤波器相乘,得到具有低频分量的频谱图;
[0015]将具有低频分量的频谱图通过快速傅里叶逆变换,得到具有低频分量的目标图片;
[0016]将具有低频分量的目标图片作为目标特征。
[0017]在其中一个实施例中,对原始图片进行裁剪包括:采用简单大小裁剪方法对原始图片进行裁剪。
[0018]第二方面,本申请提供一种基于低通滤波生成图片掩码学习方法,该方法包括:
[0019]获取原始图片;
[0020]采用简单大小裁剪方法对原始图片进行裁剪,得到裁剪图片;
[0021]将裁剪图片输入至编码器和解码器,得到输出特征;
[0022]根据输出特征与目标特征,确定损失函数;
[0023]优化损失函数,以完成优化网络。
[0024]第三方面,本申请提供一种基于低通滤波生成图片掩码学习装置,该装置包括:
[0025]获取模块,用于获取原始图片;
[0026]裁剪模块,用于对原始图片进行裁剪,得到裁剪图片;
[0027]处理模块,用于将裁剪图片输入至编码器和解码器,得到输出特征;
[0028]确定模块,用于根据输出特征与目标特征,确定损失函数;其中,目标特征为原始图片通过低通滤波得到的特征;
[0029]优化模块,用于优化损失函数,以完成优化网络。
[0030]在其中一个实施例中,装置还包括:目标特征确定模块,用于:
[0031]通过快速傅里叶变换将原始图片变换到频域空间,得到频谱图;
[0032]将频谱图与理想低通滤波器相乘,得到具有低频分量的频谱图;
[0033]将具有低频分量的频谱图通过快速傅里叶逆变换,得到具有低频分量的目标图片;
[0034]将具有低频分量的目标图片作为目标特征。
[0035]在其中一个实施例中,裁剪模块还用于:采用简单大小裁剪方法对原始图片进行裁剪。
[0036]第四方面,本申请提供一种基于低通滤波生成图片掩码学习装置,该装置包括:
[0037]获取模块,用于获取原始图片;
[0038]裁剪模块,用于采用简单大小裁剪方法对原始图片进行裁剪,得到裁剪图片;
[0039]处理模块,用于将裁剪图片输入至编码器和解码器,得到输出特征;
[0040]确定模块,用于根据输出特征与目标特征,确定损失函数;
[0041]优化模块,用于优化损失函数,以完成优化网络。
[0042]第五方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面的基于低通滤波生成图片掩码学习方法或实现如第二方面的基于低通滤波生成图片掩码学习方法。
[0043]第六方面,本申请提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面的基于低通滤波生成图片掩码学习方法或实现如第二方面的基于低通滤波生成图片掩码学习方法。
[0044]由以上本说明书实施例提供的技术方案可见,该方案:可以实现提升现有图片掩码学习方法性能,但不引人额外计算量,还保持结构的简洁。
附图说明
[0045]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0046]图1为现有采用random resized crop方式裁剪原始图片的示意图;
[0047]图2为本申请提供的基于低通滤波生成图片掩码学习方法的流程示意图;
[0048]图3为现有图片的纹理信息在频域空间中的高频信息示意图;
[0049]图4为本申请提供的采用低通滤波得到目标特征的流程示意图;
[0050]图5为本申请提供的采用simple resized crop方式裁剪原始图片的示意图;
[0051]图6为本申请提供的基于低通滤波生成图片掩码学习方法的又一流程示意图;
[0052]图7为本申请提供的基于低通滤波生成图片掩码学习装置的结构示意图;
[0053]图8为本申请提供的基于低通滤波生成图片掩码学习装置的又一结构示意图;
[0054]图9为本申请提供的电子设备的结构示意图。
具体实施方式
[0055]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0056]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0057]在不背离本申请的范围或精本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于低通滤波生成图片掩码学习方法,其特征在于,所述方法包括:获取原始图片;对所述原始图片进行裁剪,得到裁剪图片;将所述裁剪图片输入至编码器和解码器,得到输出特征;根据所述输出特征与目标特征,确定损失函数;其中,所述目标特征为所述原始图片通过低通滤波得到的特征;优化所述损失函数,以完成优化网络。2.根据权利要求1所述的方法,其特征在于,所述目标特征为所述原始图片通过低通滤波得到的特征,包括:通过快速傅里叶变换将所述原始图片变换到频域空间,得到频谱图;将所述频谱图与理想低通滤波器相乘,得到具有低频分量的频谱图;将所述具有低频分量的频谱图通过快速傅里叶逆变换,得到具有低频分量的目标图片;将所述具有低频分量的目标图片作为所述目标特征。3.根据权利要求1或2所述的方法,其特征在于,所述对所述原始图片进行裁剪包括:采用简单大小裁剪方法对所述原始图片进行裁剪。4.一种基于低通滤波生成图片掩码学习方法,其特征在于,所述方法包括:获取原始图片;采用简单大小裁剪方法对所述原始图片进行裁剪,得到裁剪图片;将所述裁剪图片输入至编码器和解码器,得到输出特征;根据所述输出特征与目标特征,确定损失函数;优化所述损失函数,以完成优化网络。5.一种基于低通滤波生成图片掩码学习装置,其特征在于,所述装置包括:获取模块,用于获取原始图片;裁剪模块,用于对所述原始图片进行裁剪,得到裁剪图片;处理模块,用于将所述裁剪图片输入至编码器和解码器,得到输出特征;确定模块,用于根据所述输出特征与目标特征,确定损失函数;其中,所述目标特征为所述原始图片通过低通滤波得到的特...

【专利技术属性】
技术研发人员:柳源张松阳陈恺林达华
申请(专利权)人:上海人工智能创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1