当前位置: 首页 > 专利查询>南开大学专利>正文

一种基于渐进式重建的高效自监督学习方法及系统技术方案

技术编号:43008214 阅读:23 留言:0更新日期:2024-10-18 17:15
本发明专利技术公开了一种基于渐进式重建的高效自监督学习方法及系统,其中方法,包括:获取待重建图像,将待重建图像划分为若干个不重叠的图像块;将待重建图像的所有图像块,输入到训练后的神经网络模型中,得到重建后的图像;其中,训练后的神经网络模型,编码器用于提取所有图像块的特征,所述图像块特征包括:被遮蔽图像块的特征和未被遮蔽图像块的特征,所述最远采样模块对被遮蔽图像块的特征进行选择性地丢弃或保留,所述解码器对被遮蔽图像块的保留特征和未被遮蔽图像块的特征进行重建,得到第一重建图像;所述渐进式重建模块对被遮蔽图像块的丢弃特征进行重建,得到第二重建图像;将第一和第二重建图像进行整合,得到最终重建后的图像。

【技术实现步骤摘要】

本专利技术涉及掩码图像建模,特别是涉及一种基于渐进式重建的高效自监督学习方法及系统


技术介绍

1、通过遮蔽图像的一部分像素,并训练模型使其根据未被遮蔽的像素重建被遮蔽的部分,基于掩码图像建模(masked image modeling,mim)的自监督学习方法在训练视觉模型方面取得了巨大成功,但该技术也需要高昂的计算成本。一种节省成本的策略是部分重建,也就是使模型仅重建一部分被遮蔽的像素而丢弃其他被遮蔽的像素。然而,这种方法也会降低模型的质量。为了减轻这种负面影响,现有方法依赖时序冗余性丢弃冗余的像素,但时序冗余性在静态图像中是不可用的;或者依赖注意力图丢弃信息量少的像素,但获取注意力图又需要额外的计算成本。


技术实现思路

1、为了解决现有技术的不足,本专利技术提供了一种基于渐进式重建的高效自监督学习方法及系统;提出了一种渐进重建策略,以极其轻量的方式重建被丢弃的像素,而不是完全放弃它们。因此,渐进重建使mim能够将完整的数据用于训练,同时保留了部分重建在节省成本上的优势。同时,我们发现部分重建增大了模型完本文档来自技高网...

【技术保护点】

1.一种基于渐进式重建的高效自监督学习方法,其特征是,包括:

2.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,所述编码器用于提取所有图像块的特征,所述图像块特征包括:被遮蔽图像块的特征和未被遮蔽图像块的特征,具体包括:

3.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,所述最远采样模块对被遮蔽图像块的特征进行选择性地丢弃或保留,具体包括:

4.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,所述渐进式重建模块对被遮蔽图像块的丢弃特征进行重建,得到第二重建图像,包括:</p>

5.如权...

【技术特征摘要】

1.一种基于渐进式重建的高效自监督学习方法,其特征是,包括:

2.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,所述编码器用于提取所有图像块的特征,所述图像块特征包括:被遮蔽图像块的特征和未被遮蔽图像块的特征,具体包括:

3.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,所述最远采样模块对被遮蔽图像块的特征进行选择性地丢弃或保留,具体包括:

4.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,所述渐进式重建模块对被遮蔽图像块的丢弃特征进行重建,得到第二重建图像,包括:

5.如权利要求1所述的一种基于渐进式重建的高效自监督学习方法,其特征是,将...

【专利技术属性】
技术研发人员:范登平李钟毓李运恒程明明薛超
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1