一种编码器自监督训练方法技术

技术编号:39824900 阅读:20 留言:0更新日期:2023-12-29 15:59
本发明专利技术公开了一种编码器自监督训练方法

【技术实现步骤摘要】
一种编码器自监督训练方法、图像识别方法、装置和介质


[0001]本专利技术涉及深度学习领域,特别涉及一种编码器自监督训练方法

图像识别方法

装置和介质


技术介绍

[0002]现有大多数自监督训练方法一般使用
MAE(
基于掩码自编码器
)
的方法,
MAE
是使用
Transformer(
是一个利用注意力机制来提高模型训练速度的模型
)
架构开发的,其输入的大小是固定的,即实际测试使用的图像分辨率必须和训练时一样才行

故在实际任务中,遇到需要更改输入图像大小时,需要重新训练模型,或者强行将图像缩放到训练时大小,但是不管哪一种方法均不是最佳的方案

因此,利用
MAE
使用
transformer
的方法训练编码器,训练所得的编码器扩展性差


技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种编码器自监督训本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种编码器自监督训练方法,其特征在于,包括:获取输入图像,将所述输入图像拆分为同等大小的图像块,随机对部分图像块进行掩码操作,得到掩码图像,所述掩码图像为未掩码图像块与掩码图像块组成;利用纯卷积编码器对所述掩码图像进行特征提取,得到特征图组;对所述特征图组进行解码,得到与所述输入图像大小一致且补全掩码的输出图像;根据所述输入图像和所述输出图像计算损失并反向传播;当满足预设条件时,停止训练,得到训练好的纯卷积编码器
。2.
根据权利要求1所述的编码器自监督训练方法,其特征在于,所述利用纯卷积编码器对所述掩码图像进行特征提取,得到特征图组,包括:所述特征图组为所述输入图像下采样
32
倍的特征图组;所述纯卷积编码器由5个编码块组成;第一个编码块的输入为所述掩码图像,第五个编码块的输出为所述特征图组;第二个编码块

第三个编码块

第四个编码块和所述第五个编码块的输入均为上一个编码块的输出特征图组;每个编码块的编码过程包括:编码输入数据通过深度可分离卷积层进行特征编码得到编码输出数据
。3.
根据权利要求2所述的编码器自监督训练方法,其特征在于,所述编码输入数据通过深度可分离卷积层进行特征编码得到编码输出数据,包括:所述编码输入数据依次通过多个所述深度可分离卷积层;将经过各个所述深度可分离卷积层得到的各个卷积输出进行特征拼接,得到所述编码输出数据
。4.
根据权利要求3所述的编码器自监督训练方法,其特征在于,所述将经过各个所述深度可分离卷积层得到的卷积输出进行特征拼接,得到所述编码输出数据,包括:在经过最后一个所述深度可分离卷积层之后,对经过各个所述深度可分离卷积层得到的所述各个卷积输出进行一次特征拼接,得到所述编码输出数据
。5.
根据权利要求3和4任一项所述的编码器自监督训练方法,其特征在于,在所述得到编码输出数据之后,还包括:利用注意力模块对所述编码输出数据中的各个特征图进行加权处理
。6.
根据权利要求5所述的编码器自监督训练方法,其特征在...

【专利技术属性】
技术研发人员:邹磊韩雪超卢天华倪军
申请(专利权)人:杭州安脉盛智能技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1