基于MIM和对比学习的半监督语义分割方法及装置制造方法及图纸

技术编号：38086505 阅读：6 留言：0更新日期：2023-07-06 08:55

本申请涉及一种基于MIM和对比学习的半监督语义分割方法及装置。所述方法包括：获取训练图像集；构建MIM半监督语义分割网络模型，该模型包括教师模型、学生模型、重建探测头及特征探测头；将弱增强图像发送至教师模型进行语义分割，生成第一预测熵图；将强增强图像输入学生模型解码器中，通过特征探测头提取强语义特征及第二伪标签；将弱增强图像的掩码图像输入学生模型编码器中，通过重建探测头生成重建图像语义特征及第四伪标签；拼接强语义特征、重建图像语义特征、第二伪标签及第四伪标签，生成第二预测熵图；根据第一预测熵图与第二预测熵图的对比学习结果，得到训练好的MIM半监督语义分割网络模型。本发明专利技术可提升图像特征提取效果。取效果。取效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于MIM和对比学习的半监督语义分割方法及装置

[0001]本申请涉及图像数据处理
，特别是涉及一种基于MIM和对比学习的半监督语义分割方法及装置。

技术介绍

[0002]随着图像数据处理技术的发展，对于目标追踪时捕捉到的图像需要进行数据真实性预测，出现了半监督语义分割技术，通过半监督学习来利用图像中未标记数据的信息，通过模拟图像标记和未标记数据的真实数据分布，进而生成新的图像数据或者高质量伪标签，并在一致性正则化方法的假设下，利用伪标签方法以迭代方式增强半监督语义特征提取的性能。
[0003]然而，目前的半监督语义分割方法，致力于从有标签数据中提取无标签信息，而忽略了图像内不同区域间的信息交互，导致图像数据处理和未标记数据的提取精度较差，并且对于目标掩蔽情况下，捕捉到的图像信息训练结果偏差率较大。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提取不同切片间图像数据信息的基于MIM和对比学习的半监督语义分割方法及装置。
[0005]一种基于MIM和对比学习的半监督语义分割方法，所述方法包括：
[0006]获取训练图像集，训练图像集包括：弱增强图像和强增强图像。
[0007]构建MIM半监督语义分割网络模型，半监督语义分割网络模型包括：教师模型、学生模型、重建探测头以及特征探测头。
[0008]将弱增强图像发送至教师模型进行语义分割，得到弱增强图像中未标记图像的第一伪标签，根据第一伪标签生成第一预测熵图。
[0009]将强增...

【技术保护点】

【技术特征摘要】
1.一种基于MIM和对比学习的半监督语义分割方法，其特征在于，所述方法包括：获取训练图像集，所述训练图像集包括：弱增强图像和强增强图像；构建MIM半监督语义分割网络模型，所述MIM半监督语义分割网络模型包括：教师模型、学生模型、重建探测头以及特征探测头；将所述弱增强图像发送至所述教师模型进行语义分割，得到所述弱增强图像中未标记图像的第一伪标签，根据所述第一伪标签生成第一预测熵图；将所述强增强图像输入所述学生模型解码器中，通过所述特征探测头从所述学生模型解码器中提取强语义特征及第二伪标签；将所述弱增强图像的掩码图像输入所述学生模型编码器中，通过所述重建探测头从所述学生模型编码器中提取的掩码语义特征及第三伪标签，基于MIM生成重建图像语义特征及第四伪标签；通过拼接所述强语义特征、所述重建图像语义特征、所述第二伪标签以及所述第四伪标签，生成第二预测熵图；根据所述第一预测熵图与所述第二预测熵图的对比学习结果进行反向训练，得到训练好的MIM半监督语义分割网络模型。2.根据权利要求1所述的方法，其特征在于，将所述弱增强图像发送至所述教师模型进行语义分割，得到所述弱增强图像中未标记图像的第一伪标签，根据所述第一伪标签生成第一预测熵图，包括：将所述弱增强图像发送至所述教师模型，经所述教师模型中的第一残差模块、第一全局
‑
局部注意力机制模块、第一加权求和模块以及第一特征增强模块对所述弱增强图像的第一语义特征进行提取，并对所述弱增强图像中的未标记图像赋予第一伪标签，根据所述第一语义特征与所述第一伪标签进行拼接，生成第一预测熵图。3.根据权利要求2所述的方法，其特征在于，所述教师模型包括：第一残差模块、第一全局
‑
局部注意力机制模块、第一加权求和模块以及第一特征增强模块；所述第一残差模块接收所述弱增强图像并逐层处理所述弱增强图像的语义特征信息，得到第一残差语义特征；所述第一全局
‑
局部注意力机制模块包括第一全局分支和第一局部分支，所述第一全局分支采用上下文交互模块提取所述弱增强图像的第一全局语义特征，所述第一局部分支采用并行的卷积层提取所述弱增强图像的第一局部语义特征；所述第一加权求和模块用于聚合所述第一残差语义特征、所述第一全局语义特征以及所述第一局部语义特征，得到所述弱增强图像的第一融合语义特征；所述第一特征增强模块接收所述第一融合语义特征，采用双信道处理方式处理所述第一融合语义特征，得到所述弱增强图像的第一语义特征。4.根据权利要求3所述的方法，其特征在于，将所述强增强图像输入所述学生模型解码器中，通过所述特征探测头从所述学生模型解码器中提取强语义特征及第二伪标签，包括：所述学生模型包括第二残差模块、第二全局
‑
局部注意力机制模块、第二加权求和模块以及第二特征增强模块；将所述强增强图像输入所述学生模型解码器中，经所述学生模型解码器中的所述第二残差模块、所述第二全局
‑
局部注意力机制模块以及所述第二加权求和模块进行语义特征
提取，得到第二语义特征；所述特征探测头从所述学生模型解码器中获取所述第二语义特征，根据预先构建的对比损失函数进行收敛，生成强语义特征及第二伪标签。5.根据权利要求4所述的方法，其特征在于，将所述弱增强图像的掩码图像输入所述学生模型编码器中，通过所述重建探测头从所述学生模型编码器中...

【专利技术属性】
技术研发人员：陈浩，李政宏，伍江江，杜春，李沛秦，熊伟，李军，吴烨，贾庆仁，陈荦，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人