一种用于像素级语义分割模型的训练方法技术

技术编号:41559821 阅读:18 留言:0更新日期:2024-06-06 23:44
本发明专利技术提供一种用于像素级语义分割模型的训练方法,包括:步骤S1、获取具有长尾分布性质的用于像素级分割的训练集,包括多个原始样本和对应标签序列,每个原始样本为包括多个像素的原始图像,标签序列包括多个指示对应原始图像中每个像素的类别的标签;步骤S2、确定训练集中缺少的所有尾部类别,利用预设的像素级尾部类别记忆库在训练集的多个原始图像中添加缺少的一种或多种尾部类别对应的像素,得到更新的包括多个修改图像的训练集;步骤S3、利用更新的训练集训练像素级语义分割模型预测修改图像中各个像素的类别,包括采用预设的损失函数根据所述模型的预测结果和标签计算的总损失更新所述模型的参数,得到经训练的像素级语义分割模型。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,具体来说,涉及像素级语义分割领域,更具体地说,涉及一种用于像素级语义分割模型的训练方法


技术介绍

1、语义分割是是计算机视觉中的一个重要研究课题,它为输入图片的每一个像素标注一个标签。在过去的十年中,主流研究专注于开发新颖的网络架构并对其进行改进,例如早期基于卷积神经网络(convolutional neural networks,cnn)的模型依赖局部特征提取和层级表示来实现高效的图像分割,现有参考文献[1]、[2]、[3]和近期盛行的基于转换器模型(transformer)的模型通过全局自注意机制来捕捉图像中更广泛的上下文关系,实现更准确的像素级分类,例如现有参考文献[4]、[5]、[6]、[7]、[8]。而现有语义分割网络最常见的框架是“编码器-解码器模型”。对于编码器,通常使用通用模型,如参考文献[9]使用残差网络(residual network,resnet)和参考文献[10]使用深度神经网络的聚合残差变换(aggregated residual transformations for deep neural n本文档来自技高网...

【技术保护点】

1.一种用于像素级语义分割模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,步骤S2中所述记忆库被配置为:

3.根据权利要求2所述的方法,其特征在于,所述步骤S2包括利用获取的像素级长尾语义分割器得到更新的训练集,该分割器包括像素级尾部类别记忆库、存储分支和检索分支,其中,更新训练集的方式包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括利用存储分支根据获取的训练集更新所述记忆库中的图像,更新方式包括:

5.根据权利要求3所述的方法,其特征在于,所述步骤S22中更新训练集的方式包括:

6...

【技术特征摘要】

1.一种用于像素级语义分割模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,步骤s2中所述记忆库被配置为:

3.根据权利要求2所述的方法,其特征在于,所述步骤s2包括利用获取的像素级长尾语义分割器得到更新的训练集,该分割器包括像素级尾部类别记忆库、存储分支和检索分支,其中,更新训练集的方式包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括利用存储分支根据获取的训练集更新所述记忆库中的图像,更新方式包括:

5.根据权利要求3所述的方法,其...

【专利技术属性】
技术研发人员:许倩倩韩博宇杨智勇包世龙温佩松黄庆明
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1