【技术实现步骤摘要】
本专利技术涉及计算机视觉领域,具体来说,涉及像素级语义分割领域,更具体地说,涉及一种用于像素级语义分割模型的训练方法。
技术介绍
1、语义分割是是计算机视觉中的一个重要研究课题,它为输入图片的每一个像素标注一个标签。在过去的十年中,主流研究专注于开发新颖的网络架构并对其进行改进,例如早期基于卷积神经网络(convolutional neural networks,cnn)的模型依赖局部特征提取和层级表示来实现高效的图像分割,现有参考文献[1]、[2]、[3]和近期盛行的基于转换器模型(transformer)的模型通过全局自注意机制来捕捉图像中更广泛的上下文关系,实现更准确的像素级分类,例如现有参考文献[4]、[5]、[6]、[7]、[8]。而现有语义分割网络最常见的框架是“编码器-解码器模型”。对于编码器,通常使用通用模型,如参考文献[9]使用残差网络(residual network,resnet)和参考文献[10]使用深度神经网络的聚合残差变换(aggregated residual transformations for dee
...【技术保护点】
1.一种用于像素级语义分割模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,步骤S2中所述记忆库被配置为:
3.根据权利要求2所述的方法,其特征在于,所述步骤S2包括利用获取的像素级长尾语义分割器得到更新的训练集,该分割器包括像素级尾部类别记忆库、存储分支和检索分支,其中,更新训练集的方式包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括利用存储分支根据获取的训练集更新所述记忆库中的图像,更新方式包括:
5.根据权利要求3所述的方法,其特征在于,所述步骤S22中更新训练集的方式包
6...
【技术特征摘要】
1.一种用于像素级语义分割模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,步骤s2中所述记忆库被配置为:
3.根据权利要求2所述的方法,其特征在于,所述步骤s2包括利用获取的像素级长尾语义分割器得到更新的训练集,该分割器包括像素级尾部类别记忆库、存储分支和检索分支,其中,更新训练集的方式包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括利用存储分支根据获取的训练集更新所述记忆库中的图像,更新方式包括:
5.根据权利要求3所述的方法,其...
【专利技术属性】
技术研发人员:许倩倩,韩博宇,杨智勇,包世龙,温佩松,黄庆明,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。