一种实时图像语义分割装置及分割方法制造方法及图纸

技术编号:25523135 阅读:160 留言:0更新日期:2020-09-04 17:13
本发明专利技术提供一种实时图像语义分割装置及分割方法。在一个实施例中,将原始图像输入编码器,提取出至少两个大小不同的编码图像;将所述至少两个大小不同的编码图像输入第一解码器,提取出主特征图;将所述至少两个大小不同的编码图像输入第二解码器,提取出边缘特征图;根据所述主特征图和边缘特征图计算所述原始图像的最终损失;并根据最终损失训练所述主解码器和所述边缘解码器;将待预测图像通过编码器处理以后输入到主解码器中,得到主特征图。使用了两个结构相同的解码器,一个用于训练整体,一个用于训练边缘,在训练时使用其中的一个解码器检测目标边缘处的特征,使得能够更好的对目标边缘处的像素进行分割。

【技术实现步骤摘要】
一种实时图像语义分割装置及分割方法
本专利技术涉及图像语义分割
,尤其涉及一种实时图像语义分割装置及分割方法。
技术介绍
随着深度学习技术的快速发展,计算机视觉领域也迎来了一波发展热潮。在实际应用中,无论是物体检测还是自动驾驶技术,计算机视觉技术都是不可或缺的。图像语义分割是图像处理的基础算法,所以其性能对后续的应用有很大的影响。因此,寻找一种高效的图像语义分割方法具有极为重要的现实意义和较强的应用价值。图像语义分割将图像分割和目标识别相结合,将图像分成具有特定语义的像素组,识别每个区域的类别,最终得到分类图。2015年,Long等在CVPR上的论文中提出的模型首先将深度语义分割的潮流转向全卷积神经网络。所谓全卷积的意思就是在网络结构中摒弃全连接层,与之前使用CNN进行图像语义分割的方法相比,FCN对输入图像的大小没有限制,并且可以实现端到端的训练。随后,许多研究人员在FCN基础上提出了各种用于语义分割的神经网络算法。语义分割模型面临两个主要问题:恢复输入图像的分辨率和扩大感受野。最简单的恢复输入分辨率的方法就是避免下采样本文档来自技高网...

【技术保护点】
1.一种实时图像语义分割装置,包括:/n编码器,用于对输入的原始图像进行处理,提取出至少两个大小不同的编码图像;/n第一解码器,用于将所述至少两个大小不同的编码图像输入至少两个分组卷积横向连接模块中进行卷积处理得到至少两个特征图;其中,所述至少两个特征图中的第二特征图是由第一分组卷积横向连接模块中输出的第一特征图进行上采样后与第二分组卷积横向连接模块输出的特征图相加得到,所述第一分组卷积横向连接模块和所述第二分组卷积横向连接模块具有相同的结构;/n将所述至少两个特征图输入到至少两个并行分组全局卷积模块中进行卷积处理,将所述至少两个并行分组全局卷积模块输出的至少两个特征图进行上采样后输入到卷积层...

【技术特征摘要】
1.一种实时图像语义分割装置,包括:
编码器,用于对输入的原始图像进行处理,提取出至少两个大小不同的编码图像;
第一解码器,用于将所述至少两个大小不同的编码图像输入至少两个分组卷积横向连接模块中进行卷积处理得到至少两个特征图;其中,所述至少两个特征图中的第二特征图是由第一分组卷积横向连接模块中输出的第一特征图进行上采样后与第二分组卷积横向连接模块输出的特征图相加得到,所述第一分组卷积横向连接模块和所述第二分组卷积横向连接模块具有相同的结构;
将所述至少两个特征图输入到至少两个并行分组全局卷积模块中进行卷积处理,将所述至少两个并行分组全局卷积模块输出的至少两个特征图进行上采样后输入到卷积层,得到主特征图;
第二解码器,用于将所述至少两个大小不同的编码图像输入到第二解码器,得到边缘特征图;
所述第一解码器还用于,根据所述主特征图计算所述原始图像的主损失;
所述第二解码器还用于,根据所述边缘特征图计算所述原始图像的边缘损失;
处理器,用于将所述主损失和边缘损失相加得到所述原始图像的最终损失;并根据所述最终损失训练所述第一解码器和第二解码器。


2.根据权利要求1所述的装置,其特征在于,所述第一解码器和所述第二解码器结构相同;
所述第一解码器和所述第二解码器中包括:至少两个分组卷积横向连接模块与至少两个并行分组全局卷积模块横向连接。


3.根据权利要求1所述的装置,其特征在于,所述根据所述主特征图和所述边缘特征图计算所述原始图像的最终损失包括:
将所述主特征图与主标签进行比较得到主损失;将所述边缘特征图与边缘标签进行比较得到边缘损失;
将所述主损失与所述边缘损失相加得到所述原始图像的最终损失。


4.根据权利要求1所述的装置,其特征在于,将所述至少两个大小不同的编码图像输入到第一解码器的至少两个分组卷积横向连接模块中进行卷积处理得到至少两个特征图,包括:
将所述至少两个大小不同的编码图像分别通过核为(1,1)、(3,3)和(1,1)的卷积层;
所述将所述至少两个特征图输入到至少两个并行分组全局卷积模块中进行卷积处理,包括:
将所述至少两个特征图经过核为(1,k)和(k,1)的卷积层。


5.根据权利要求4所述的装置,其特征在于,每个卷积层后都包括一个整流...

【专利技术属性】
技术研发人员:周军白兴张鹏远颜永红
申请(专利权)人:中国科学院声学研究所北京中科信利技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1