编解码结构结合注意力机制的图像分割模型及其训练方法技术

技术编号:33346809 阅读:65 留言:0更新日期:2022-05-08 09:43
本发明专利技术公开了一种编解码结构结合注意力机制的图像分割模型,包括编码模块、解码模块、编解码连接模块、像素分类层;编码模块包括多个串接的编码单元,解码模块包括多个与编码单元一一对应的解码单元,编解码连接模块用于连接编码模块与解码模块,像素分类层用于为每个像素独立的产生类别概率,得到图像分割结果。本发明专利技术的图像分割模型结合SegNet在局部环境信息进行建模的优势和Transformer在学习全局语义关联上的优势,通过加强全局语义关联以改善SegNet在数据集较小时易过拟合的局限性,同时提升了网络分割性能。时提升了网络分割性能。时提升了网络分割性能。

【技术实现步骤摘要】
编解码结构结合注意力机制的图像分割模型及其训练方法


[0001]本专利技术涉及视觉图像处理领域,特别涉及一种编解码结构结合注意力机制的图像分割模型及其训练方法。

技术介绍

[0002]图像分割是图像识别和计算机视觉的重要组成部分,在各领域中具有广阔的应用场景。在计算机视觉领域,图像分割技术经过长时间的发展可以归纳为两大类:一是基于人工提取特征的传统图像分割方法,二是基于深度学习提取特征的图像分割方法。
[0003]基于人工提取特征的图像分割方法如基于阈值的图像分割方法、基于边缘检测的图像分割方法、基于区域的图像分割方法等,但传统算法仅针对特定图像形式且大多存在人为偏差。
[0004]深度学习可以从多层网络结构中学习目标特征,其中,卷积神经网络(convolutional neural network,CNN)在各种图像处理问题上都有不错的表现。基于CNN基础上的全卷积网络(fully convolutional network,FCN)及在FCN基础上演变出的其他变体网络(如SegNet和U
/>Net网络)在图本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种编解码结构结合注意力机制的图像分割模型,其特征在于,所述图像分割模型采用编解码结构,包括编码模块、解码模块、编解码连接模块、像素分类层;所述编码模块包括若干个串联的编码单元,除最后一个编码单元外每个编码单元包括依次连接的编码紧密块和最大池化块,最后一个编码单元仅有编码紧密块,每个编码紧密块对当前编码单元的输入进行特征提取,得到对应的编码稠密输出;所述编码稠密输出经过最大池化块进行最大池化后得到当前编码单元的输出,并将其作为下一编码单元的输入;所述最大池化块进行最大池化时保留池化索引;所述解码模块包括多个与所述编码单元一一对应的解码单元,除第一个解码单元外每个解码单元包括上采样块和解码紧密块,第一个解码单元仅有解码紧密块,每个解码紧密块对当前解码单元的输入进行特征提取,得到对应的解码稠密输出;所述解码稠密输出经过上采样块进行上采样得到当前解码单元的输出,并将其作为下一解码单元的输入;每个所述上采样块以对应编码单元的池化索引进行上采样,上采样过程中,将池化索引处的值直接填回原处,其余地方补0;第一解码单元的输入为所述编解码连接模块的输出;其余解码单元的输入为上一解码单元的输出经过所述上采样块的上采样后得到;所述编解码连接模块的输入端连接所述编码模块,输出端连接所述解码模块,对最后一个编码单元的输出进行特征提取后,得到编解码连接模块的输出,并将其输入至第一个解码单元;所述像素分类层连接解码模块的输出端,像素分类层的输入为所述解码模块的输出,所述像素分类层为每个像素独立的产生类别概率,得到图像分割结果。2.根据权利要求1所述的编解码结构结合注意力机制的图像分割模型,其特征在于,所述编码紧密块与解码紧密块的结构相同,均采用紧密块;所述紧密块包括若干个卷积层;卷积层用于对紧密块的输入进行逐层提取;每个卷积层的输入为前一卷积层的输出;所述卷积层,包含卷积操作、归一化和激活函数;所述卷积操作,用于对卷积层的输入进行特征提取;所述归一化,用于对所述卷积层输出的分布归一化;所述激活函数,用于在所述卷积层中来为网络引入非线性变化。3.根据权利要求1所述的编解码结构结合注意力机制的图像分割模型,其特征在于,所述编解码连接模块包括依次连接的线性投影块、位置编码块、若干个Transformer层和特征映射块;线性投影模块用于将编码模块的输出进行投影;所述位置编码块用于对Transformer层的输入进行位置编码;所述Transfor...

【专利技术属性】
技术研发人员:陈祖国黄贺俊陈超洋卢明吴亮红张徐卓唐志强
申请(专利权)人:湖南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1