基于双通道和自注意力机制的图像语义分割方法及系统技术方案

技术编号：31795385 阅读：17 留言：0更新日期：2022-01-08 10:55

本发明专利技术公开了基于双通道和自注意力机制的图像语义分割方法及系统，该方法包括如下步骤：获取待分割图片；将待分割图片分别进行两个通道的特征图提取；其中，第一个通道提取出多尺度上下文信息特征图；第二个通道出提取出像素级特征图；将多尺度上下文信息特征图和像素级特征图通过矩阵运算和自注意力机制学习得到每一个像素与它对应的上下文区域有关系的特征图；将每一个像素与它对应的上下文区域有关系的特征图输入到训练后的分类器中，输出图片语义分割结果。图片语义分割结果。图片语义分割结果。

全部详细技术资料下载

【技术实现步骤摘要】
基于双通道和自注意力机制的图像语义分割方法及系统

[0001]本专利技术属于计算机视觉和图像处理
，尤其涉及基于双通道和自注意力机制的图像语义分割方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息，不必然构成在先技术。
[0003]语义分割技术不仅属于计算机科学的研究范畴，研究图像的语义分割对于图像复原有着重要的应用意义，还是涉及医学影像、自动驾驶、卫星遥感等多学科的一个前沿研究领域，语义分割技术具有十分重要的研究意义和应用价值。
[0004]现在语义分割技术普遍采用传统的卷积神经网络，例如VGG,ResNet等，但是它们的结构复杂，计算量很大，这跟语义分割的实时性及应用落地存在落差。
[0005]传统的网络不断地对输入的图片进行特征提取，经过多层的卷积和下采样操作，特征图的分辨率会大幅度下降，损失了原始的信息，因此之后越来越多的网络设计都在试图减少分辨率的损失，比如Deeplab系列的文章使用由空洞卷积组成的ASPP模块来提取多尺度感受野的语义信息，其中编码器模块融入了空洞卷积，或者使用步长为2的卷积操作来代替池化，解决了步长以及感受野与特征图信息之间的矛盾，虽然效果有所提升，但是计算量很大，而且空洞卷积不能产生密集的上下文信息，过多使用空洞卷积也会产生网格效应，所以没有从根本上解决语义分割的问题，语义分割是像素级的分割任务，所以要综合考虑卷积、步长、分辨率、感受野以及上下文之间的关系；显然如果只使用ASPP模块，就会产生网格效应，丧失上下文的整体信...

【技术保护点】

【技术特征摘要】
1.基于双通道和自注意力机制的图像语义分割方法，其特征在于，包括如下步骤：获取待分割图片；将待分割图片分别进行两个通道的特征图提取；其中，第一个通道提取出多尺度上下文信息特征图；第二个通道出提取出像素级特征图；将多尺度上下文信息特征图和像素级特征图通过矩阵运算和自注意力机制学习得到每一个像素与它对应的上下文区域有关系的特征图；将每一个像素与它对应的上下文区域有关系的特征图输入到训练后的分类器中，输出图片语义分割结果。2.如权利要求1所述的基于双通道和自注意力机制的图像语义分割方法，其特征在于，所述第一个通道提取出多尺度上下文信息特征图具体包括：将待分割图片输入至HRNetV2_w18网络得到第一个通道的第一个特征图，将第一个通道的第一个特征图通过卷积得到第一个通道的第二个特征图，将第一个通道的第二个特征图通过金字塔池化模型进行多尺度上下文信息提取得到第一个通道的第三个特征图。3.如权利要求2所述的基于双通道和自注意力机制的图像语义分割方法，其特征在于，所述第一个通道的第三个特征图得到后加入随机失活dropout，随机失活神经元，在卷积之后加入交叉熵损失函数对网络辅助训练得到第一通道的第四特征图，即多尺度上下文信息特征图。4.如权利要求1所述的基于双通道和自注意力机制的图像语义分割方法，其特征在于，所述第二个通道提取像素级特征图具体包括：将待分割图片输入至HRNetV2_w18网络得到第二个通道的第一个特征图，将第二个通道的第一个特征图经过卷积、加速神经网络以及Relu函数后提取出第二个通道的第二个特征图，即像素级特征图。5.如权利要求1所述的基于双通道和自注意力机制的图像语义分割方法，其特征在于，所述将多尺度上下文信息特征图和像素级特征图通过矩阵运算具体包括：将多尺度区域上下文信息特征图和像素级特征图的每个位置的像素进行矩阵相乘，包括：将多尺度区域上下文信息特征图经过预处理后输出得到第一矩阵；将图像素级特征图经过归一化处理后输出第二矩阵，第一矩阵和第二矩阵相乘，输出第三矩阵特征图，即融合后的像素级区域上下文特征图。6.如权利要求1所述的基于双通道和自注意力机制的图像语义分割方法，其特征在于，所述自注意力机制学习包括学习每个位置的像...

【专利技术属性】
技术研发人员：李天平，魏艳军，严业金，丁同贺，欧佳瑜，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人