【技术实现步骤摘要】
一种用于语义分割的新型特征上采样方法
[0001]本专利技术属于深度学习
,具体涉及一种用于语义分割的新型特征上采样方法。
技术介绍
[0002]图像语义分割正在逐渐成为计算机视觉及机器学习研究人员的研究热点。大量应用需要精确、高效的分割机制,如:自动驾驶、室内导航、及虚拟/增强现实系统。这种需求与机器视觉方面的深度学习领域的目标一致,包括语义分割或场景理解。随着深度学习浪潮的来临,包括语义分割在内的许多计算机视觉问题开始使用深度架构来进行解决,并且获得了较高的成果;其中卷积神经网络CNN的应用使得分割准确率有了大幅提升。随着深度学习研究的进展,目前常用的分割模型基本可分为两种架构:多路并行架构和编解码架构。
[0003]在多路并行架构中,将深的、粗糙的网络层语义信息和浅的、精细的网络层的表层信息结合起来,来生成精确的分割。常见的多路并行架构如下:FCN、Fast
‑
SCNN、PSPNet等。在编解码架构中,编码器使用卷积层和池化层将特征图尺寸缩小,使其成为更低维的表征。解码器接收到这一表征, ...
【技术保护点】
【技术特征摘要】
1.一种用于语义分割的新型特征上采样方法,其特征在于:包括以下步骤:S1:采用像素重组Pixel Shuffle的方式对原始图像的特征进行上采样,通过图像放大对原始图像进行尺寸上的复原操作;S2:将通过图像放大得到的特征利用通道注意力机制进行特征增强,增加图像的不同通道间的联系;S3:对图像放大和特征增强分别得到的结果进行像素相加操作,得到最终输出结果。2.根据权利要求1所述的一种用于语义分割的新型特征上采样方法,其特征在于:所述的步骤S1中,具体步骤为:S11:输入通道数为C、特征尺寸为C
×
H
×
W的原始图像;S12:设对原始图像进行上采样时的放大倍数为r,采用像素重组Pixel Shuffle将通道数为C的低分辨率C
×
H
×
W特征图通过卷积得到通道数为2r2C的特征图,该特征图大小与输入时的特征的大小一致;S13:选取r2通道特征图的相同位置像素,以固定的方式填充到高分辨率图像的对应r
×
r像素中;按照同样的规则将每个低分辨像素划分出的小格子填满,将通道数为2r2C的特征图通过多通道间的重组得到通道数为2C的高分辨率2C
×
rH
×
rW上采样特征图,保留原始图像中的相对空间位置信息。3.根据权利要求1所述的一种用于语义分割的新型特征上采样方法,其特征在于:所述的步骤S2中,具体步骤为:采用ECA模块对图像进行特征增强,通过一维卷积实现不降维的本地跨通道交互,通过通道注意力机制改变不同通道间的权重从而校正特征,保留有价值的特征,剔除没价值的特征,以此来加强特征表达能力;采用全局平均池化GAP将全局空间信息压缩到通道描述符中,降低网络参数,同时防止过拟合;设X
a
(i,j)表示第a个通道X
a
在(i,j)位置的值,G为全局平均池化函数,F
a
为输入通道注意力模块的原始特征映射;对输入的2C
×
H
×
W特...
【专利技术属性】
技术研发人员:徐国平,张炫,冷雪松,王霞霞,廖文涛,吴兴隆,
申请(专利权)人:武汉工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。