基于交错空洞卷积UNet的图像语义分割方法技术

技术编号：35990295 阅读：34 留言：0更新日期：2022-12-17 23:05

基于交错空洞卷积UNet的图像语义分割方法适用于计算机视觉领域。该方法使用了交错空洞卷积模块以及边缘保持模块。交错空洞卷积模块通过交错式的融合方式，即避免了将表达不同物体的特征进行相加，又有效的融合分布在不同通道的特征。而边缘保持模块通过将不同卷积核的卷积层的输出做差得到边缘特征，经整合后加和到输出特征上。该模块具有锐化特征边缘信息的能力。从而增强模型对于边缘的预测能力。该方法的提出，主要解决的技术问题包括多感受野的特征融合与图像语义分割的细节优化，从而获得更好的语义分割性能。得更好的语义分割性能。得更好的语义分割性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于交错空洞卷积UNet的图像语义分割方法

[0001]本专利技术适用于计算机视觉领域中的图像语义分割技术。

技术介绍

[0002]图像语义分割是计算机视觉的核心任务之一，其目的是对视觉输入进行像素级分类，是自动驾驶、医疗诊断、行人检测以及场景理解等视觉分析的基础，图像语义分割的好坏直接影响后续算法的结果。近年来，随着深度学习的快速发展，大量的图像语义分割算法被提出，总体上分为以下三类：基于编码器－解码器的语义分割网络、基于残差网络的语义分割网络以及基于空洞卷积的语义分割网络
[0003](1)基于编码器
‑
解码器的语义分割网络
[0004]受全卷积网络(Fully convolutional network,FCN)的启发，SegNet网络使用编码器
‑
解码器的对称结构。其中，编码器通过卷积和池化的组合不断对图像进行下采样，所得到的特征图的尺寸虽然越来越小，但具备的语义分辨性越来越强；而解码器阶段负责对特征图进行恢复至输入尺寸，并预测像素点的语义类别。而UNet网络为了解决解码器阶段上采样造成的大量边缘细节丢失，通过横向跳跃连接将浅层特征与深层特征相融合，在一定程度上恢复了物体的细节。
[0005](2)基于残差网络的语义分割网络
[0006]全分辨率残差网络(Full
‑
Resolution Residual Networks，FRRN)，它对目标具有很强的定位和识别功能。该网络使用残差流和池化流将多尺度上下文信息和像素级精度结...

【技术保护点】

【技术特征摘要】
1.基于交错空洞卷积UNet的图像语义分割方法，其特征在于：步骤一：建立基于交错空洞卷积的深度网络模型1)训练数据输入将RGB数据作为输入；2)设计交错空洞卷积模块输入F∈R
C*H*W
，首先经过1x1的卷积，之后将结果经过2条支路，2条支路分别为空洞率为1和2的空洞卷积，卷积核的大小为3x3，以此来得到感受野不同的相似特征F1∈R
C1*H*W
以及F2∈R
C2*H*W
；其中C1和C2均为0.5倍的C；并将这些特征按照通道顺序进行交错排列来得到组合特征，并经过1x1卷积来融合特征，丰富感受野,得到模型的输出F
’
∈R
C*H*W
；模块每条支路输出的通道数等于输入模块的特征的通道数除以支路数，保证了模块输出的特征与输入的特征在维度上一致；3).设计边缘保持模块提出了一种边缘保持模块；对于模块的输入特征Z∈R
C*H*W
分别经过一个1x1卷积和一个3x3卷积得到特征Z1∈R
C*H*W
和Z2∈R
C*H*W
，并用Z1减去Z2得到丰富的细节信息Z3∈R
C*H*W
，将Z3经过1x1卷积来进行锐化后，与Z2进行相加得到输出Z
’
∈R
C*H*W
；4).设计基于交错空洞卷积UNet的语义分割网络基于交错空洞卷积UNet网络采用U型的编码
‑
解码结构，对于输入的图像I∈R
1*224*224
，首先经过左侧的编码器进行编码；输入的图像I经过3次3x3卷积和下采样操作，得到三种不同尺度的特征X1∈R
64*112*112
、X2∈R
256*56*56
和X3∈R
512*28*28
；在进入解码器之前，特征X3首先经过12个Transformer层来进一步提升语义信息，得到特征X4∈R
512*14*14
；将特征X4经过3x3卷积以及上采样操作得到特征X3
’
∈R
256*28*28
；将特征X3与X3
’
进行拼接，并经过3x3卷积以及上采样操作，得到特征X2
’
∈R
128*56*56
；将特征X2分别经过AAC模块以及EP模块，并将得到的输出进行拼接得到特征M2∈R
512...

【专利技术属性】
技术研发人员：王少帆，刘玉坤，孙艳丰，尹宝才，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人