【技术实现步骤摘要】
一种分阶段融入去噪模块的含噪图像分割方法
[0001]本专利技术涉及计算机视觉
,特别是一种分阶段融入去噪模块的含噪图像分割方法。
技术介绍
[0002]语义分割的目标是确定每个像素点的类别(如属于背景、人或车等),从而将一些原始图像转换为具有突出显示的感兴趣区域的掩模。目前,许多先进的分割方法已经应用在各个领域,如自动驾驶、场景解析、目标检测和人机交互等领域。最近,深度神经网络在语义分割任务中已经取得显著的成功。例如PSANet、DenseAPP以及DANet等。但是这些网络成功的前提,依赖于高质量的训练数据集,即干净无噪声的图像。然而,在实际应用中,由于拍摄时的环境、聚焦失败和机子的抖动,图像采集设备采集到的图像往往具有不同程度的噪声信息,例如:高斯噪声、短噪声和热噪声等。这些噪声信息都是不可控的,即使再精密的图像采集设备也无法控制拍摄现实图像时的环境。噪声信息往往会覆盖图像的一些小纹理结构,从而降低了语义分割模型的能力。当用带有噪声的数据集去训练当前主流的语义分割模型的时候,分割精度明显下降。为了降低噪声对语义信息的干扰,最直接的做法就是在进行语义分割任务前,先完成图像去噪任务。采取一步到位去噪加一步到位分割的串联方法,该方法虽然可以去除噪声,但是也相应的造成了一些小纹理语义信息的缺失,仍然不能达到使用干净图像训练分割模型的结果。当用带有噪声的数据集去训练DANet的时候,噪声信息严重干扰了图像纹理结构,不仅了影响目标边界部分,使得上下文信息无法准确获取,还导致目标区域被错误划分,语义分割精度明显下降。为 ...
【技术保护点】
【技术特征摘要】
1.一种分阶段融入去噪模块的含噪图像分割方法,其特征在于:包括以下步骤:步骤S1:在干净的PASCAL VOC 2012数据集{y
(1)
,y
(2)
,...,y
(m)
}上随机叠加均值为0、标准差为[0,30]的高斯噪声得到噪声图像训练集{x
(1)
,x
(2)
,...,x
(m)
};步骤S2:将噪声图像x
(i)
输入到主干网络ResNet50中,依次经过Stage1、Stage2、Stage3和Stage4,提取各阶段的特征;步骤S3:将主干网络Stage4生成的特征图f4输入到双重注意力模块DAM中,细化特征,输出初步的分割结果z1;步骤S4:将主干网络Stage3生成的特征图f3以及初步分割结果z1输入到基于阶段性协同的分割去噪块SDBSC中;首先通过线性变换公式,主干网络的阶段性特征、分割结果和去噪任务的多尺度特征结合,生成新的特征图,再通过SDBSC中的分割模块SSM,生成新的分割结果z2;步骤S5:将主干网络Stage 2生成的特征图f2以及初步分割结果z2输入到基于阶段性协同的分割去噪块SDBSC中,重复步骤S4,生成新的分割结果z3,并通过干净图像y
(i)
对去噪后的图像计算均方差损失L
d
,L
d
表示为:其中y
i
表示像素i的Ground Truth,表示像素i的概率估计,n表示像素点的数量;步骤S6:最后将阶段性的分割结果z1z2z3进行叠加,生成多阶段特征融合的语义分割结果步骤S7:通过分割标签z对计算混合交叉熵损失L
S
,表示为其中表示交叉熵损失:其中,p表示一张图片的像素数量,表示像素i的Ground Truth类别,表示像素i的概率估计,表示mIOU损失:其中,X表示预测的像素集合,Y表示GT的像素集合。2.根据权利要求1所述的一种分阶段融入去噪模块的含噪图像分割方法,其特征在于:在所述S3中,还包括如下步骤:步骤S31:主干网络Stage 4生成的特征图f
4C
×
H
×
W
通过reshape分别得到特征图A
C
×
HW
,特征图B
HW
×
C
;将B和A进行矩阵乘法,经过softmax层计算得到空间注意力特征图M
HW
×
HW
,表示为:
其中,M
ji
表示特征图中第i个位置和第j个位置的联系,H和W分别表示特征图f4的长和宽,B
i
表示矩阵B的第i个位置,A
j
表示矩阵A的第j个位置;将特征图f
4C
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。