一种水下图像语义分割模型及分割方法技术

技术编号:32136173 阅读:21 留言:0更新日期:2022-01-29 19:45
本发明专利技术公开了一种水下图像语义分割模型及分割方法,所述模型包括预处理模块、编码器和解码器,在编码器中包含五个阶段编码模块,第四阶段编码模块包含卷积注意力模块,卷积注意力模块包含通道注意力子模块和空间注意力子模块,特征图经过通道注意力子模块,分别进行平均池化和最大池化后再进行相加和激活操作,然后经过空间注意力子模块,沿通道分别对维度计算均值和最大值后再进行相加、卷积和激活操作;所述分割方法将水下图像输入训练好的分割模型,得到分割后的图像;本发明专利技术的分割模型及分割方法对于水下图像中对比度较小的物体之间也能够精确分割,边缘分割效果好,分割精度高。精度高。精度高。

【技术实现步骤摘要】
一种水下图像语义分割模型及分割方法


[0001]本专利技术涉及一种水下图像语义分割模型及分割方法。

技术介绍

[0002]随着水下图像处理技术和计算机资源的不断发展,越来越多的人利用计算机视觉技术和图像处理技术对水下图像进行图像分割,以此来提取水下图像中的目标区域,从而获得更多有用的信息,主要包括水下图像语义分割和水下图像实例分割,常用的水下图像语义分割方法有:基于阈值的图像分割方法、基于边缘的图像分割技术和基于特定理论的图像分割技术等。例如,一种注意力图像分割方法、装置及介质(CN112950653A)中公开了利用注意力网络以及融合特征图进行图像分割,然后将分割网络与区域信息加权融合得到的矩阵再次进行分割。现有方法对图片中的每个像素进行同样的操作,并没有对不同大小、形状、类别的物体分配不同的权重,从而导致分割效果较为粗糙,同时由于水下图像对比度较小,现有分割方法对于边缘的分割效果较差。

技术实现思路

[0003]专利技术目的:本专利技术的目的是提供一种基于卷积注意力网络的水下图像语义分割方法及系统,解决水下图像分割中分割效果较为粗糙,分割平均交并比和平均像素精度较低的问题。
[0004]技术方案:本专利技术所述的一种水下图像语义分割模型,包括:
[0005]预处理模块,用于对水下图像进行预处理得到输入图像;
[0006]编码器,包括五个阶段编码模块,第四阶段编码模块包含卷积注意力模块,
[0007]所述卷积注意力模块中的通道注意力子模块对通道设置不同的权重,所述卷积注意力模块中的空间注意力子模块对空间信息设置不同的权重;所述编码器用于按权重进行特征提取;
[0008]解码器,用于恢复输入图像的细节信息和空间位置信息,得到分割之后的图像。
[0009]进一步地,在编码器中,所述第四阶段编码模块输出的特征图经过通道注意力子模块,分别进行平均池化和最大池化后再进行相加和激活,得到特征图E17;所述特征图E17经过空间注意力子模块,沿通道分别对维度计算均值和最大值后再进行相加、卷积和激活操作。
[0010]进一步地,所述四个阶段编码模块中,第一阶段和第二阶段编码模块包含两个卷积层,第三阶段、第四阶段和第五阶段编码模块包含三个卷积层。
[0011]进一步地,所述解码器包含四个阶段解码模块,对编码后的特征图进行上采样、拼接、卷积和激活操作;其中第一、二、三阶段解码模块进行两次卷积,第四阶段解码模块进行三次卷积。
[0012]进一步地,所述第一阶段解码模块中将第一阶段上采样后的特征图与所述卷积注意力模块输出的特征图进行拼接;第二阶段解码模块中将第二阶段上采样后的特征图与所
述第三阶段编码模块输出的特征图进行拼接;第三阶段解码模块中将第三阶段上采样后的特征图与所述二阶段编码模块输出的特征图进行拼接;第四阶段解码模块中为第四阶段上采样后的特征图与所述一阶段编码模块输出的特征图进行拼接。
[0013]本专利技术所述的一种水下图像语义分割方法,包括如下步骤:
[0014](1)对水下图像进行预处理;
[0015](2)将预处理后的图像输入语义分割模型;所述语义分割模型使用UNet网络,在所述语义分割模型的编码器中包含卷积注意力模块,卷积注意力模块包含通道注意力子模块和空间注意力子模块,通道注意力子模块对通道设置不同的权重,空间注意力子模块对空间信息设置不同的权重;所述编码器按照权重进行特征提取;
[0016](3)采用预处理的数据集对所述语义分割模型进行训练;
[0017](4)将待分割的水下图像输入训练好的语义分割模型,输出分割后的图像。
[0018]有益效果:本专利技术与现有技术相比的优点在于:分割精度高,尤其是边缘分割效果好;第四阶段卷积之后的输出进行卷积注意力加权,使用卷积注意力来对输入图像的不同的通道分配不同的权重,使分割效果更加精确,对于对比度较小的物体之间也能准确分割;在编码时增加卷积层以提取更多特征,在对低层特征和高层特征进行拼接时使用全部的低层特征,能够保留更多有用特征,无需对特征图进行裁剪。
附图说明
[0019]图1为本专利技术的水下图像语义分割模型结构图;
[0020]图2为本专利技术的卷积注意力模块结构图;
[0021]图3为本专利技术的通道注意力子模块结构图;
[0022]图4为本专利技术的空间注意力子模块结构图;
[0023]图5为本专利技术的水下图像语义分割方法流程图。
具体实施方式
[0024]下面结合附图对本专利技术的技术方案作进一步说明。
[0025]如图1所示,所述水下图像语义分割模型,包括预处理模块、编码器和解码器,编码器中包含卷积注意力模块;编码器用于提取输入图像的特征,减小特征图大小;把低维特征转换为高维特征,解码器用于逐步恢复出图像的细节信息和空间维度。所述模型的建立方法,包括如下步骤:
[0026](1)预处理模块
[0027]预处理模块对输入图像I进行预处理,即将图像转化为RGB三通道;然后将图像大小调整为512
×
512得到Ir。
[0028](2)编码器
[0029](2.1)第一阶段编码模块
[0030]对图像Ir进行两次卷积和激活操作,第一层的卷积核大小为3
×
3,步长为(1,1),填充为(1,1),输入通道数为3,输出通道数为64;第二层的卷积核大小为3
×
3,步长为(1,1),填充为(1,1),输入通道数为64,输出通道数为64;激活函数为ReLU函数。进行卷积、激活、卷积、激活之后得到特征图E2,具体实施过程如下:
[0031]E1=ReLU(conv(Ir))
[0032]E2=ReLU(conv(E0))
[0033]其中,E1,E2为表示卷积图像经过两次卷积分别产生的特征图。
[0034]将特征图E2进行池化操作,池化采用二维的最大池化,池化核的大小为2,步长为2,具体实施过程如下:
[0035]E3=MaxPool2d(E2)
[0036]其中E3为E2池化之后得到的特征图。
[0037](2.2)第二阶段编码模块
[0038]将特征图E3作为输入再次进行编码,对图像进行两次卷积和激活操作,第一层的卷积核大小为3
×
3,步长为(1,1),填充为(1,1),输入通道数为64,输出通道数为128;第二层的卷积核大小为3
×
3,步长为(1,1),填充为(1,1),输入通道数为128,输出通道数为128,激活函数为ReLU函数,进行卷积、激活、卷积、激活之后得到特征图E5,具体实施过程如下:
[0039]E4=ReLU(conv(E3))
[0040]E5=ReLU(conv(E4))
[0041]其中,E4,E5为表示卷积图像经过两次卷积分别产生的特征图。
[0042]将特征图E5进行池化操作,池化采用二维的最大池本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种水下图像语义分割模型,其特征在于,包括:预处理模块,用于对水下图像进行预处理得到输入图像;编码器,包括五个阶段编码模块,第四阶段编码模块包含卷积注意力模块,所述卷积注意力模块中的通道注意力子模块对通道设置不同的权重,所述卷积注意力模块中的空间注意力子模块对空间信息设置不同的权重;所述编码器用于按权重进行特征提取;解码器,用于恢复输入图像的细节信息和空间位置信息,得到分割之后的图像。2.根据权利要求1所述的水下图像语义分割模型,其特征在于,在编码器中,所述第四阶段编码模块输出的特征图经过通道注意力子模块,分别进行平均池化和最大池化后再进行相加和激活操作,得到特征图E17;所述特征图E17经过空间注意力子模块,沿通道分别对维度计算均值和最大值后再进行相加、卷积和激活操作。3.根据权利要求1所述的水下图像语义分割模型,其特征在于,所述四个阶段编码模块中,第一阶段和第二阶段编码模块包含两个卷积层,第三阶段、第四阶段和第五阶段编码模块包含三个卷积层。4.根据权利要求1所述的水下图像语义分割模型,其特征在于,所述解码器包含四个阶段解码模块,对编码后的特征图进行上采样、拼接、卷积和激活操作;其中第一、二、三阶段解码模块进行两次卷积,第四阶段解码模块进行三次卷积。5.根据权利要求4所述的水下图像语义分割模型,其特征在于,所述第一阶段解码模块中将第一阶段上采样后的特征图与所述卷积注意力模块输...

【专利技术属性】
技术研发人员:苑永起田雨波罗俊孙颖鑫
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1