一种基于多分类器的图像语义分割方法技术

技术编号：36811133 阅读：12 留言：0更新日期：2023-03-09 00:45

一种基于多分类器的图像语义分割方法，包括：S100：分别设计三个不同的分类器；在第一个分类器中，输入图像经过主干网络提取语义特征，然后输入到基于坐标注意力的空洞空间金字塔池化C

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多分类器的图像语义分割方法

[0001]本公开属于计算机视觉、图像处理
，特别涉及一种基于多分类器的图像语义分割方法。

技术介绍

[0002]语义分割是根据标签对图像中的每个像素进行分类，可以分辨出图像中的不同物体，描绘出不同个体和背景之间的轮廓，同时对同一类的物体给予相同的颜色表示。作为计算机视觉领域中的热点问题，图像语义分割在自动驾驶、视频会议、医学影像诊断等实际场景中有着广泛的作用。
[0003]传统图像分割技术如基于阈值、边缘的分割方法难以获得良好的分割效果，在分割精度上无法满足实际应用的要求。近年来，随着深度学习的发展，卷积神经网络显示出强大的特征提取和对象表示能力，一系列经典网络模型如AlexNet、VGG、GoogLeNet相继出现，使得基于卷积神经网络的图像分割模型取得了较好的分割性能。FCN作为卷积神经网络应用于图像语义分割的开山之作，实现了端到端的方式进行训练，并在各种基准数据集上取得了不错的性能，其核心思想是用卷积层替换全连接层，并通过跳跃连接应用中间层的语义信息来改善最终的预测结果。由于FCN的分割结果相对粗糙，为了细化输出，在网络输出上使用结构化预测模块并利用概率图模型，如条件随机场(CRF)、马尔可夫随机场(MRF)。SegNet利用索引记录池化操作时丢失的空间位置信息，以便在上采样时恢复相应的像素信息。为了得到更加多样化的特征，PSPNet构建了金字塔池化模块聚合不同区域的上下文信息。Deeplabv2提出空洞空间金字塔池化(ASPP)模块，并行不同速率的空洞卷积捕...

【技术保护点】

【技术特征摘要】
1.一种基于多分类器的图像语义分割方法，包括如下步骤：S100：分别设计三个不同的分类器；在第一个分类器中，输入图像经过主干网络提取语义特征，然后输入到基于坐标注意力的空洞空间金字塔池化C
‑
ASPP模块捕获不同感受野的语义信息；在第二个分类器中，输入图像经过主干网络和空洞空间金字塔池化ASPP模块获得语义特征，然后采用基于特征融合的解码器，将浅层特征和深层特征分别赋予权重并进行融合；在第三个分类器中引入新的损失函数监督细节信息；S200：通过集成学习的方法对上述三个不同的分类器进行融合，产生最终的分割结果。2.根据权利要求1所述的方法，其中，优选的，所述基于坐标注意力的空洞空间金字塔池化C
‑
ASPP模块是在空洞空间金字塔池化ASPP的基础上新构建了一个分支路径，使用注意力机制增强全局语义特征，并将该分支路径的输出与ASPP的输出相融合。3.根据权利要求2所述的方法，其中，所述注意力机制为轻量级坐标注意力。4.根据权利要求3所述的方法，其中，所述坐标注意力机制通过将二维全局集合操作分解成两个一维编码增强特征表示。5.根据权利要求2所述的方法，其中，所述将该分支路径的输出与ASPP的输出相融合的具体步骤如下：S1011：将主干网络的输出通过ASPP后获得多尺度特征图其中，R表示实数集，C1、H1、W1分别表示多尺度特征图0的通道数、高、宽；S1012：同时将主干网络的输出信息通过3
×
3卷积降低通道数，然后经过坐标注意力机制得到特征图其中，R表示实数集，C1、H1、W1分别表示特征图P的通道数、高、宽；S1013：将所述特征图P和所述特征图0输入公式Q＝O*(1
‑
...

【专利技术属性】
技术研发人员：马素刚，赵子一，杨小宝，蒲磊，侯志强，
申请(专利权)人：西安邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人