基于注意力机制指导特征融合的图像语义分割方法技术

技术编号：22056667 阅读：334 留言：0更新日期：2019-09-07 15:45

本发明专利技术公开一种基于注意力机制指导特征融合的图像语义分割方法，包括如下步骤：(10)编码器基础网络构建：使用改进后的ResNet‑101生成一系列由高分辨率低语义到低分辨率高语义变化的特征；(20)解码器特征融合模块构建：采用基于三层卷积操作的金字塔结构模块，提取强一致性约束的高层语义，再向低层阶段特征逐层加权融合，得到初步分割热图；(30)辅助损失函数构建：向解码阶段的每个融合输出追加辅助监督，再与热图上采样后的主监督损失叠加，强化模型的分层训练，得到语义分割图。本发明专利技术的基于注意力机制指导特征融合的图像语义分割方法，准确性高、边界轮廓清楚。

Image Semantic Segmentation Based on Attention Mechanism Guiding Feature Fusion

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力机制指导特征融合的图像语义分割方法
本专利技术属于静态图像识别
，特别是一种准确性高、边界轮廓清楚的基于注意力机制指导特征融合的图像语义分割方法。
技术介绍
语义分割即像素级别的图像理解，是计算机视觉领域的重要基石之一，有着非常广泛的应用场景。其通过细粒度分割的方式，赋予了机器将视觉画面的不同区域以像素级别剥离开来的能力。语义分割将图像中属于同一目标的像素区域划分到一起，从而扩展其应用领域。语义分割在进行像素级预测的同时将对象分类和目标定位两个问题结合在一起解决，如何在高层抽象的对象分类和低层精确的目标定位这两个相互约束的问题之间取得平衡是当前语义分割方法所要面对的核心问题。语义分割方法可以大致分为两类。第一种，通过人工提取特征生成图像中各个对象的语义，这种方法往往需要细致的特征工程手段，再输入分类器进行像素级别的分类。第二种是基于深度学习方法，通过构建端到端系统将特征提取与分类器合在一起从而直接为每个像素分配一个语义标签。大多数传统的方法都是依赖于手工提取特征并与分类器相结合的机器学习方法，如Shotton等人的Boost方法，Johnson等人的随机森林，Soatto等人的支持向量机。这些方法通过整合来自上下文和结构化预测技术的丰富信息取得了实质性的进步。然而，由于手工提取的特征表达能力受限的影响，基于传统机器学习方法的图像语义分割系统性能逐渐饱和，无法突破瓶颈，其在分割准确率性能上仍有很大的提升空间。近些年，深度学习革命让相关领域发生了翻天覆地的变化，包括语义分割在内的许多计算机视觉问题都开始使用深层架构来解决。基于深度卷积神经网络提...

【技术保护点】
1.一种基于注意力机制指导特征融合的图像语义分割方法，其特征在于，包括如下步骤：(10)编码器基础网络构建：使用改进后的ResNet‑101生成一系列由高分辨率低语义到低分辨率高语义变化的特征；(20)解码器特征融合模块构建：采用基于三层卷积操作的金字塔结构模块，提取强一致性约束的高层语义，再向低层阶段特征逐层加权融合，得到初步分割热图；(30)辅助损失函数构建：向解码阶段的每个融合输出追加辅助监督，再与热图上采样后的主监督损失叠加，强化模型的分层训练，得到语义分割图。

【技术特征摘要】
1.一种基于注意力机制指导特征融合的图像语义分割方法，其特征在于，包括如下步骤：(10)编码器基础网络构建：使用改进后的ResNet-101生成一系列由高分辨率低语义到低分辨率高语义变化的特征；(20)解码器特征融合模块构建：采用基于三层卷积操作的金字塔结构模块，提取强一致性约束的高层语义，再向低层阶段特征逐层加权融合，得到初步分割热图；(30)辅助损失函数构建：向解码阶段的每个融合输出追加辅助监督，再与热图上采样后的主监督损失叠加，强化模型的分层训练，得到语义分割图。2.根据权利要求1所述的图像语义分割方法，其特征在于，所述(10)编码器基础网络构建步骤包括：(11)构建块层数重部署：重新部署res-2到res-5阶段各自拥有的构建块数量，将原始...

【专利技术属性】
技术研发人员：龚声蓉，周鹏程，
申请(专利权)人：常熟理工学院，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人