一种用于语义分割的层注意力机制制造技术

技术编号：38221602 阅读：10 留言：0更新日期：2023-07-25 17:53

本发明专利技术基于语义分割模型设计出一种层注意力机制，解决了语义分割中边缘分割不理想问题，优化了分割细节，提升了性能指标。本发明专利技术设计的层注意力机制使得模型训练过程中更关注有效信息，进而提高模型在拼接层时的效率。本发明专利技术设计出的层注意力机制，通过赋予待拼接层注意力值，使得模型在拼接过程中干预学习过程并修复边缘分割错误，能够有效提升语义分割任务中边缘分割不理想问题。本发明专利技术能够应用到自动驾驶、医学图像处理等领域中，分割效果优异。分割效果优异。分割效果优异。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于语义分割的层注意力机制

[0001]本专利技术属于计算机图像处理领域，具体涉及到一种用于语义分割的层注意力机制。

技术介绍

[0002]语义分割是计算机视觉中的一个重要的研究方向，其目的是对图像进行像素级别的识别，即对图像中的每个像素点进行类别的标注工作。语义分割的主要应用有以下几个方面：地理信息系统、自动驾驶、医学图像处理等。地理信息系统的应用主要是对采集到的卫星图像进行处理，将图像中的河流、建筑、草地等在像素级别进行标注并得到语义分割图；对于自动驾驶任务来说，语义分割能够使得智能汽车对道路环境状况进行感知，为后续智能汽车的行为决策提供支持保证；医学图像处理与神经网络的结合成为这几年的热点，主要应用于肿瘤图像、显微镜成像、超声图像等，相关技术也在不断提升中。
[0003]早期对语义分割问题的研究主要是基于机器学习的方法，这些方法主要将图像划分为多个小块，然后提取其中的特征信息进行训练，最终得到语义分割模型，不过基于机器学习的方法较为繁琐，需要人工设计特征且精度难以保证。而伴随着深度学习的热潮，将深度学习应用于语义分割任务依靠着其强大的表征能力逐渐成为主流。卷积神经网络是一种应用于图像处理领域的有效的深度学习方法，相比于人工提取特征，卷积、池化等操作能够与人类认知一样地自动学习图像的多层次特征，因此其在图像领域取得了极大的成功。Long等人提出了一种端到端的语义分割模型——全卷积网络，与传统卷积神经网络不同的是，在模型的末端使用反卷积操作将特征图恢复到和输入图像相同的尺寸，进而对图像的每个像素点进行预...

【技术保护点】

【技术特征摘要】
1.一种用于语义分割的层注意力机制，其特征在于包括以下步骤：1)搭建UNet3+基础模型；2)设计并构造层注意力机制，将其嵌入至UNet3+基础模型中；3)在CamVid及Cityscapes数据集上进行训练和测试，微调层注意力机制的结构。2.按照权利要求1所述的基于层注意力机制的语义分割系统，其特征在于：步骤1)中的UNet3+模型搭建由以下的方式确定：本发明首先用卷积层、池化层、上采样层等网络层依次搭建出编码器与解码器，其次以对应的多个模型浅层为起点，解码器中的各网络层为终点实现跳跃连接，完成UNet3+网络的搭建工作。3.按照权利要求1所述的一种用于语义分割的层注意力机制，其特征在于：步骤2)中设计层注意力机制提高模型进行层融合时的效率。为了统计各通道的全局信息，对待拼接特征图进行全局平均池化；为了增强非线性并提高模型的学习能力，使用两个全连接层对每个待拼接特征图拟合出各自的注意力值；为了探究各注意力值之间的相关性约束，将各注意力值拼接后使用Softmax函数进行激活，注意力值被约束至区间[0,1]内且总和为1，并且能够加速...

【专利技术属性】
技术研发人员：张婷，陈文欣，刘凯，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人