一种基于链式残差与注意力机制的自适应语义分割方法技术

技术编号：30530080 阅读：55 留言：0更新日期：2021-10-30 12:27

本发明专利技术公开了一种基于链式残差与注意力机制的自适应语义分割网络方法，该方法采用链式残差与注意力机制模块构建解码器网络进行训练。在数据预处理阶段，对原始图片进行数据增强，增强样本丰富性。在编码器模块，采用残差模块构成的特征网络处理训练数据，得到尺度不断减小的多层卷积特征。在解码器模块，采用链式残差网络模块使得网络具有多尺度的感受野，有效改善多类别语义分割中的尺度问题；采用通道注意力机制模块使得网络能够自适应地调整特征通道的权值，提高网络的特征判别和选择能力。在损失函数方面，引入focal loss损失函数加强网络对难分样本的学习，改善样本不均衡问题。本发明专利技术方法增强了复杂环境下语义分割算法的稳健性，提高了分割精度。提高了分割精度。提高了分割精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于链式残差与注意力机制的自适应语义分割方法

[0001]本专利技术涉及计算机视觉、模式识别、深度学习等领域，具体是一种对图像中每一个像素点进行分类从而实现不规则的目标检测以及场景理解的方法。

技术介绍

[0002]随着计算机技术的高速发展与人工智能时代的到来，基于图像和视频理解世界的计算机视觉技术正影响着我们每个人的生活，在自动驾驶、智能监控、虚拟现实等领域有着广泛的应用前景。语义分割作为计算机视觉领域中重要的一项课题，具有重要的研究意义和应用价值。然而，在图像中精确地分割不同种类的物体存在一些难点，比如：不同分割对象的尺度差异大，分割样本数量不均衡等。传统的分割算法由于分割精度问题不能很好地满足应用需要，而基于深度神经网络的分割算法较少对这些问题针对性地提出相应的解决方案。因此，研究设计一种针对性的自适应语义分割网络有着很实际的研究意义和应用价值。
[0003]近年来国内外学者在语义分割领域做了相应的研究和贡献，主要分为两类方法：1)基于传统方法的语义分割，2)基于深度神经网络的语义分割。基于传统方法的语义分割以自底而上(Bottom-up)的算法架构为代表，首先利用聚类、梯度或其他算法理论对原图像进行一次过分割，得到超像素区域，然后通过手工设计特征的方式提取超像素的区域特征，最后将特征送入预先训练的分类器中判断该区域的类别。但手工设计的特征通常表达能力不足，不能做到完全自适应分割，难以应对复杂任务或场景，且处理过程相较繁琐。近年来，随着计算机软硬件技术的高速发展，以深度卷积神经网络为理论基础的深度学...

【技术保护点】

【技术特征摘要】
1.一种基于链式残差与注意力机制的自适应语义分割网络方法，包括如下具体步骤：步骤1：图像数据预处理，采集相应的待分割图像，进行增强预处理构建语义分割数据集，划分训练集和测试集；步骤2:编码器设计,语义分割网络采用编码器+解码器架构，编码器主要由残差模块构成，用于处理输入数据得到尺度不断减小的多层卷积特征；步骤3：解码器设计；采用注意力机制模块和基于空洞卷积的链式残差模块构建解码器；步骤4：计算网络的损失函数，采用新的适用于语义分割的损失函数focal loss计算网络前向传播的损失；步骤5：网络训练，根据预设的优化学习方法和相应超参数，训练上述的语义分割网络；步骤6：输出分割结果。从测试集中选择测试图片，输入训练好的语义分割网络，生成分割结果。2.根据权利要求1所述基于链式残差与注意力机制的自适应语义分割网络方法，其特征在于，所述步骤1中数据预处理的方法主要有图片缩放、翻转、旋转、抖动、平移以及归一化等操作。3.根据权利要求1所述基于链式残差与注意力机制的自适应语义分割网络方法，其特征在于，步骤2所述的编码器采用SE-ResNet-50。4.根据权利要求1所述基于链式残差与注意力机制的自适应语义分割网络方法，其特征在于，所述步骤3中的注意力机制模块，对于给定...

【专利技术属性】
技术研发人员：吴子涵，周大可，张志伟，
申请(专利权)人：上海舜瞳科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人