一种基于双注意力和密集连接的城市道路语义分割方法技术

技术编号：35919679 阅读：15 留言：0更新日期：2022-12-10 11:03

本发明专利技术涉及图像分割技术领域，公开了一种基于双注意力和密集连接的城市道路语义分割方法包括以下步骤：构建城市道路语义分割数据集；构建深度卷积神经网络，所述深度卷积神经网络包括编码器模块、双注意力机制融合模块、密集连接并联池化模块、多尺度特征融合模块以及解码分支；利用所给的城市道路数据集对深度卷积神经网络进行训练，调整网络参数；将需要预测的图像输入进网络中获得语义分割结果。本发明专利技术能够较好的应对轻量级道路图像预测网络所需的预测速度与精度需求。所需的预测速度与精度需求。所需的预测速度与精度需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双注意力和密集连接的城市道路语义分割方法

[0001]本专利技术涉及图像分割
，尤其涉及一种基于双注意力和密集连接的城市道路语义分割方法。

技术介绍

[0002]道路场景的实时语义分割是图像处理的一个重要应用场景。通过车载摄像头拍摄的图像数据是由不同元素的不同像素组合在一起形成的，将这些像素按照元素分类的方法称为语义分割。基于深度学习的图像语义分割是近些年的研究热点，随着大量原本在图像分类、目标检测和自然语言处理等领域获得成功的深度学习方法被迁移到语义分割领域，图像语义分割得到了重大的突破，相对应适应各方向如自动驾驶、卫星遥感分割、农植物分割以及医学影像分割等多种具体应用方向上也得到了全面的发展。对于自动驾驶而言，面对道路场景的语义分割算法是实现自动驾驶的重要辅助手段，通过对车辆自身的摄像头返回的图像数据当中的行人、车辆以及建筑等与行车安全相关的目标进行精确到像素的分割，为自动驾驶汽车或机器智能提供切实的路况信息，从而保证行驶的安全性。然而在现实道路中，场景的复杂性、目标的多样性以及图像处理的实时性都极大要求了语义分割的效果。由此可见，如何提高道路场景语义分割的准确性和网络反应的快速性具有很重要的研究意义。
[0003]为了有效提升网络的分类准确性和快速性，相关研究人员从不同角度进行了大量的研究工作，并且取得了不错的效果。根据语义分割演变历程，在深度学习出来之前传统的语义分割算法主要根据图像的颜色、纹理、灰度、几何特征等信息将图像分割成不同的区域，但是这种方法实施过程比较繁琐、效率低且准确度不高...

【技术保护点】

【技术特征摘要】
1.一种基于双注意力和密集连接的城市道路语义分割方法，其特征在于，包括以下步骤：步骤1、构建城市道路语义分割数据集；步骤2、构建深度卷积神经网络，所述深度卷积神经网络包括编码器模块、双注意力机制融合模块、密集连接并联池化模块、多尺度特征融合模块以及解码分支；所述编码器模块用于对输入图像进行编码获得多种尺度特征信息，所述双注意力机制融合模块对特征图重点区域提高权重并抑制对无用信息的获取，所述密集连接并联池化模块用于扩大同等卷积核下感受野范围并增加信息复用效率，所述多尺度特征融合模块用于将编码器的部分特征图与密集连接空洞空间金字塔池化模块特征图相融合，所述解码分支用于将高维度特征图通过上采样恢复到原图尺寸得到语义分割预测图；步骤3、利用城市道路场景数据集对深度卷积神经网络进行训练修正相关网络参数；步骤4、将待分割道路场景图片输入进训练完成的深度卷积神经网络获得语义分割结果。2.根据权利要求1所述的一种基于双注意力和密集连接的城市道路语义分割方法，其特征在于，所述编码器模块结构为：移除MobileNetV3最后四层用于分类任务的卷积池化层；将MobileNetV3中连续的下采样瓶颈结构，根据所要产生的多尺度特征图重新划分为四个连续的瓶颈结构。3.根据权利要求2所述的一种基于双注意力和密集连接的城市道路语义分割方法，其特征在于，所述瓶颈结构的输出特征为：其中：k表示瓶颈结构中倒残差块的个数，x表示输入此环节的特征图，A
i
表示1
×
1的升维卷积，D
i
表示倒残差块中的3
×
3深度可分卷积，α表示注意力参数，E
i
表示空间注意力机制权重，B
i
表示1
×
1降维卷积，
⊕
表示加权操作。4.根据权利要求1或3所述的一种基于双注意力和密集连接的城市道路语义分割方法，其特征在于，所述双注意力机制融合模块的结构具体包括：对于输入特征图F分为三个特征分支，其中对于第一个特征分支进行通道注意力特征化具体为：对F分别进行平均池化与最大池化，然后经过同一个多层感知机获得两个输出特征F
avg_feature
和F
max_feature
，将这两个特征经过一个卷积得到通道特征图F
channel_feature
，最后将F
channel_feature
与F融合特征得到此特征分支的输出F
c
；对于第二个特征分支空间注意力特征化具体为：对F分别进行平均池化与最大池化，然后经过特征堆叠获得F
concat
，经过空间注意力卷积池化与标准化操作后得到空间特征图F
spatial_feature
，然后将F
spatial_feature
与F进行特征融合得到此特征分支的输出F
s
；对第三个特征分支特征细节保留，将输入F进行3
×
3卷积之后得到此特征分支的输出F
r
，最后将三个特征分支的输出F
c
，F
s
，F
r
进行堆叠作为双注意力机制融合结构的输出F
out
。5.根据权利要求4所述的一种基于双注意力和密集连接的城市道路语义分割方法，其特征在于，所述密集...

【专利技术属性】
技术研发人员：林勇，苏羿安，林学威，方贤宝，钟乐天，金钊，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人