基于多尺度多特征融合自注意力网络的道路场景语义分割方法和系统技术方案

技术编号：40089442 阅读：22 留言：0更新日期：2024-01-23 15:58

本发明专利技术公开一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法和系统，该方法包括：构建多尺度多特征融合自注意力网络，该网络包括多尺度空间金字塔池化模块和自注意力模块；所述多尺度空间金字塔池化模块包括多层编码层和空间金字塔池化层，所述编码层包括多个卷积层；基于道路场景图像数据集对构建的多尺度多特征融合自注意力网络进行训练；基于训练好的多尺度多特征融合自注意力网络对道路场景图像进行语义分割。本发明专利技术基于自注意力机制捕获多尺度上下文信息及临域位置信息，使得整体网络学习更丰富的图像信息，利用多尺度空间金字塔池化模块无视特征大小特点，聚合多维特征，锁定更多空间信息，提高网络识别精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及道路场景语义分割，尤其涉及一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法和系统。

技术介绍

1、计算机视觉领域，道路场景语义分割一直是一个备受关注的研究方向，随着自动驾驶、智能交通等技术的发展，道路场景语义分割的需求也越来越迫切。同时，人工标注难，标注成本高等问题难以突破，可使用高质量数据集较少，因此基于小样本语义分割也逐渐成为热点研究内容。以往的语义分割通常使用卷积神经网络(cnn)来实现，然而这些网络需要大量的标注数据注入训练，同时随着网络层数加深，会导致卷积和池化操作存在一定程度的信息损失，尤其对小目标物体识别困难。样本不平衡也会对神经网络带来较大的问题，卷积神经网络往往对数量较多的类别表现更好性能，对数量较少的类别表现较差。这些情况极大影响了语义分割技术在实际道路环境中的使用。所以，如何基于少量标注数据训练准确且具备鲁棒性的语义分割模型，是当前图像语义分割待解决的关键之一。

2、传统语义分割任务主要利用图像的原始像素特征进行分类，这些像素特征包括亮度、纹理、颜色等。随着卷积神经网络(cnn)...

【技术保护点】

1.一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，包括：

2.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，所述多尺度空间金字塔池化模块中，每层编码层的采样结果同步输入到空间金字塔池化层中，不同尺寸不同维度的特征经空间金字塔池化操作整合到全连接层并输出到唯一维度。

3.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，所述多尺度空间金字塔池化模块中：

4.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，所述自...

【技术特征摘要】

1.一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，包括：

3.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，所述多尺度空间金字塔池化模块中：

4.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法，其特征在于，所述自注意力模块采用vision transformer自注意力机制。

...

【专利技术属性】
技术研发人员：左方，罗振兴，白天水，
申请(专利权)人：河南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人