一种基于编解码器技术的城市道路语义分割方法及系统技术方案

技术编号:39593997 阅读:7 留言:0更新日期:2023-12-03 19:49
本公开提供了一种基于编解码器技术的城市道路语义分割方法及系统,引入了深度空间分割网络,深度空间分割网络综合了编解码器和双路径的优势,并设计了新的结构,同时通过改进池化层增强了语义信息提取模块

【技术实现步骤摘要】
一种基于编解码器技术的城市道路语义分割方法及系统


[0001]本公开属于图像处理
,尤其涉及一种基于编解码器技术的城市道路语义分割方法及系统


技术介绍

[0002]本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术

[0003]语义分割是计算机视觉的基石技术之一

它从单个像素点开始,研究图像中每个像素所包含的语义信息,并通过这些信息标识图像中的物体

语义分割在自动驾驶

遥感卫星图像处理

精准农业等应用领域发挥着重要作用

[0004]具体而言,语义分割是将图像上的每个目标类别的像素点按照其语义进行标签化,以实现不同类别在图像上的分离

它也可以看作是像素级别的图像分类任务

语义分割主要使用卷积神经网络来实现

然而,卷积网络存在一个难题,即难以捕捉长距离依赖

为了解决这个问题,需要增加卷积层

扩大感受野

然而,这样做会增加网络模型的大小

参数量和复杂度,并降低网络模型的推断速度

在自动驾驶等语义分割下游任务中,实时性是一个关键需求

[0005]因此,在语义分割网络模型的研究中,需要平衡网络模型的大小和推断速度与性能和准确度之间的关系

甚至可以将推断速度放在首要位置来考虑<br/>。
这对实时语义分割的研究提出了新的要求,即如何设计更小

参数更少

速度更快的网络模型,同时又能保持良好的性能

这一研究方向引起了广泛关注

[0006]实时语义分割领域经过多年的发展,现阶段的网络往往采用两种结构来搭建:编解码器结构和双路径结构

编解码器结构由编码器和解码器构成,编解码器结构是一种单路径的结构,而双路径由语义路径和空间路径,通过整合两个路径的信息提升网络的精度

编解码器结构往往有着更快的推理速度,而双路径结构则因为结合了语义和空间的信息,所以有着更高的精度

[0007]目前的网络架构在对速度和精度的调整

提取语义信息的优化的问题上存在着以下技术问题

[0008](1)
在现有的两种实时语义分割架构中,模型的速度和精度往往不匹配,精度高的模型往往会因为过于复杂而降低了推理速度,而推理速度高的模型又因为结构简单而降低了模型的推理精度

现有的网络架构对与精度和速度的取舍问题还有优化的空间,这个问题需要解决
。(2)
在语义信息提取上,已有的网络结构设计了一些增强模块,但这些增强模块的性能并不能满足模型的要求,该问题需要解决


技术实现思路

[0009]为克服上述现有技术的不足,本公开提供了一种基于编解码器技术的城市道路语义分割方法及系统,引入了深度空间分割网络
DSSN

DSSN
网络在实时语义分割领域具有显
著的技术优势,能够在保持检测精度的同时提高检测速度,同时参数量大幅减少,这使得该网络成为实时语义分割任务中的一种有力解决方案

[0010]为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:
[0011]第一方面,公开了一种基于编解码器技术的城市道路语义分割方法,包括:
[0012]获取道路图像数据作为原始数据,并对原始数据进行预处理,将处理后的道路图像数据输入预先训练好的深度空间分割网络;所述深度空间分割网络包括编码器模块

语义信息提取模块

解码器模块和决策模块;
[0013]基于编码器模块提取图像的空间信息和语义信息后得到图像特征图,将图像特征图输入至语义信息提取模块进行语义信息提取优化;
[0014]基于解码器模块将图像特征图与增强优化后的图像特征图融合,输入至决策模块得到图像的分类类别

[0015]进一步的,所述编码器模块具体由残差网络的残差块和卷积神经网络的重参数化卷积块组成

[0016]进一步的,基于编码器模块提取图像的空间信息和语义信息后得到图像特征图具体为:
[0017]利用所述残差块提取图像的空间信息,利用重参数化卷积块采用快速下采样提取图像的语义信息

[0018]进一步的,所述语义信息提取模块具体为双重非对称金字塔池化模块,将非对称池化层和非对称卷积层结合,一重为非对称池化层,一重为非对称卷积层,并使用双向注意力提取信息细节

[0019]进一步的,将图像特征图输入至语义信息提取模块进行语义信息提取优化具体为:
[0020]第三图像特征图输入至语义信息提取模块,所述第三图像特征图经非对称池化层

非对称卷积层分别多次提取特征,经连接操作合并为图像特征图,与另一卷积层提取的图像特征图共同输入至双向注意力模块并输出

[0021]进一步的,所述解码器模块包括第一解码器和第二解码器

[0022]进一步的,基于解码器模块将图像特征图与增强优化后的图像特征图融合,输入至决策模块得到图像的分类类别具体为:
[0023]第一解码器接收语义信息提取模块输出的图像特征图和第二图像特征图,将两种图像特征图进行融合并使用卷积强化特征;
[0024]第二解码器接收第一解码器输出的融合特征图,并将其与第一图像特征图融合,输出融合特征图;
[0025]将第二解码器输出的融合特征图输入至决策模块得到图像的分类类别

[0026]第二方面,公开了一种基于编解码器技术的城市道路语义分割系统,包括:
[0027]获取模块:获取道路图像数据作为原始数据,并对原始数据进行预处理,将处理后的道路图像数据输入预先训练好的深度空间分割网络;所述深度空间分割网络包括编码器模块

语义信息提取模块

解码器模块和决策模块;
[0028]编码模块:基于编码器模块提取图像的空间信息和语义信息后得到图像特征图,将图像特征图输入至语义信息提取模块进行语义信息提取优化;
[0029]解码模块:基于解码器模块将图像特征图与增强优化后的图像特征图融合,输入至决策模块得到图像的分类类别

[0030]以上一个或多个技术方案存在以下有益效果:
[0031]本专利技术引入了深度空间分割网络
(DeepSpaceSegmentationNetworks

DSSN)。DSSN
综合了编解码器和双路径的优势,并设计了新的结构,同时通过改进池化层增强了语义信息提取模块...

【技术保护点】

【技术特征摘要】
1.
一种基于编解码器技术的城市道路语义分割方法,其特征是,包括:获取道路图像数据作为原始数据,并对原始数据进行预处理,将处理后的道路图像数据输入预先训练好的深度空间分割网络;所述深度空间分割网络包括编码器模块

语义信息提取模块

解码器模块和决策模块;基于编码器模块提取图像的空间信息和语义信息后得到图像特征图,将图像特征图输入至语义信息提取模块进行语义信息提取优化;基于解码器模块将图像特征图与增强优化后的图像特征图融合,输入至决策模块得到图像的分类类别
。2.
如权利要求1所述的一种基于编解码器技术的城市道路语义分割方法,其特征是,所述编码器模块具体由残差网络的残差块和卷积神经网络的重参数化卷积块组成
。3.
如权利要求2所述的一种基于编解码器技术的城市道路语义分割方法,其特征是,基于编码器模块提取图像的空间信息和语义信息后得到图像特征图具体为:利用所述残差块提取图像的空间信息,利用重参数化卷积块采用快速下采样提取图像的语义信息
。4.
如权利要求1所述的一种基于编解码器技术的城市道路语义分割方法,其特征是,所述语义信息提取模块具体为双重非对称金字塔池化模块,将非对称池化层和非对称卷积层结合,一重为非对称池化层,一重为非对称卷积层,并使用双向注意力提取信息细节
。5.
如权利要求4所述的一种基于编解码器技术的城市道路语义分割方法,其特征是,将图像特征图输入至语义信息提取模块进行语义信息提取优化具体为:第三图像特征图输入至语义信息提取模块,所述第三图像特征图经非对称池化层

非对称卷积层分别多次提取特征,经连接操作合并为图像特征图,与另一卷积层提取的图像特征图共同输入至双向注意力模块并输出

【专利技术属性】
技术研发人员:鲁芹王亚伦
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1