一种基于注意力引导的多尺度信息融合的实时性语义分割方法技术

技术编号:43843796 阅读:31 留言:0更新日期:2024-12-31 18:38
本发明专利技术公开了一种注意力引导的多尺度信息融合的实时性语义分割方法,该方法包括如下步骤:一、构建多尺度特征聚合模块,聚合多尺度细节信息。二、构建注意力引导特征修正模块,修正不同分支提取的信息促使多尺度信息和局部信息的融合。三、构建注意力引导特征还原模块,融合网络中不同深度提取出的特征图并弥补特征传递过程中丢失的图像信息。四、基于三个模块搭建图像分割网络,高效提取图片中的重要特征,通过深度学习的方式对复杂场景图片进行精确分割。本发明专利技术基于基于编码器‑解码器架构设计了一种新型的实时场景语义分割模型,在模型精度和模型速度有着更好的权衡,在低参数低计算量成本的情况下,能够实现对图像物体精确的分割,同时具备实时性。

【技术实现步骤摘要】

本专利技术涉及场景分割与自动驾驶领域,具体而言,尤其涉及道路场景下的实时性语义分割方法。


技术介绍

1、语义分割模型将原始图像的每一像素点作为输入,在深层神经网络进行阶段性的局部或者全局的理解。接着将像素点分成多类,根据具体应用任务将输入图像中待分割事物加以定位和分配同一类语义标签。语义分割任务效果的提升对自动驾驶、场景监控和无人机等领域有着极大的帮助。例如适用于自动驾驶领域中,无人驾驶车辆行驶过程中对车辆行驶路线上车道线或者斑马线行人的检测保障车辆行驶的安全性。还有适用于无人机领域,语义分割可以帮助护林员对林区火灾进行区域检测和定位避免人员的伤亡。但是同时类似的虚拟现实等领域,对于语义分割模型判断的准确性和实时性有着极为重要的需求。其庞大运算成本和大参数带来的模型推理负荷需要研究人员在推理速度和分割性能中取得更好的的平衡。

2、为了平衡这种对性能和速度的需求,研究人员提出了许多采用优化卷积的策略来改进冗杂的网络模型。shufflenet结合了逐点组卷积和通道混洗,来实现一个高效轻量化的移动端网络设计。dabnet集结深度不对称卷积和扩张卷积的本文档来自技高网...

【技术保护点】

1.一种基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:包括以下步骤:

2.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

3.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

4.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

5.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

6.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

【技术特征摘要】

1.一种基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:包括以下步骤:

2.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

3.如权利要求1的基于注意力引导的多尺度信息融合的实时性语义分割方法,其特征在于:

【专利技术属性】
技术研发人员:张旭光缪德烃方银锋
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1