一种基于金字塔分割注意力的深度估计方法及装置制造方法及图纸

技术编号:33653519 阅读:63 留言:0更新日期:2022-06-02 20:32
本发明专利技术公开了一种基于金字塔分割注意力的深度估计方法,包括如下步骤:获取图像进行预处理;基于预处理的图像数据通过深度估计网络进行深度估计运算;输出预测深度图。其中,对所述图像数据进行深度估计包括:将预处理的图像数据输入金字塔分割注意力模块;将预处理的图像数据进行下采样并自底向上依次输入到多层边界融合模块,将浅层的信息依次传入到深层,提取出边缘信息;基于编码器的输出数据通过深度相关模块进行运算,并通过解码器输出;将解码器的输出结果与金字塔分割注意力模块和多层边界融合模块的输出进行融合,输出预测深度图。能够丰富特征空间,且考虑了全局区域的信息能够得到上下文之间的相关性,提高深度估计的准确性。估计的准确性。估计的准确性。

【技术实现步骤摘要】
一种基于金字塔分割注意力的深度估计方法及装置


[0001]本专利技术属于计算机视觉、图像处理领域
,尤其涉及一种基于金字塔分割注意力的深度估计方法及装置。

技术介绍

[0002]SLAM技术(simultaneous localization and mapping,即时定位与地图构建)是移动机器人的关键技术。SLAM技术目前是计算机视觉领域的热门研究方向,主要应用于无人机、自动驾驶、机器人、三维重建等领域。单目SLAM系统因为成像在深度距离的测算上没有确定性,需要运动起来才能有前后帧的估算深度,这使得其定位的精度较低。同时,深度学习的方式不断应用于各行各业,如:人脸识别、只能驾驶、自然语言处理等领域,利用深度学习对内在数据相关性的强大学习能力的特点,常常可以发挥较好的效果,同样通过深度学习的建模优势可以对单目图像进行较为准确的深度估计。
[0003]近年来,随着CNN(Convolutional Neural Networks,卷积神经网络)在图像领域的成功应用,研究人员开始大量地尝试应用CNN来处理单目图像的深度估计问题,但是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于金字塔分割注意力的深度估计方法,其特征在于,包括以下步骤:获取图像进行预处理;基于预处理的图像数据通过深度估计网络进行深度估计运算;输出预测深度图。2.根据权利要求1所述的基于金字塔分割注意力的深度估计方法,其特征在于,对所述图像数据进行深度估计运算的方法包括:将预处理的图像数据输入金字塔分割注意力模块;将预处理的图像数据进行下采样,在下采样过程中自底向上依次输入到多层边界融合模块,将浅层的信息依次传入到深层,提取出丰富的边缘信息;基于编码器的输出数据通过深度相关模块进行运算,并通过解码器输出;将解码器的输出结果与所述金字塔分割注意力模块和多层边界融合模块的输出进行融合。3.根据权利要求2所述的基于金字塔分割注意力的深度估计方法,其特征在于,所述金字塔分割注意力模块对预处理的图像数据进行处理的方法包括:通过拆分和融合模块获取富含多尺度信息的特征图;将富含多尺度信息的特征图及解码器的输出结果、多层边界融合模块的输出进行融合。4.根据权利要求3所述的基于金字塔分割注意力的深度估计方法,其特征在于,获取富含多尺度信息的特征图的方法包括:获得通道上的多尺度特征图,输入特征图X按照通道维度被分成S组,每组按照群卷积的方法进行卷积;将拆分和融合模块的输出通过权重模块获得不同尺度特征图的通道注意力值;使用softmax算法重新校准通道注意向量来获得重新校准的多尺度通道权重;将像素级特征图与其对应重新校准的权重相乘以获取每个通道新的特征图,将每个通道的特征图进行拼接获取富含多尺度信息的特征图。5.根据权利要求4所述的基于金字塔分割注意力的深度估计方法,其特征在于,权重模块获得不同尺度特征图的通道注意...

【专利技术属性】
技术研发人员:李文举李梦颖苏攀
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1