一种基于多尺度注意力的双流单目深度估计方法技术

技术编号:42050761 阅读:28 留言:0更新日期:2024-07-16 23:31
本发明专利技术公开了一种基于多尺度注意力的双流单目深度估计方法,包括:获取原始单目图及该原始单目图对应的真实深度图像,基于原始单目图和真实深度图像建立训练集和测试集,构造基于多尺度注意力的双流单目深度估计网络,所述双流单目深度估计网络包括双流编码器、多尺度注意力特征融合单元、引导式解码器和垂直注意力单元;构建双流单目深度估计网络的损失函数,在划分好的训练集上训练双流单目深度估计网络,利用反向传播算法传递该网络的梯度值,反复迭代该网络参数、控制预测深度逼近真实深度从而获得最佳权重,完成该双流单目深度估计网络的训练过程;将测试集中的图像输入至加载最佳权重的双流单目深度网络中,获得RGB单目图对应的深度图。

【技术实现步骤摘要】

本专利技术涉及图像深度估计,尤其涉及一种基于多尺度注意力的双流单目深度估计方法


技术介绍

1、单目深度估计是计算机视觉领域的一项关键任务,核心思想是从单个图像中提取深度信息。该技术可以扩展到三维重建、导航和目标检测等下游任务,并在场景理解、自动驾驶、深度感知和机器人等不同领域实现了广泛的应用。传统的深度估计系统通常依赖于人工特征的提取或挖掘结构信息。例如,某些研究利用光学几何约束从运动中恢复结构或将它们与立体图像相匹配。然而,这些方法过度依赖专家的先验知识,计算复杂度高,且在低纹理场景中性能差。近年来,卷积神经网络逐渐应用于计算机视觉领域中,因此研究者开始尝试使用卷积神经网络映射真实场景与深度图像之间的非线性关系,并通过最小化误差来训练神经网络,最终达到仅在系统中输入图像即可获得对应深度图的目的。但是,这些技术大多忽略了小尺度物体和垂直方向信息,使得提取的特征容易受到边缘模糊问题的影响


技术实现思路

1、根据现有技术存在的问题,本专利技术公开了一种基于多尺度注意力的双流单目深度估计方法,具体包括:

<本文档来自技高网...

【技术保护点】

1.一种基于多尺度注意力的双流单目深度估计方法,其特征在于包括:

2.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流单目深度估计网络的损失函数采用如下方式表示:

3.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流编码器包括两个权重共享的聚合残差变换的深度网络分支,将两个深度网络分支分别输入不同大小的原始单目图像,从而提取两种不同尺度的特征。

4.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述多尺度注意力特征融合单元包括自注意力空洞卷积模块和注意...

【技术特征摘要】

1.一种基于多尺度注意力的双流单目深度估计方法,其特征在于包括:

2.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流单目深度估计网络的损失函数采用如下方式表示:

3.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流编码器包括两个权重共享的聚合残差变换的深度网络分支,将两个深度网络分支分别输入不同大小的原始单目图像,从而提取两种不同尺度的特征。

4.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述多尺度注意力特征融合单元包括自注意力空洞卷积模块和注意力特征融合模块,其中自注意力空洞卷积模块是由自注意力机制和空洞率大小r=3,6,12,18的空洞卷积层构建、用于提取多尺度特征;注意力特征融合模块利用两种池化操作来融合多尺度信息。

5.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述引导式解码器包括多个引导恢复单元,其中每个引导恢复单元包括上采样层、通道注意力机制及特征细...

【专利技术属性】
技术研发人员:邹迎陈喆殷福亮
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1