【技术实现步骤摘要】
本专利技术涉及图像深度估计,尤其涉及一种基于多尺度注意力的双流单目深度估计方法。
技术介绍
1、单目深度估计是计算机视觉领域的一项关键任务,核心思想是从单个图像中提取深度信息。该技术可以扩展到三维重建、导航和目标检测等下游任务,并在场景理解、自动驾驶、深度感知和机器人等不同领域实现了广泛的应用。传统的深度估计系统通常依赖于人工特征的提取或挖掘结构信息。例如,某些研究利用光学几何约束从运动中恢复结构或将它们与立体图像相匹配。然而,这些方法过度依赖专家的先验知识,计算复杂度高,且在低纹理场景中性能差。近年来,卷积神经网络逐渐应用于计算机视觉领域中,因此研究者开始尝试使用卷积神经网络映射真实场景与深度图像之间的非线性关系,并通过最小化误差来训练神经网络,最终达到仅在系统中输入图像即可获得对应深度图的目的。但是,这些技术大多忽略了小尺度物体和垂直方向信息,使得提取的特征容易受到边缘模糊问题的影响
技术实现思路
1、根据现有技术存在的问题,本专利技术公开了一种基于多尺度注意力的双流单目深度估计方法,
<本文档来自技高网...【技术保护点】
1.一种基于多尺度注意力的双流单目深度估计方法,其特征在于包括:
2.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流单目深度估计网络的损失函数采用如下方式表示:
3.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流编码器包括两个权重共享的聚合残差变换的深度网络分支,将两个深度网络分支分别输入不同大小的原始单目图像,从而提取两种不同尺度的特征。
4.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述多尺度注意力特征融合单元包括自注意
...【技术特征摘要】
1.一种基于多尺度注意力的双流单目深度估计方法,其特征在于包括:
2.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流单目深度估计网络的损失函数采用如下方式表示:
3.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述双流编码器包括两个权重共享的聚合残差变换的深度网络分支,将两个深度网络分支分别输入不同大小的原始单目图像,从而提取两种不同尺度的特征。
4.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述多尺度注意力特征融合单元包括自注意力空洞卷积模块和注意力特征融合模块,其中自注意力空洞卷积模块是由自注意力机制和空洞率大小r=3,6,12,18的空洞卷积层构建、用于提取多尺度特征;注意力特征融合模块利用两种池化操作来融合多尺度信息。
5.根据权利要求1所述的一种基于多尺度注意力的双流单目深度估计方法,其特征在于:所述引导式解码器包括多个引导恢复单元,其中每个引导恢复单元包括上采样层、通道注意力机制及特征细...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。