一种单目图像深度估计方法和存储介质技术

技术编号:42956665 阅读:28 留言:0更新日期:2024-10-11 16:14
本发明专利技术公开了图像处理领域的一种单目图像深度估计方法和存储介质,方法包括:获取待估计的单目图像并预处理;将图像输入预先训练的初步深度估计网络和迭代优化网络,获得最终的单目图像深度估计结果;初步深度估计网络包括编码器、解码器和回归头,解码器包含解码层,解码层采用三元组交叉注意力TCA模块,TCA模块对图像的处理包括:WCA模块计算注意力,输出窗口注意力特征;CDA模块计算注意力,输出跨维度注意力特征;REA模块计算注意力,输出相关性注意力特征;FBSF模块融合WCA、CDA和REA模块的输出结果,生成本解码层的输出特征。能够兼顾局部、全局信息和信息间的相关性得到更准确的单目图像深度估计结果。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,特别是一种单目图像深度估计方法和存储介质


技术介绍

1、单目图像的深度估计是计算机视觉领域的基础性研究问题,该任务旨在基于单张图片信息,预测并恢复出场景像素级的深度信息。单目深度估计技术是三维重建、环境感知与理解等高阶视觉任务的关键支撑技术,具有广泛的应用需求。近年来,随着深度学习技术的迅速发展,单目深度估计也取得了长足的发展与进步。早期基于深度学习的单目深度估计模型通常基于卷积神经网络(cnn)。鉴于深度神经网络强大的特征提取与表示能力,相比于传统方法,基于cnn的方法取得了较好的深度估计结果。之后,大部分工作致力于设计越来越复杂和强大的网络来提升模型性能,然而,在没有额外信息引导的情况下,深度估计任务变得难以拟合。

2、近期,自然语言处理领域的transformer变得流行,研究者们将这种基于注意机制的网络结构引入计算机视觉领域,并取得了很好的效果。在单目深度估计领域,transformer架构近年来也展现出了出色的效果,通过自注意力捕捉特征长距离依赖关系,在取得优越性能的同时往往伴随较高的计算复杂度,联合窗口本文档来自技高网...

【技术保护点】

1.一种单目图像深度估计方法,其特征是,包括:

2.根据权利要求1所述的单目图像深度估计方法,其特征是,所述窗口注意力WCA模块对输入的编码特征和解码特征计算注意力包括:

3.根据权利要求1所述的单目图像深度估计方法,其特征是,所述初步深度估计网络还包括金字塔池化PPM模块,金字塔池化PPM模块接收每个所述编码层的输出特征,融合处理得到输入第一个解码层的所述解码特征。

4.根据权利要求1所述的单目图像深度估计方法,其特征是,所述跨维度注意力CDA模块包括全局向量生成器GVG,所述全局向量生成器GVG用于接收所述解码特征处理生成全局感知向量,过程为:...

【技术特征摘要】

1.一种单目图像深度估计方法,其特征是,包括:

2.根据权利要求1所述的单目图像深度估计方法,其特征是,所述窗口注意力wca模块对输入的编码特征和解码特征计算注意力包括:

3.根据权利要求1所述的单目图像深度估计方法,其特征是,所述初步深度估计网络还包括金字塔池化ppm模块,金字塔池化ppm模块接收每个所述编码层的输出特征,融合处理得到输入第一个解码层的所述解码特征。

4.根据权利要求1所述的单目图像深度估计方法,其特征是,所述跨维度注意力cda模块包括全局向量生成器gvg,所述全局向量生成器gvg用于接收所述解码特征处理生成全局感知向量,过程为:

5.根据权利要求4所述的单目图像深度估计方法,其特征是,所述跨维度注意力cda模块用于对输入的所述解码特征和所述窗口注意力特征计算注意力包括:

6.根据权利要求1所述的单目图像深度估计方法,其特征是,所述相关性注意...

【专利技术属性】
技术研发人员:王智彬李军侠孙玉宝
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1