一种融合CNN与Transformer改进的轻量化单目深度估计方法技术

技术编号:40675705 阅读:73 留言:0更新日期:2024-03-18 19:13
本发明专利技术提供一种融合CNN与Transformer改进的轻量化单目深度估计方法,所述方法包括以下步骤:第一步,采集连续帧单目相机数据作为网络的输入,进行图像卷积下采样及池化模块预处理;第二步,通过空洞卷积残差模块实现多尺度局部特征提取;第三步,结合改进的Transformer模块实现局部‑全局上下文信息交互;第四步,通过跳跃链接将编码器与解码器相连,并在解码器部分利用单层卷积融合特征;第五步,通过预测头输出不同分辨率的深度图像。本发明专利技术实现了一种轻量化实时的单目深度估计方法。

【技术实现步骤摘要】

本专利技术属于深度估计领域,具体是一种基于卷积神经网络(convolutionalneural network,cnn)融合transformer的轻量化单目深估计方法。


技术介绍

1、随着人工智能技术快速发展,诸如机器人、无人机以及无人驾驶汽车等这类产品已经广泛应用到人类生活中。这些应用需要利用场景深度信息为基础对场景进行感知,因此精确的深度预测至关重要。深度估计作为自主系统感知环境和估计其自身状态的核心技术,为视觉里程计、自动驾驶、机器人定位和视觉感知等研究提供最基本的深度信息,在各种机器人系统和应用中起到了关键作用。现有的深度传感器如rgb-d相机、激光雷达和结构光传感器等可以提供准确的深度信息,但这些传感器硬件成本较高,体积较大且具有高功耗。相比之下,使用单个rgb图像估计深度图的单目深度估计是一种廉价且易于部署的方法,没有过高的硬件要求,仅通过图像就能够获取深度信息,因此基于单张图像恢复深度的方法得到了广泛的研究。

2、早期研究人员使用诸如图像消隐点、对焦与离焦、阴影等深度线索从单目图像中获取深度信息,但这类方法通常对图像有特殊要求并本文档来自技高网...

【技术保护点】

1.一种融合CNN与Transformer改进的轻量化单目深度估计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种融合CNN与Transformer改进的轻量化单目深度估计方法,其特征在于,步骤2所述的构建单目深度估计网络编码层CNN部分,利用深度可分离卷积实现空洞卷积残差模块提取图像多尺度局部信息;

3.根据权利要求1所述的一种融合CNN与Transformer改进的轻量化单目深度估计方法,其特征在于,步骤3所述的基于步骤2得到的CNN网络,结合Transformer实现全局-局部上下文交互,利用多深度可分离卷积头转置注意力模块降低Transfor...

【技术特征摘要】

1.一种融合cnn与transformer改进的轻量化单目深度估计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种融合cnn与transformer改进的轻量化单目深度估计方法,其特征在于,步骤2所述的构建单目深度估计网络编码层cnn部分,利用深度可分离卷积实现空洞卷积残差模块提取图像多尺度局部信息;

3.根据权利要求1所述的一种融合cnn与transformer改进的轻量化单目深度估计方法,其特征在于,步...

【专利技术属性】
技术研发人员:隋心张聪王长强史政旭郭哲邹鑫慈白建洲
申请(专利权)人:辽宁工程技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1