一种由RGB图像引导的多尺度级联沙漏深度图补全方法技术

技术编号:41116014 阅读:24 留言:0更新日期:2024-04-25 14:06
本发明专利技术公开了一种由RGB图像引导的多尺度级联沙漏深度图补全方法,包括:S1、获取待补全的稀疏深度图像以及相应的RGB彩色引导图像,对所述稀疏深度图像和RGB彩色引导图像进行通道维度的预处理并串联,从而获取待处理的RGB_D图像;S2、将所述待处理的RGB_D图像输入训练后的深度图补全网络模型,所述深度图补全网络模型包括早期融合编码器、稀疏深度图指导模块、多尺度沙漏补全模块以及优化增强模块;S3、获取所述优化增强模块的输出作为补全的密集深度图。本发明专利技术对稀疏深度图和RGB图片进行预处理,并利用了不同尺度的深度图作为深度指导信息,同时利用多尺度级联沙漏结构提高了深度图补全的细节。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,具体来说,涉及一种由rgb图像引导的多尺度级联沙漏深度图补全方法。


技术介绍

1、深度图补全任务皆在对获得的残缺深度图进行补全,旨在通过使用深度学习模型来推断和填补缺失的深度信息,从而获得尽可能完整精确的场景深度信息。深度图在各种任务中发挥着重要作用,如场景理解、自动驾驶、机器人导航、同时定位和建图、智能农业和增强现实等。因此,获取正确的像素级场景深度,是未来研究的一个长期目标。

2、近年来,得益于卷积神经网络(cnn)在多尺度提取深层语义和浅层细节信息的能力,深度图补全任务得到快速发展。深度图补全通常基于卷积神经网络(cnn)。首先,通过训练大量的深度图数据,这些网络能够学习到深度图的特征和结构。然后,在实际应用中,当存在缺失的深度信息时,这些网络可以根据已有的深度信息和其他可用的图像特征来预测缺失区域的深度值。基于cnn,新机制的开发也促进了深度图补全任务的发展,其中注意力机制是一种重要的技术,它模拟了人类在处理信息时的注意力分配过程。通过注意力机制,模型可以选择性地关注输入数据的不同部分,从而更加准确地进行学习和本文档来自技高网...

【技术保护点】

1.一种由RGB图像引导的多尺度级联沙漏深度图补全方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种由RGB图像引导的多尺度级联沙漏深度图补全方法,其特征在于,对所述稀疏深度图像和RGB彩色图像进行通道维度的预处理并串联,包括:

3.根据权利要求1所述的一种由RGB图像引导的多尺度级联沙漏深度图补全方法,其特征在于,所述早期融合编码器包括:

4.根据权利要求1所述的一种由RGB图像引导的多尺度级联沙漏深度图补全方法,其特征在于,所述多尺度沙漏补全模块包括:

5.根据权利要求4所述的一种由RGB图像引导的多尺度级联沙漏深度图补全方...

【技术特征摘要】

1.一种由rgb图像引导的多尺度级联沙漏深度图补全方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种由rgb图像引导的多尺度级联沙漏深度图补全方法,其特征在于,对所述稀疏深度图像和rgb彩色图像进行通道维度的预处理并串联,包括:

3.根据权利要求1所述的一种由rgb图像引导的多尺度级联沙漏深度图补全方法,其特征在于,所述早期融合编码器包括:

4.根据权利要求1所述的一种由rgb图像引导的多尺度级联沙漏深度图补全方法,其特征在于,所...

【专利技术属性】
技术研发人员:米泽田刘铸萱陈佳欣赵鹏于洋杜凤鸣
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1