一种融合RGB与深度特征的多模态视觉里程计制造技术

技术编号：43817512 阅读：25 留言：0更新日期：2024-12-27 13:30

本发明专利技术提出一种融合RGB与深度特征的多模态视觉里程计，包括：S1，通过分析相邻图像帧的深度特征和RGB特征，得到逆深度图；S2，通过计算每个像素的最小再投影损失，减少单目视频连续帧遮挡带来的负面影响，获得更为优秀的深度估计；S3，将RGB和深度信息这两种不同模态的信息利用信道融合，组成相对姿态输出；S4，结合双流网络，引入正则化优化网络模型，从而达到更好的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视觉slam领域，具体是涉及一种融合rgb与深度特征的多模态视觉里程计。

技术介绍

1、伴随着人工智能的迅猛发展，机器人产业也发展的如火如荼，在人们的生产、生活中扮演者日益重要的角色[1]。移动机器人，无人驾驶汽车等产品越来越多的出现人们视野中，想要实现自主运动就必需解决两个问题，“同时定位”和“建立地图”，也就是slam(simultaneous localization and mapping)。slam一般分为视觉slam和激光slam。相较于激光slam对于设备的昂贵需求，视觉slam的传感器为相机，成本则明显更小，更利于推广。

2、随着深度学习在计算机视觉领域的发展，越来越多的研究者将深度学习与传统视觉slam相结合，用深度学习的方法来代替传统视觉slam中的某一环节。深度学习和视觉里程计的结合是近年来的重点研究方向。视觉里程计的主要工作原理是通过两个图像连续帧之间的运动来估计相机位姿。在大量训练数据的支持下，深度学习和视觉里程计的结合，舍去了前端点跟踪、后端优化求解的一系列过程，直接输入图像给出位姿...

【技术保护点】

1.一种融合RGB与深度特征的多模态视觉里程计，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种融合RGB与深度特征的多模态视觉里程计，其特征在于，所述S1中利用到自监督单目深度估计网络得到逆深度图。然后通过计算每个像素的最小再投影损失，减少单目视频连续帧遮挡带来的负面影响，以此来获得更为优秀的深度估计。

3.根据权利要求1所述的一种融合RGB与深度特征的多模态视觉里程计，其特征在于，所述S2中通过计算每个像素的最小再投影损失，减少由单目视频连续帧遮挡带来的负面影响，以此来获得更为优秀的深度估计，相对姿态估计器θpose预测连续帧之间的相对姿态作为自我运动...

【技术特征摘要】

1.一种融合rgb与深度特征的多模态视觉里程计，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种融合rgb与深度特征的多模态视觉里程计，其特征在于，所述s1中利用到自监督单目深度估计网络得到逆深度图。然后通过计算每个像素的最小再投影损失，减少单目视频连续帧遮挡带来的负面影响，以此来获得更为优秀的深度估计。

3.根据权利要求1所述的一种融合rgb与深度特征的多模态视觉里程计，其特征在于，所述s2中通过计算每个像素的最小再投影损失，减少由单目视频连续帧遮挡带来的负面影响，以此来获得更为优秀的深度估计，相对姿态估计器θpose预测连续帧之间的相对姿态作为自我运动的最终输出：

【专利技术属性】
技术研发人员：李鹏，邓元明，李炎隆，王子旭，
申请(专利权)人：湘潭大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人