【技术实现步骤摘要】
本专利技术涉及视觉slam领域,具体是涉及一种融合rgb与深度特征的多模态视觉里程计。
技术介绍
1、伴随着人工智能的迅猛发展,机器人产业也发展的如火如荼,在人们的生产、生活中扮演者日益重要的角色[1]。移动机器人,无人驾驶汽车等产品越来越多的出现人们视野中,想要实现自主运动就必需解决两个问题,“同时定位”和“建立地图”,也就是slam(simultaneous localization and mapping)。slam一般分为视觉slam和激光slam。相较于激光slam对于设备的昂贵需求,视觉slam的传感器为相机,成本则明显更小,更利于推广。
2、随着深度学习在计算机视觉领域的发展,越来越多的研究者将深度学习与传统视觉slam相结合,用深度学习的方法来代替传统视觉slam中的某一环节。深度学习和视觉里程计的结合是近年来的重点研究方向。视觉里程计的主要工作原理是通过两个图像连续帧之间的运动来估计相机位姿。在大量训练数据的支持下,深度学习和视觉里程计的结合,舍去了前端点跟踪、后端优化求解的一系列过程,直接输入图像给出位姿
...【技术保护点】
1.一种融合RGB与深度特征的多模态视觉里程计,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种融合RGB与深度特征的多模态视觉里程计,其特征在于,所述S1中利用到自监督单目深度估计网络得到逆深度图。然后通过计算每个像素的最小再投影损失,减少单目视频连续帧遮挡带来的负面影响,以此来获得更为优秀的深度估计。
3.根据权利要求1所述的一种融合RGB与深度特征的多模态视觉里程计,其特征在于,所述S2中通过计算每个像素的最小再投影损失,减少由单目视频连续帧遮挡带来的负面影响,以此来获得更为优秀的深度估计,相对姿态估计器θpose预测连续帧之间的
...【技术特征摘要】
1.一种融合rgb与深度特征的多模态视觉里程计,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种融合rgb与深度特征的多模态视觉里程计,其特征在于,所述s1中利用到自监督单目深度估计网络得到逆深度图。然后通过计算每个像素的最小再投影损失,减少单目视频连续帧遮挡带来的负面影响,以此来获得更为优秀的深度估计。
3.根据权利要求1所述的一种融合rgb与深度特征的多模态视觉里程计,其特征在于,所述s2中通过计算每个像素的最小再投影损失,减少由单目视频连续帧遮挡带来的负面影响,以此来获得更为优秀的深度估计,相对姿态估计器θpose预测连续帧之间的相对姿态作为自我运动的最终输出:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。