【技术实现步骤摘要】
一种基于伪深度图的RGB
‑
D SLAM方法、系统和存储介质
[0001]本专利技术涉及网格地图构建
,尤其涉及一种基于伪深度图的RGB
‑
D SLAM方法。
技术介绍
[0002]自主导航同步定位和建图(SLAM)是一种定位和建图研究技术,在移动机器人的导航和定位中发挥着重要作用。视觉SLAM由四个部分组成:视觉里程计(VO)、优化、闭环和映射。在VO中,主要是完成对相机位姿的估计,而单目VO由于输入中缺乏深度信息而存在尺度模糊(scale ambiguity)。该问题通常通过结合惯性测量单元(IMU)来解决,但随着深度学习框架的逐渐成熟,无监督单目深度估计方法逐渐取代了传统的单目深度估计方法。
[0003]近年来,出现了许多结合单目深度估计的SLAM框架,如UnDeepVO和D3VO。然而,他们的标准做法是将单目深度框架直接与VO集成,这可能导致无法快速有效地利用SLAM框架中新的单目深度估计框架生成的深度信息。在深度学习中,一般的做法是在python中训练出深度估计,使用libtorch进行模型部署,转成C++的格式再改写SLAM算法。虽然跟踪脚本等工具是由Torch官方提供用于转换的,但是,并不是所有的操作和方法都被TorchScript支持。所以结合SLAM框架中单目深度估计框架,测试单目深度估计会进行多次的测试,浪费转换时间和部署时间。
技术实现思路
[0004]为克服上述缺点,本专利技术的目的在于提供一种基于伪深度图的RGB
‑< ...
【技术保护点】
【技术特征摘要】
1.一种基于伪深度图的RGB
‑
D SLAM方法,其特征在于::包括如下步骤:获取原始图像集,单目相机收集多幅彩色原始图像,得到原始图像集;获取伪深度图集,对所述原始图像集中的每幅彩色原始图像进行深度预估,每幅所述彩色原始图像形成一个16位的伪深度图,所有16位的伪深度图形成一个伪深度图集;将所述原始图像集及所述伪深度图集结合形成伪RGB
‑
D集,将所述伪RGB
‑
D集输入预设三维模型成像系统,构建全局地图。2.根据权利要求1所述的基于伪深度图的RGB
‑
D SLAM方法,其特征在于:所述获取伪深度图集具体包括:选择深度估计网络,使用所述深度估计网络对原始图像集内的每幅彩色原始图像进行监督训练,得到所述彩色原始图像的每个像素点所在的位置的第一深度值,将第一深度值保存为第一深度矩阵;将第一深度矩阵通过转换算法转换为第二深度矩阵,并将第二深度矩阵生产成为一个16位的伪深度图,所有16位的伪深度图形成一个伪深度图集。3.根据权利要求2所述的基于伪深度图的RGB
‑
D SLAM方法,其特征在于:所述转换算法包括:将每个第一深度值自0和1之间进行归一化,得到归一化的像素值D
ij
;其中d
ij
为第一深度值,d
max
为65.5,65.5米也是16位能够表达的最大深度数;归一化的像素值D
ij
映射至0
‑
65535的区间中,并保存成第二深度矩阵D
ij16bit
,D
ij16bit
=|D
ij
×
(2
16
‑
1)|。4.根据权利要求2所述的基于伪深度图的RGB
‑
D SLAM方法,其特征在于:所述深度估计网络基于Monodepth2网络框架。5.根据权利要求2所述的基于伪深度...
【专利技术属性】
技术研发人员:张月,王新珩,余丽敏,赵浩诚,杜爽,邹斌,伍淘宇,
申请(专利权)人:苏州英特雷真智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。