当前位置: 首页 > 专利查询>天地科技股份有限公司北京技术研究分公司专利>正文

单目位姿估计方法及装置制造方法及图纸

技术编号：38551050 阅读：17 留言：0更新日期：2023-08-22 20:57

本发明专利技术提出一种单目位姿估计方法及装置，涉及深度学习技术领域。包括：将当前帧图像输入到深度估计网络，以得到深度图像；将所述当前帧图像和对应的相邻帧图像输入到位姿估计网络，以得到相对位姿变换；基于八叉树构建隐式编码体素地图，并根据相对位姿变换和深度图像，以及隐式编码体素地图，生成重构深度图像；基于预先构建的第一几何损失函数和光度损失函数，基于当前帧图像和所述重构深度图像，对所述相对位姿变换进行位姿优化，并对所述隐式编码体素地图进行优化。由此，可以利用八叉树对已有的基于深度学习的隐式编码体素地图表示的方法进行改进，减少隐式编码体素地图的内存空间占用，并实现单目方法，免去对RGBD相机的依赖。的依赖。的依赖。

全部详细技术资料下载

【技术实现步骤摘要】
单目位姿估计方法及装置

[0001]本专利技术涉及深度学习
，尤其涉及一种单目位姿估计方法及装置。

技术介绍

[0002]位姿估计与地图重建是目前机器人与计算机视觉领域的研究热点之一，是实现无人机器人自主定位与导航的前提。由于视觉相机可靠性高、价格低廉的优势，基于视觉的位姿估计方法一直是计算机视觉与机器人领域的一个研究热点，其中，单目位姿估计是其他视觉位姿估计方法的基础。目前的位姿估计与地图重建方法可分为传统方法后和基于学习的方法。传统方法根据图像中的几何关系与光度关系，通过几何及优化的方法估计位姿。随着深度学习的在计算机视觉领域发展，有许多基于深度学习的位姿估计与三维表示方法。
[0003]基于深度学习的隐式编码体素表示的地图表示方法为SLAM中的地图构建提供了一种新的思路。但目前隐式编码体素地图表示需要占据大量内存空间，难以在大规模场景中应用，且这种方法多使用RGBD相机，而RGBD相机应用范围相对受限。

技术实现思路

[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]本专利技术第一方面实施例提出了一种单目位姿估计方法，包括：将当前帧图像输入到预先构建的深度估计网络，以得到深度图像；将所述当前帧图像和对应的相邻帧图像输入到预先构建的位姿估计网络，以得到相对位姿变换；基于八叉树构建隐式编码体素地图，并根据所述相对位姿变换和深度图像，以及所述隐式编码体素地图，生成重构深度图像；基于预先构建的第一几何损失函数和光度损失函数，基于所述当前帧图像和所...

【技术保护点】

【技术特征摘要】
1.一种单目位姿估计方法，其特征在于，包括：将当前帧图像输入到预先构建的深度估计网络，以得到深度图像；将所述当前帧图像和对应的相邻帧图像输入到预先构建的位姿估计网络，以得到相对位姿变换；基于八叉树构建隐式编码体素地图，并根据所述相对位姿变换和深度图像，以及所述隐式编码体素地图，生成重构深度图像；基于预先构建的第一几何损失函数和光度损失函数，基于所述当前帧图像和所述重构深度图像，对所述相对位姿变换进行位姿优化，并对所述隐式编码体素地图进行优化。2.根据权利要求1所述的方法，其特征在于，所述根据所述相对位姿变换和深度图像，以及所述隐式编码体素地图，生成重构深度图像，包括：在相机光心到所述当前帧图像中各个像素点深度之间的直线上进行采样，以得到每个像素点对应的多个采样点；基于八叉树构建隐式编码体素地图，确定每个采样点对应的隐式编码；利用几何解码器网络，将所述每个采样点对应的隐式编码转化为占据率；根据所述每个采样点的占据率，计算所述每个采样点对应的权重；根据各个所述采样点对应的深度和权重，计算每个所述像素点在所述重构深度图像中的深度。3.根据权利要求2所述的方法，其特征在于，在所述基于八叉树构建隐式编码体素地图，确定每个采样点对应的隐式编码之后，还包括：通过三线性插值确定所述每个像素点对应的隐式编码；基于颜色解码器网络，根据所述每个像素点对应的隐式编码，计算每个像素点对应的颜色值，以获取重构后的彩色图像。4.根据权利要求1所述的方法，其特征在于，在所述基于预先构建的第一几何损失函数和光度损失函数，基于所述当前帧图像和所述重构深度图像，对所述相对位姿变换进行位姿优化，并对所述隐式编码体素地图进行优化之前，还包括：对所述当前帧图像进行采样，以得到多个采样像素点；根据所述当前帧图像和所述重构深度图像，获取每个所述采样像素点的占据率、重构深度以及各个所述重构深度的方差，以及每个所述采样像素点在所述当前帧图像中的深度信息和颜色值；获取与所述当前帧图像对应的重构后的彩色图像；根据所述重构后的彩色图像，确定每个所述采样像素点对应的重构颜色值。5.根据权利要求4所述的方法，其特征在于，所述对所述隐式编码体素地图进行优化，包括：获取与所述当前帧图像关联的关键帧和共视帧；确定所述当前帧图像，以及所述关键帧和共视帧对应的各个所述采样像...

【专利技术属性】
技术研发人员：修海鑫，程健，李和平，李昊，孙大智，王广福，闫鹏鹏，
申请(专利权)人：天地科技股份有限公司北京技术研究分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人