一种基于跨模态信息融合的6D姿态估计方法技术

技术编号:41596108 阅读:35 留言:0更新日期:2024-06-07 00:06
本发明专利技术公开了一种基于跨模态信息融合的6D姿态估计方法,在编码阶段,RGB网络分支和点云网络分支分别利用编码器逐层提取RGB图像的RGB特征和Depth图像的点云特征,提取点云特征时,每层编码均使用几何上下文特征聚合模块。解码阶段,RGB网络分支和点云网络分支分别利用多层解码器解码特征。在两分支相应的编码层和解码层之间,利用跨模态注意力融合模块融合RGB特征和点云特征,并按RGB特征和点云特征的排列顺序将融合的特征重新拆分为RGB特征和点云特征。位姿解算阶段,将所述第一多层解码器输出的RGB特征和第二多层解码器输出的点云特征拼接,依据拼接特征进行6D位姿估计。本发明专利技术提高了遮挡场景下的特征表示能力,提高了遮挡场景中姿态估计的性能。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域,尤其是一种基于跨模态信息融合的6d姿态估计方法。


技术介绍

1、6d姿态估计是计算机视觉领域中的一个重要问题,它涉及到在三维空间中准确估计物体的位置和姿态。6d姿态估计广泛应用于机器人操纵、自动驾驶、ar、vr等领域,该技术它推动着计算机视觉和机器感知技术的发展,是当前的研究热点之一。

2、6d姿态估计是从输入图像数据中确定场景中所有对象的旋转和平移的任务。物体的6d姿态是相对于相机表达的。6d姿态估计算法按照输入的数据类型可分为基于rgb的6d姿态估计算法和基于rgb-d的6d姿态估计算法。

3、在6d姿态估计发展初期,传统方法主要包括基于模板匹配和基于特征提取的方法。基于模板匹配的6d姿态估计方法通过从物体的二维图像或者深度图像中提取出模型纹理特征,建立一个具有6d姿态标签的模板库,从模板库中选择与之最相似的模板作为该物体的6d姿态。如linemod算法,将二维图像中的边缘梯度特征与深度图像的法线特征结合起来组成多模态特征,再进行模板匹配。基于特征提取的6d姿态估计方法通过提取图像特征描述符,常见的本文档来自技高网...

【技术保护点】

1.一种基于跨模态信息融合的6D姿态估计方法,包括编码阶段、解码阶段和位姿解算阶段;其特征在于,所述编码阶段和所述解码阶段均包括RGB网络分支和点云网络分支;

2.如权利要求1所述的基于跨模态信息融合的6D姿态估计方法,其特征在于,所述第一多层编码器最后一编码层提取RGB特征后,还利用金字塔池化模块对提取的RGB特征进行池化处理。

3.如权利要求1所述的基于跨模态信息融合的6D姿态估计方法,其特征在于,所述将角度方位信息与原始点特征相结合,为将与原始点相邻的点相对于原始点的相对角度信息与原始点特征相结合。

4.如权利要求3所述的基于跨模态信息融合的6D...

【技术特征摘要】

1.一种基于跨模态信息融合的6d姿态估计方法,包括编码阶段、解码阶段和位姿解算阶段;其特征在于,所述编码阶段和所述解码阶段均包括rgb网络分支和点云网络分支;

2.如权利要求1所述的基于跨模态信息融合的6d姿态估计方法,其特征在于,所述第一多层编码器最后一编码层提取rgb特征后,还利用金字塔池化模块对提取的rgb特征进行池化处理。

3.如权利要求1所述的基于跨模态信息融合的6d姿态估计方法,其特征在于,所述将角度方位信息与原始点特征相结合,为将与原始点相邻的点相对于原始点的相对角度信息与原始点特征相结合。

4.如权利要求3所述的基于跨模态信息融合的6d姿态估计方法,其特征在于,几何上下文特征聚合模块将角度方位信息与原始点特征相结合的过程包括:

5.如权利要求4所述的基于跨模态信息融合的6d姿态估计方法,其特征在于,所述利用...

【专利技术属性】
技术研发人员:宋锐苏烈超李娇娇刘志强周智毅任翔
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1