【技术实现步骤摘要】
本申请涉及人工智能,具体是一种基于全流双向融合网络的6d位姿估计方法。
技术介绍
1、6d位姿估计是得到从目标对象坐标系到相机坐标系的刚性转换,包括3d旋转矩阵r和3d平移矩阵t。6d姿态估计是许多现实应用中的重要组成部分,例如在工业机器人领域,准确地识别待抓取物体的6d位姿可以提高抓取或装配的准确性;在增强现实领域,准确的6d位姿估计可以将虚拟对象准确地放置在现实世界中,增强沉浸式体验。在自动驾驶领域,准确的6d位姿估计可以准确的识别周围环境中其他车辆、行人和障碍物的位置和方向,帮助自动驾驶汽车做出安全决策。
2、从实际应用来看,目前6d位姿估计方法可分为三种。第一类是利用rgb图像,rgb图像提供了丰富的颜色信息,有利于特征提取和物体识别。但是由于缺乏深度信息,对光照变化和遮挡敏感,可能会导致在纹理缺乏或重复纹理的情况下表现不佳。第二类是仅利用深度图像或点云,可以提供精确的三维空间信息,但对于点云数据本身的一些噪声敏感,在点云稀疏或遮挡情况下难以处理。第三类是利用rgb-d图,结合了rgb图像的颜色信息和深度传感器的精确
...【技术保护点】
1.一种基于全流双向融合网络的6D位姿估计方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于全流双向融合网络的6D位姿估计方法,其特征在于,在所述步骤S3中,所述的使用最大池化和多层感知机整合压缩外观特征Fri,得到集成的外观特征Fr2p,具体通过以下公式计算得到:
3.根据权利要求2所述的基于全流双向融合网络的6D位姿估计方法,其特征在于,在所述步骤S3中,所述的将点云特征Fpoint和集成的外观特征Fr2p连接,通过MLPS获取融合的点特征具体通过以下公式计算得到:
4.根据权利要求1所述的基于全流双向融合网络
...【技术特征摘要】
1.一种基于全流双向融合网络的6d位姿估计方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于全流双向融合网络的6d位姿估计方法,其特征在于,在所述步骤s3中,所述的使用最大池化和多层感知机整合压缩外观特征fri,得到集成的外观特征fr2p,具体通过以下公式计算得到:
3.根据权利要求2所述的基于全流双向融合网络的6d位姿估计方法,其特征在于,在所述步骤s3中,所述的将点云特征fpoint和集成的外观特征fr2p连接,通过mlps获取融合的点特征具体通过以下公式计算得到:
4.根据权利要求1所述的基于全流双向融合网络的6d位姿估计方法,其特征在于,在所述步骤s3中,使用最大池化和多层感知机整合压缩几何特征fpj,得到集成的点特征fp2r,具体通过以下公式计算得到:
5.根据权利要求2所述的基于全流双向融合网络的6d位姿估计方法,其特征在于,在所述步骤s3中,所述的将图像特征frgb和集成的点特征fp2r连接,得到融合的图像特征具体通过以下公式计算得到:
6.根据权利要求3或5所述的基于全流双向融合网络的6d位姿估计方法,其特征在于,在所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。