当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于注意力机制的物体6D位姿估计方法及系统技术方案

技术编号:45833455 阅读:23 留言:0更新日期:2025-07-15 22:39
本发明专利技术涉及计算机视觉技术领域,具体为一种基于注意力机制的物体6D位姿估计方法及系统;物体6D位姿估计方法中利用了6D位姿估计网络,6D位姿估计网络包括目标检测模块、主干网络模块和位姿预测模块。在目标检测模块中,根据目标所在位置对RGB图像进行放大处理。主干网络模块采用全新ResNet变体,整合了像素级小波多分支注意力机制与双通道上采样注意力机制,实现对目标在空间域和小波域中多尺度特征的高效捕捉与融合。位姿预测模块则利用神经网络直接预测6D位姿。本发明专利技术不仅为提升遮挡鲁棒性提供了创新思路,更构建了一种基于空频域特征融合的端到端物体6D位姿估计新范式。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,特别涉及一种基于注意力机制的物体6d位姿估计方法及系统。


技术介绍

1、物体六自由度位姿估计作为机器人操控、增强现实技术及工业智能化的基础支撑技术,其精度提升得益于多层感知机范式的前沿突破。特别是网络架构革新与多层次特征表征的协同优化,显著增强了rgb视觉的位姿预测能力。值得注意的是,linemod数据集及其遮挡版本作为通用评估标准,持续推动着该领域的技术迭代。

2、现有技术体系主要围绕卷积神经网络构建姿态估计框架。间接范式通过构建二维投影坐标与三维关键点的映射关系,结合pnp求解器实现位姿解算;直接范式则依托端到端架构,通过深度网络直接从像素空间回归物体位姿。具有里程碑意义的posecnn通过全局特征学习奠定性能基线,pvnet则创新性地采用矢量场表征增强遮挡鲁棒性。值得关注的是,注意力机制在特征增强方面展现出独特价值,cbam的研究证实了通道-空间双重注意力对特征提取的有效性。panet提出了一种注意力上采样模块,可以扩大特征聚合的设计空间,从而允许在解码器中利用更好的特征聚合,但是它并未将注意力机制融入到上采样操本文档来自技高网...

【技术保护点】

1.一种基于注意力机制的物体6D位姿估计方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于注意力机制的物体6D位姿估计方法,其特征在于,所述目标检测模块选用YOLOv5模型;

3.根据权利要求2所述的基于注意力机制的物体6D位姿估计方法,其特征在于,所述S2包括如下步骤:

4.根据权利要求2所述的基于注意力机制的物体6D位姿估计方法,其特征在于,所述像素级小波多分支注意力机制的数据处理步骤具体如下:

5.根据权利要求4所述的基于注意力机制的物体6D位姿估计方法,其特征在于,所述A4包括如下步骤:

6.根据权利要求5所...

【技术特征摘要】

1.一种基于注意力机制的物体6d位姿估计方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于注意力机制的物体6d位姿估计方法,其特征在于,所述目标检测模块选用yolov5模型;

3.根据权利要求2所述的基于注意力机制的物体6d位姿估计方法,其特征在于,所述s2包括如下步骤:

4.根据权利要求2所述的基于注意力机制的物体6d位姿估计方法,其特征在于,所述像素级小波多分支注意力机制的数据处理步骤具体如下:

5.根据权利要求4所述的基于注意力机制的物体6d位姿估计方法,其特征在于,所述a4包括如下步骤:

6.根据权利要求5所述的基于...

【专利技术属性】
技术研发人员:张辉孔垂旺陈为立陈波李康樊叶心江一鸣王耀南
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1