基于多尺度特征融合的6D位姿估计方法技术

技术编号：38530021 阅读：12 留言：0更新日期：2023-08-19 17:04

本发明专利技术为一种基于多尺度特征融合的6D位姿估计方法，该方法使用的6D位姿估计模型包括ResNet

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度特征融合的6D位姿估计方法

[0001]本专利技术属于人工智能
，具体涉及一种基于多尺度特征融合的6D位姿估计方法。

技术介绍

[0002]6D位姿估计的目标是得到相机坐标系与目标对象坐标系间的平移与旋转变换关系，包括目标物体的3D旋转矩阵和3D平移向量。6D位姿估计在人工智能领域发挥着重要作用，可以应用于很多场景，例如在工业机器人领域，准确识别出待抓取物体的6D位姿可以提高抓取准确性；在增强现实场景中，准确的6D位姿可以增加人与物体的交互感；在自动驾驶领域，准确估计行人或者静止物体的6D位姿进行实现精准避让。
[0003]传统的RGB
‑
D方法从RGB
‑
D数据中提取特征，并进行对应分组和假设验证，这种方法因过于依赖特征描述符和固定的匹配程序而限制了其在杂乱复杂场景的估计性能。基于深度学习的方法可以直接从RGB
‑
D数据中估计6D位姿，但是这种方法需要详细的后处理步骤，需利用Iterative Closest Point(ICP)等算法优化位姿信息，很难满足实时性。考虑到输入源为两种不同模态的数据信息，Chen Wang(Chen Wang.Densefusion:6d object pose estimation by iterative dense fusion.[C].2019)提出了端到端的逐像素融合网络，将RGB纹理特征和点云几何特征逐像素融合来实时估计6D位姿，保证了推理性能和实时性。然而，这种方法直接利用最后一层的特征信息进

【技术保护点】

【技术特征摘要】
1.一种基于多尺度特征融合的6D位姿估计方法，其特征在于，该方法包含以下步骤：步骤S1、采集估计对象的RGB
‑
D图像；步骤S2、构建6D位姿估计模型，包括ResNet
‑
18网络、PointNet网络和多尺度特征提取网络；将RGB图像输入到ResNet
‑
18网络中，提取RGB纹理特征；将深度图像转换为点云数据，并利用PointNet网络提取点云几何特征；将RGB纹理特征和点云几何特征输入到多尺度特征提取网络中，RGB纹理特征经过四次上采样，得到多尺度特征和特征和分别通过权值重分配得到特征和点云几何特征经过四次上采样，得到多尺度特征和特征和分别通过权值重分配得到特征和特征和经过通道拼接得到特征F
XY
，特征和经过通道拼接得到特征特征和经过通道拼接得到特征特征和经过通道拼接得到特征特征F
XY
和经过通道拼接和卷积后，与特征进行通道拼接，拼接得到的特征经过卷积，与特征进行通道拼接后，再经过卷积得到高维度的特征特征与经过通道拼接和卷积后，再与特征进行通道拼接，拼接得到的特征经过卷积得到中维度的特征特征与经过通道拼接和卷积，得到低维度的特征三个维度的特征经过通道拼接，得到特征F
γ
；特征F
γ
经过多层感知机进行回归预测，得到估计的6D位姿；步骤S...

【专利技术属性】
技术研发人员：安韵男，杨德东，葛浩然，栗扬扬，宋梦园，
申请(专利权)人：河北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人