用于估计目标对象的三维位姿的方法和装置制造方法及图纸

技术编号：38876169 阅读：16 留言：0更新日期：2023-09-22 14:09

本公开实施例提供一种用于估计目标对象的三维位姿的方法和装置，所述方法包括：获取目标图像中的目标对象的关键点的位置信息，所述关键点包括多个轮廓点和预定义的多个语义点；所述多个语义点与所述目标对象的姿态有关；基于所述多个语义点的位置信息以及待渲染对象的三维模型上的多个参考语义点的参考位置信息，确定所述目标对象的初始三维位姿；所述多个参考语义点与所述多个语义点一一对应；基于所述多个轮廓点的位置信息对所述初始三维位姿进行调整，得到所述目标对象的三维位姿的估计结果。的估计结果。的估计结果。

全部详细技术资料下载

【技术实现步骤摘要】
用于估计目标对象的三维位姿的方法和装置

[0001]本公开涉及虚拟现实
，尤其涉及用于估计目标对象的三维位姿的方法和装置。

技术介绍

[0002]在相关技术中，常常会将一些三维模型渲染到真实采集的图像中的目标对象上，以使渲染后的图像获得一定的视觉效果。为了提高渲染准确度，需要确定的图像中的目标对象的三维位姿。然而，相关技术确定三维位姿的准确度较低，导致渲染准确度较低。

技术实现思路

[0003]第一方面，本公开实施例提供一种用于估计目标对象的三维位姿的方法，所述方法包括：获取目标图像中的目标对象的关键点的位置信息，所述关键点包括多个轮廓点和预定义的多个语义点；所述多个语义点与所述目标对象的姿态有关；基于所述多个语义点的位置信息以及待渲染对象的三维模型上的多个参考语义点的参考位置信息，确定所述目标对象的初始三维位姿；所述多个参考语义点与所述多个语义点一一对应；基于所述多个轮廓点的位置信息对所述初始三维位姿进行调整，得到所述目标对象的三维位姿的估计结果。
[0004]第二方面，本公开实施例提供一种用于估计目标对象的三维位姿的装置，所述装置包括：获取模块，用于获取目标图像中的目标对象的关键点的位置信息，所述关键点包括多个语义点和预定义的多个轮廓点；所述多个语义点与所述目标对象的姿态有关；确定模块，用于基于所述多个语义点的位置信息以及待渲染对象的三维模型上的多个参考语义点的参考位置信息，确定所述目标对象的初始三维位姿；所述多个参考语义点与所述多个语义点一一对应；调整模块，用于基于所述多个轮廓点的...

【技术保护点】

【技术特征摘要】
1.一种用于估计目标对象的三维位姿的方法，其特征在于，所述方法包括：获取目标图像中的目标对象的关键点的位置信息，所述关键点包括多个轮廓点和预定义的多个语义点；所述多个语义点与所述目标对象的姿态有关；基于所述多个语义点的位置信息以及待渲染对象的三维模型上的多个参考语义点的参考位置信息，确定所述目标对象的初始三维位姿；所述多个参考语义点与所述多个语义点一一对应；基于所述多个轮廓点的位置信息对所述初始三维位姿进行调整，得到所述目标对象的三维位姿的估计结果。2.根据权利要求1所述的方法，其特征在于，所述获取目标图像中的目标对象的关键点的位置信息，包括：通过目标检测模型对所述目标图像进行检测，得到所述目标图像中的目标对象的至少两个目标轮廓点的初始位置信息；基于所述至少两个目标轮廓点的初始位置信息从所述目标图像中裁剪出包括所述目标对象的图像区域；通过关键点检测模型对所述图像区域进行关键点检测，得到所述多个语义点的位置信息和所述多个轮廓点的位置信息。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：确定所述目标对象的类别信息，所述目标对象的类别信息表征所述目标对象属于第一类别或第二类别，所述第一类别的目标对象与所述第二类别的目标对象关于一对称轴对称；所述通过关键点检测模型对所述图像区域进行关键点检测，包括：在所述目标对象属于所述第一类别的情况下，基于所述对称轴对裁剪出的所述图像区域进行翻转处理，得到翻转图像区域；通过关键点检测模型对所述翻转图像区域进行关键点检测。4.根据权利要求3所述的方法，其特征在于，所述确定所述目标对象的类别信息，包括：对所述目标图像进行检测，得到所述至少两个目标轮廓点分别对应的位置热力图；其中，所述位置热力图中每一像素点的热力值表征所述目标图像中对应的像素点为与所述位置热力图对应的目标轮廓点的概率；基于各个目标轮廓点分别对应的位置热力图，以及预设的对象类别与目标轮廓点之间的对应关系，确定所述目标对象的类别信息。5.根据权利要求3或4所述的方法，其特征在于，所述目标图像为视频流中的视频帧；所述方法还包括：将所述目标图像中的目标对象的所述至少两个目标轮廓点的位置信息和所述目标图像中的目标对象的类别信息输入目标跟踪模型；通过所述目标跟踪模型获取所述视频流中的所述目标图像的在后视频帧中的所述目标对象的多个语义点的位置信息和多个轮廓点的位置信息，以及所述在后视频帧中的所述目标对象的类别信息。6.根据权利要求5所述的方法，其特征在于，所述方法还包括：通过所述目标跟踪模型获取所述在后视频帧中的所述目标对象的判丢分数，所述判丢
分数用于表征所述在后视频帧中的所述目标对象丢失的概率；若所述判丢分数大于预设的分数阈值，将所述在后视频帧作为新的目标图像，并返回获取目标图像中的目标对象的关键点的位置信息的步骤。7.根据权利要求2至6任意一项所述的方法，其特征在于，所述基于所述至少两个目标轮廓点的初始位置信息从所述目标图像中裁剪出包括所述目标对象的图像区域，包括：基于所述至少两个目标轮廓点的初始位置信息，对所述目标图像进行旋转处理，经旋转处理后所述目标图像中的目标对象朝向预设角度；从经旋转处理后的所述目标图像中裁剪出包括所述目标对象的图像区域。8.根据权利要求1至7任一项所述的方法，其特征在于，所述多个语义点和所述多个轮廓点的位置信息均通过关键点检测模型获取；所述...

【专利技术属性】
技术研发人员：何野，杜天元，赵通，四建楼，钱晨，
申请(专利权)人：北京大甜绵白糖科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人