【技术实现步骤摘要】
位姿确定方法、装置、电子设备和可读存储介质
[0001]本申请涉及信息处理领域,具体而言,涉及一种位姿确定方法、装置、电子设备和可读存储介质。
技术介绍
[0002]随着智能系统的不断发展,对监控视频的自动化处理要求也越来越高。在监控视频或者拍摄图像中确定目标对象的姿态时,由于图像数据在采集过程中丢失了三维世界中的深度信息,使得目标对象的姿态参数难以恢复。
[0003]相关技术中,常常可以通过以下两种方式估计目标对象的姿态参数。其一是先通过目标对象的三维模型渲染出其在不同姿态下的图像,然后将渲染出的图像作为卷积神经网络的输入,将不同姿态所对应的姿态参数作为卷积神经网络的期望输出,训练卷积神经网络。当卷积神经网络收敛之后,可以用于位姿估计。这样,在进行目标姿态估计时,可以将待处理图像作为网络输入,输出即为对应的姿态参数。这种基于图像识别的方法由于不存在严格的投影关系方程,因此很难得到目标姿态参数的准确估计值,而且泛化性很差。其二是利用深度学习方法预测目标对象的二维关键点,并结合目标对象的三维模型和相机标定信息,利用三维 ...
【技术保护点】
【技术特征摘要】
1.一种位姿确定方法,其特征在于,包括:获取待处理图像集;所述待处理图像集中包括目标对象对应的多个目标图像;针对每一个所述目标图像,基于该目标图像的目标关键点信息,确定所述目标对象的初始位姿信息;确定所述目标对象的初始模型;基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息,确定所述目标对象的目标模型和所述目标对象的目标位姿。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取与所述目标对象相匹配的先验信息;所述先验信息用于表征所述目标对象的结构信息和/或尺寸信息;所述基于所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息,确定所述目标对象的目标模型和所述目标对象的目标位姿,包括:基于所述先验信息、所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息,确定所述目标对象的目标模型和所述目标对象的目标位姿。3.根据权利要求2所述的方法,其特征在于,所述基于所述先验信息、所述初始模型以及所述多个目标图像各自对应的所述初始位姿信息,确定所述目标对象的目标模型和所述目标对象的目标位姿,包括:基于所述先验信息、所述初始模型以及多个所述初始位姿信息,计算最小误差值;其中,所述最小误差值通过对象规格误差值和重投影误差值进行表征;所述对象规格误差值表征得到的对象模型所对应的结构信息和/或尺寸信息与所述先验信息之间的误差;所述重投影误差值表征得到的对象模型在对应的目标图像中的投影点与对应关键点之间的重投影误差;将得到所述最小误差值时优化得到的对象模型确定为所述目标模型,以及将得到所述最小误差值时优化得到的位姿确定为所述目标位姿。4.根据权利要求3所述的方法,其特征在于,所述最小误差值基于以下步骤得到:在检测到误差值小于误差阈值时,将该误差值确定为所述最小误差值;或者在迭代次数达到迭代上限时,将多个误差值中最小的误差值确定为所述最小误差值;其中,达到迭代上限时所对应的迭代次数阈值与所述待处理图像集中包括所述目标图像的数量匹配。5.根据权利要求3或4所述的方法,其特征在于,所述基于所述先验信息、所述初始模型以及多个所述初始位姿信息,计算最小误差值,包括:针对每一次迭代计算,基于所述先验信息以及当次优化得到的所述目标对象的当次模型,计算当次对象规格误差值;以及基于所述当次模型以及当次对应的初始位姿信息,计算当次重投影误差值;以及基于所述当次对象规格误差值和所述当次重投影误差值,确定所述最小误差值。6.根据权利要求5所述的方法,其特征在于,所述基于所述当次对象规格误差值和所述当次重投影误差值,确定所述最小误差值,包括:将所述当次对象规格误差值与...
【专利技术属性】
技术研发人员:王彬,
申请(专利权)人:北京迈格威科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。