位姿预测方法和装置制造方法及图纸

技术编号:38711995 阅读:44 留言:0更新日期:2023-09-08 14:54
本申请公开了一种位姿预测方法和装置,属于视觉成像技术领域。所述方法包括:获取深度相机检测到的目标区域对应的二维图像和所述二维图像中每个像素点对应的空间坐标;将所述每个像素点对应的空间坐标,按照二维图像中每个像素点的分布进行排列,得到输入矩阵数据;基于所述输入矩阵数据和训练完成的二维位姿预测模型,确定所述目标区域中每个目标物体的位姿信息,其中,所述二维位姿预测模型采用二维图像分割网格。采用本申请,使得无序的空间坐标变为有序,而有序的输入矩阵数据,可以直接使用二维图像分割网路作为二维位姿预测模型,二维图像分割网络的结构较为简单,极大的降低了其计算量。降低了其计算量。降低了其计算量。

【技术实现步骤摘要】
位姿预测方法和装置


[0001]本申请涉及视觉成像
,特别涉及一种位姿预测方法和装置。

技术介绍

[0002]在机器人领域内,位姿信息是引导机器人运动的一项重要数据。
[0003]当前的位姿预测方法是:获取目标区域内的三维点云数据,然后将三维点云数据输入到训练完成的三维位姿预测模型中,从而得到预测出的目标区域内的各种物体的位姿信息,机器人可以通过物体的位姿信息来进行避障或者拾取操作等等。
[0004]但在上述方法中,三维点云数据是无序的多个空间坐标,每两个空间坐标之间没有严格的顺序关系,要基于这种无序的信息预测出准确的位姿信息,就导致了三维位姿预测模型的内部结构较为复杂,其计算量较大,例如,PPR

Net模型、PPR

Net++模型等等,均具有较为复杂的内部结构,计算量较大。

技术实现思路

[0005]本申请实施例提供了一种位姿预测方法,能够解决现有技术中计算量较大的问题。
[0006]第一方面,提供了一种位姿预测方法,所述方法包括:/>[0007]获取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种位姿预测方法,其特征在于,所述方法包括:获取深度相机检测到的目标区域对应的二维图像和所述二维图像中每个像素点对应的空间坐标;将所述每个像素点对应的空间坐标,按照二维图像中每个像素点的分布进行排列,得到输入矩阵数据;基于所述输入矩阵数据和训练完成的二维位姿预测模型,确定所述目标区域中每个目标物体的位姿信息,其中,所述二维位姿预测模型采用二维图像分割网格。2.根据权利要求1所述的方法,其特征在于,所述二维图像分割网络是二维语义分割模型或者二维实例分割模型。3.根据权利要求1所述的方法,其特征在于,所述基于所述输入矩阵数据和训练完成的二维位姿预测模型,确定所述目标区域中每个目标物体的位姿信息,包括:对所述输入矩阵数据进行归一化处理,得到归一化处理后的输入矩阵数据;将所述归一化处理后的输入矩阵数据,输入所述训练完成的二维位姿预测模型,得到所述每个像素点对应的空间坐标与所述空间坐标对应的目标物体的质心坐标之间的预测矢量距离、以及所述每个像素点对应的旋转角信息;对所述多个像素点对应的预测矢量距离进行聚类处理,得到至少一个目标物体对应的像素点集合;对于每个目标物体对应的像素点集合,基于所述每个像素点对应的空间坐标和预测矢量距离,确定每个像素点对应的目标物体的质心坐标,计算多个像素点对应的目标物体的质心坐标之间的平均值,作为所述目标物体的质心坐标,计算多个像素点对应的旋转角信息之间的平均值,作为所述目标物体的旋转角信息,其中,所述旋转角信息包括横滚角、俯仰角和偏转角。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:使用仿真工具和渲染工具建立具有多个物体模型的模拟场景模型;获取模拟场景模型中样本区域对应的二维样本图像和二维样本图像中每个样本像素点对应的空间坐标,将所述每个样本像素点对应的空间坐标,按照所述二维样本图像中每个样本像素点的分布进行排列,作为样本输入数据;基于所述样本区域中的样本物体的位姿信息,确定基准输出数据,其中,所述位姿信息包括所述样本物体的质心坐标和旋转角信息,所述基准输出数据包括每个样本像素点对应的空间坐标与所述空间坐标对应的样本物体的质心坐标之间的矢量距离、以及所述每个样本像素点对应的旋转角信息;基于所述样本输入数据和待训练的二维位姿预测模型,得到预测输出数据;基于所述基准输出数据、所述预测输出数据和损失函数,确定损失值;基于所述损失值,对所述待训练的二维位姿预测模型进行调参,得到所述训练完成的二维位姿预测...

【专利技术属性】
技术研发人员:周韬王炜
申请(专利权)人:美的集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1