【技术实现步骤摘要】
一种实时6D位姿估计方法及计算机可读存储介质
[0001]本专利技术涉及位姿估计
,尤其涉及一种实时6D位姿估计方法及计算机可读存储介质。
技术介绍
[0002]随着机器人技术的迅猛发展,机器人灵巧操作在工业自动化和人们日常生活中的应用也愈加广泛。对于目标物体的实时6D位姿估计是机器人实现灵巧操作的首要前提,直接影响着机器人对物体操作的稳定性与连贯性。
[0003]目标物体的6D位姿表示物体在笛卡尔空间中的6个自由度,包括3个位移(平移)自由度和3个空间旋转自由度。位姿是一个相对概念,用于表示两个坐标系之间的相对刚性变换关系。由于在实际应用中相机与机器人之间相对关系是已知的,所以在本专利技术中6D位姿估计指的是待估计物体自身坐标系与相机坐标系之间变换关系。
[0004]常见的物体6D位姿估计方法可以分为基于RGB图像、基于点云、基于RGB
‑
D图像三种。基于RGB图像的位姿估计算法主要依靠采用人工设计的特征提取算子或者卷积神经网络来从图像中提取出物体的纹理特征,并依据这些特征来估计待测物体的6D位姿信息。但该方法十分依赖图像中的物体纹理信息,在面对低纹理物体或者光照变化较大的场景时难以保证较好精度。基于点云的位姿估计方法主要依靠激光雷达获取点云信息,但激光雷达价格昂贵且安装条件较为苛刻,难以部署到机械臂上;同时因为雷达的点云信息较为稀疏,不利于实现小物体的位姿估计。随着近些年技术的发展,深度相机价格逐步降低,这也使得基于RGB
‑
D的位姿估计方法得到重视。RB ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种实时6D位姿估计方法,其特征在于,包括如下步骤:S1:从目标物体的三维模型中选取预设关键点并得到所述预设关键点在所述三维模型中基于三维模型原点坐标系下的坐标;S2:通过网络预测所述目标物体的所述预设关键点在实际场景中基于相机坐标系下的坐标;S3:将所述预设关键点在所述三维模型原点坐标系下的坐标和在所述相机坐标系下的坐标进行拟合计算得到所述目标物体当前的位姿。2.如权利要求1所述的实时6D位姿估计方法,其特征在于,通过网络预测所述预设关键点在实际场景中基于所述相机坐标系下的坐标包括如下步骤:S21:获取所述目标物体的RGB
‑
D图像并将所述RGB
‑
D图像中的全局信息转化为局部信息,所述局部信息是所述目标物体的局部RGB图像和所述目标物体的局部点云信息;S22:对所述目标物体的局部RGB图像进行纹理特征提取、对所述目标物体的局部点云信息进行几何特征提取,利用密集融合得到的逐点密集对应进行逐点特征拼接并基于所述逐点特征识别出属于所述目标物体的点云;S23:利用所述目标物体的所述逐点特征预测每个可视点与所述预设关键点之间的偏移向量;利用所述逐点特征与所述偏移向量对每个所述可视点与各个所述预设关键点的映射关系进行评估并根据评估结果对每个所述可视点的预测信息进行筛选和融合,得到所述预设关键点在所述相机坐标系下的坐标。3.如权利要求2所述的实时6D位姿估计方法,其特征在于,依据预测的边界框对所述目标物体的RGB
‑
D图像进行截取得到所述局部信息;将截取后所述目标物体的局部点云的中心点设置为原点,方向与相机坐标系相同建立一个点云中心点坐标系并将所述目标物体在所述三维模型原点坐标系下的坐标转移到所述点云中心点坐标系下,消除所述相机坐标系中相机到所述点云中心点的偏移量以突出局部信息。4.如权利要求3所述的实时6D位姿估计方法,其特征在于,使用ResNet与上采样相结合的方法对所述目标物体的局部RGB图像进行纹理特征提取;利用PointNet对所述目标物体的局部点云信息进行几何特征提取。5.如权利要求4所述的实时6D位姿估计方法,其特征在于,使用最大池化方法获取全局特征并将所述全局特征与每个所述可视点的所述逐点特征作为输入,预测所有所述可视点的语义标签得分,识别出属于所述目标物体的点云;训练时使用softmax交叉熵作为损失函数:其中,N为点数,c
n
表示第n个可视点经过softmax处理后各类别的预测置信度,l
n
是与c
n
技术研发人员:梁斌,刘厚德,黄俊楠,夏崇坤,王学谦,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。