二维图形中目标三维关键点提取模型构建及姿态识别方法技术

技术编号：22975496 阅读：15 留言：0更新日期：2019-12-31 23:43

本发明专利技术公开了一种二维图形中目标三维关键点提取模型构建及姿态识别方法，通过设计了三维关键点提取模型的网络结构，能够准确、直接输出目标三维关键点的坐标；通过设计的关键点损失函数，使网络利用无监督的方式自主学习提取具有语义一致性和几何一致性的关键点，提高了三维关键点提取的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
二维图形中目标三维关键点提取模型构建及姿态识别方法
本专利技术涉及目标三维姿态识别方法，具体涉及一种二维图形中目标三维关键点提取模型构建及姿态识别方法。
技术介绍
目标三维姿态识别是指识别目标物体的三维位置和方向，是诸多计算机视觉应用如增强现实、机器人控制以及无人驾驶任务中的关键模块。但是目标三维姿态识别的基础是需要对目标物体的三维关键点进行提取，在图像上找到物体的二维位置并且在物体上提取一些关键点比如物体3D边框在图像上的投影，这些方法通过利用大量的监督信息所以十分有效，但是在图像上标注三维信息的工作量巨大，并且要求极高的专业知识及复杂的准备工作，而且这类方法无法处理带有遮挡和复杂背景图像。另外即使获得了目标的三维关键点后也无法准确地识别到目标的三维姿态，因此现有技术中对二维图像中目标物体的三维姿态的获取方法存在姿态获取准确率不高，工作量大，导致的实时性不高且鲁棒性不高的问题。
技术实现思路
本专利技术的目的在于提供一种二维图形中目标三维关键点提取模型构建及姿态识别方法，用以解决现有技术中对二维图像中目标物体的三维关键点识别方法准确率不高，导致姿态识别准确率不高等问题。为了实现上述任务，本专利技术采用以下技术方案：一种二维图形中目标三维关键点提取模型构建方法，按照以下步骤执行：步骤1、获取多个包含待识别目标的二维图像组，所述的二维图像组中包括的两幅二维图像的区别在于图像采集角度不同；获得训练图像集；步骤2、将所述的训练图像集输入至神经网络中训练；<...

【技术保护点】
1.一种二维图形中目标三维关键点提取模型构建方法，其特征在于，按照以下步骤执行：/n步骤1、获取多个包含待识别目标的二维图像组，所述的二维图像组中包括的两幅二维图像的区别在于图像采集角度不同；/n获得训练图像集；/n步骤2、将所述的训练图像集输入至神经网络中训练；/n所述的神经网络包括特征提取子网络，所述的特征提取子网络分别与关键点提取子网络以及目标检测子网络连接；/n所述的特征提取子网络包括依次设置的特征图提取模块以及感兴趣区域提取模块；/n所述的目标检测子网络包括相互并联的目标分类模块以及包围盒检测模块；/n所述的关键点提取子网络包括串联的关键点概率获得模块以及关键点输出模块；/n所述的关键点概率获得模块用于获得每一个像素点是三维关键点的概率；/n所述的关键点输出模块利用式I获得每一个三维关键点的坐标：/n

【技术特征摘要】
1.一种二维图形中目标三维关键点提取模型构建方法，其特征在于，按照以下步骤执行：
步骤1、获取多个包含待识别目标的二维图像组，所述的二维图像组中包括的两幅二维图像的区别在于图像采集角度不同；
获得训练图像集；
步骤2、将所述的训练图像集输入至神经网络中训练；
所述的神经网络包括特征提取子网络，所述的特征提取子网络分别与关键点提取子网络以及目标检测子网络连接；
所述的特征提取子网络包括依次设置的特征图提取模块以及感兴趣区域提取模块；
所述的目标检测子网络包括相互并联的目标分类模块以及包围盒检测模块；
所述的关键点提取子网络包括串联的关键点概率获得模块以及关键点输出模块；
所述的关键点概率获得模块用于获得每一个像素点是三维关键点的概率；
所述的关键点输出模块利用式I获得每一个三维关键点的坐标：

其中[xi,yi]表示第i个三维关键点的坐标，i＝1,2,…,I，I为正整数，Pi(u,v)表示关键点概率计算子网络输出的二维图像中第(u,v)个像素点是第i个三维关键点的概率，(u,v)为二维图像的坐标，u与v均为正整数；
获得三维关键点提取模型。

2.如权利要求1所述的二维图形中目标三维关键点提取模型构建方法，其特征在于，所述的特征图提取模块包括依次设置的特征金字塔网络以及残差网络；所述的感兴趣区域提取模块包括区域生成网络。

3.如权利要求1所述的二维图形中目标三维关键点提取模型构建方法，其特征在于，所述的关键点概率获得模块包括依次串联的多个卷积块、上采样层以及softmax层；
所述的卷积块包括依次连接的卷积层和ReLU激活层。

4.如权利要求1所述的二维图形中目标三维关键点提取模型构建方法，其特征在于，所述的三维关键点提取模型的损失函数L为：

其中，表示所有负样本的分类损失函数之和，表示所有正样本的目标分类损失函数Lclass、包围盒检测损失函数Lbox以及关键点检测损失函数Lkeypoints之和，β、γ均大于0；
所述的负样本为感兴趣区域提取模块提取出的感兴趣区域不包含目标的二维图像；所述的正样本为感兴趣区域提取模块提取出的感兴趣区域包含目标的二维图像；
其中关键点检测损失函数其中Ldis为显著性损失函数，Ldep为深度预测损失函数，Lcon为三维一致性损失函数，Lsep为分离损失函数，Lpose为相对姿态估计损失函数，τ、...

【专利技术属性】
技术研发人员：彭进业，张少博，赵万青，祝轩，李斌，张薇，乐明楠，李展，罗迒哉，王珺，
申请(专利权)人：西北大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人