一种用于目标定位和姿态估计的深度学习模型制造技术

技术编号：29967278 阅读：14 留言：0更新日期：2021-09-08 09:37

本发明专利技术提供一种深度学习模型，输入二维图像，输出二维图像中目标物体的类别及其在该图像中的最小包围矩形，以及该目标在世界坐标系下的位置与姿态，对推进计算机视觉在机器人、自动驾驶等领域应用具有重要意义；与此同时，还提供了一种用于上述深度学习模型的训练样本生成方法，样本生成效率高，可以给该深度学习模型的训练提供充足的训练样本。习模型的训练提供充足的训练样本。习模型的训练提供充足的训练样本。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于目标定位和姿态估计的深度学习模型

[0001]本专利技术涉及深度学习
，尤其是一种用于目标定位和姿态估计的深度学习模型。

技术介绍

[0002]目标检测是计算机视觉领域中的经典问题，它将图像分割与目标识别两个任务合二为一个，直接从图像中识别出目标的位置和种类。目前，深度学习技术已经成为实现目标检测任务的主流方法。基于深度学习模型的目标检测算法在精度上已经远远超越了传统的计算机视觉算法。常用于目标检测的深度学习模型包括Fast RCNN、Faster RCNN、SSD、Yolo等。
[0003]然而，目前的深度学习模型仅能计算目标在二维图像中的位置，不能给出目标在世界坐标系下的位置以及绕X、Y、Z轴的旋转角度(即姿态)，而目标在世界坐标系下的位置和姿态，对机器人、自动驾驶等领域具有重要意义，也是计算机视觉的最终目标之一。目前，通过二维图像得到目标在世界坐标系下的位置，传统计算机视觉领域一般采用特征点匹配的方法，该方法的基础是物体成像公式其中x、y为空间中某点在相机拍摄形成的二维图像中的坐标，u、v、w为该点在三维空间世界坐标系中的坐标，代表相机的内参矩阵，代表由世界坐标系变换至相机坐标系需要进行的旋转和平移变换，代表由世界坐标系中的坐标变换至图像坐标系中所需要进行的变换，称为单应变换矩阵。
[0004]传统计算机视觉方法通过提取出图像的SIFT或SURF等特征点，与目标在特定已知位置下的图像进行特征点匹配，再利用RANSAC方法进行筛选，得到符合某单应变换矩阵的匹配内点，再利用这些内点估计...

【技术保护点】

【技术特征摘要】
1.一种用于目标定位和姿态估计的深度学习模型，其特征在于，向该深度学习模型输入二维图像，输出二维图像中目标物体的类别及其在该图像中的最小包围矩形，以及该目标物体在世界坐标系下的位置与姿态；该深度学习模型主要由多层特征提取模块和对应于每层特征提取模块的空间定位模块组成；特征提取模块提取图像信息形成特征图金字塔；空间定位模块为每层特征图中的每个点生成一个虚拟锚框，并输出该虚拟锚框中目标物体在二维图像中的最小包围矩形信息，该目标物体在世界坐标系下的位置信息与姿态信息，以及该目标物体的类别概率信息。对该深度学习模型进行训练时，根据训练数据中目标物体在二维图像中的中心位置以及与锚框的重叠程度，选择重叠度高的锚框输出进行训练。该深度学习模型执行目标定位和姿态估计任务时，空间定位模块为每层特征图中的每个点形成多个输出，其中包括中心在该点代表的锚框内的目标物体在二维图像中的最小包围矩形信息，该目标物体在世界坐标系下的位置信息与姿态信息，以及该目标物体的类别概率信息。选择所有特征图的所有位置的类别输出中属于任一类别概率超过预设阈值的输出，进行非极大值抑制后，作为整个模型的最终输出，该输出代表模型从输入的二维图像中识别出的目标物体信息。2.根据权利要求1所述的用于目标定位和姿态估计的深度学习模型，其特征在于，最小包围矩形信息包括目标在原始图像中的中心位置相对于锚框矩形中心位置的偏移量和目标在图像中的最小包围矩形相对于锚框矩形的高和宽的比例的对数函数值；目标的位置信息为目标物体在世界坐标系下的X、Y、Z轴坐标，目标的姿态信息为目标物体相于世界坐标系X、Y、Z轴的旋转角度；目标的类别概率信息为经过softmax函数输出的目标为某个类别的概率。3.根据权利要求2所述的用于目标定位和姿态估计的深度学习模型，其特征在于，每层特征提取模块由多个特征提取单元构成。4.根据权利要求1
‑
3任意一项所述的用于目标定位和姿态估计的深度学习模型，其特征在于，空间定位模块由最小包围矩形运算单元、空间位置运算单元、旋转角度运算单元和分类概率运算单元构成，每个运算单元通过神经网络对每层特征图进行运算，得到与该层特征图维度相同的多通道输出，包括4通道的最小包围矩形信息输出、3通道的空间位置信息输出、3通道的旋转角度信息输出、N通道的分类概率信息输出。5.根据权利要求4所述的用于目标定位和姿态估计的深度学习模型，其特征在于，当对该深度学习模型进行训练时，该深度学习模型的总误差L＝λ
...

【专利技术属性】
技术研发人员：林广栋，王强，黄光红，
申请(专利权)人：安徽芯纪元科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人