一种物体检测模型的训练及预测方法、装置、设备及介质制造方法及图纸

技术编号：25990275 阅读：23 留言：0更新日期：2020-10-20 18:58

本申请公开了一种物体检测模型的训练及预测方法、装置、设备及介质，涉及人工智能中深度学习和计算机视觉领域。具体方案为：将当前样本图像输入至待训练的物体检测模型，得到各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数；基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数；根据各个二维预测图像特征和其对应的二维检测框的预测参数，以及各个三维预测图像特征和其对应的三维检测框的预测参数，对物体检测模型进行训练。本申请实施例能够实现实时地二维三维联合检测，从而可以达到提高检测速度，降低检测成本的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种物体检测模型的训练及预测方法、装置、设备及介质
本申请涉及计算机
，进一步涉及人工智能中深度学习和计算机视觉领域，尤其是一种物体检测模型的训练及预测方法、装置、设备及介质。
技术介绍
现有技术在二维、三维检测领域主要有以下两种方法：基于激光雷达点云的三维物体检测方法和基于单目图像的三维物体检测方法；其中，基于激光雷达点云的三维物体检测方法，需要较为昂贵的激光雷达，且采集的点云具有稀疏和密度不一致性，在实际场景中应用局限性大、成本较高。另外，基于单目图像的三维物体检测方法，通过单目深度估计获取深度，并将图像转换为伪点云，再应用点云三维检测的方法，但是该方法需要深度估计网络、2D预检测网络和3D点云检测网络串接，速度较慢。
技术实现思路
本申请提供了一种物体检测模型的训练及预测方法、装置、设备及介质，能够实现实时地二维三维联合检测，从而可以达到提高检测速度，降低检测成本的目的。第一方面，本申请提供了一种物体检测模型的训练方法，所述方法包括：当待训练的物体检测模型不满足预先设置的收敛条件时，将当前样本图像输入至所述待训练的物体检测模型；通过所述待训练的物体检测模型对所述当前样本图像中的至少一个检测对象进行二维检测，得到各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数；基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数...

【技术保护点】
1.一种物体检测模型的训练方法，其特征在于，所述方法包括：/n当待训练的物体检测模型不满足预先设置的收敛条件时，将当前样本图像输入至所述待训练的物体检测模型；通过所述待训练的物体检测模型对所述当前样本图像中的至少一个检测对象进行二维检测，得到各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数；/n基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数；/n根据各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数，以及各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数，对所述物体检测模型进行训练，将下一个样本图像作为所述当前样本图像，重复执行上述操作，直到所述物体检测模型满足所述预先确定的收敛条件。/n

【技术特征摘要】
1.一种物体检测模型的训练方法，其特征在于，所述方法包括：
当待训练的物体检测模型不满足预先设置的收敛条件时，将当前样本图像输入至所述待训练的物体检测模型；通过所述待训练的物体检测模型对所述当前样本图像中的至少一个检测对象进行二维检测，得到各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数；
基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数；
根据各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数，以及各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数，对所述物体检测模型进行训练，将下一个样本图像作为所述当前样本图像，重复执行上述操作，直到所述物体检测模型满足所述预先确定的收敛条件。

2.根据权利要求1所述的方法，其特征在于，在所述基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数之前，所述方法还包括：
在全部的检测对象中提取出一个检测对象作为当前检测对象；根据所述当前检测对象对应的二维检测框的预测参数和预先确定的所述当前检测对象对应的二维检测框的真实参数，验证所述当前检测对象对应的二维检测框的预测参数和其对应的二维检测框的真实参数是否相匹配；
若所述当前检验对象对应的二维检测框的预测参数和其对应的二维检测框的真实参数相匹配，则将所述当前检测对象确定为匹配的检测对象，重复执行上述操作，直到在全部的检测对象中提取出全部匹配的检测对象；执行基于各个匹配的检测对象的二维预测图像特征和其对应的二维检测框的预测参数，通过所述待训练的物体检测模型对各个匹配的检测对象进行三维检测，得到各个匹配的检测对象的三维预测图像特征和其对应的三维检测框的预测参数的操作。

3.根据权利要求1所述的方法，其特征在于，所述二维检测框的预测参数至少包括：所述二维检测框的中心点的预测平面坐标、所述二维检测框的预测宽度和预测高度；所述三维检测框的预测参数至少包括：所述三维检测框的中心点的预测空间坐标、所述三维检测框的预测长度、预测宽度和预测高度、所述三维检测框中的检测对象的朝向角以及相机内参和地面法向量。

4.根据权利要求3所述的方法，其特征在于，所述基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数，包括：
基于各个检测对象对应的二维检测框的中心点的预测平面坐标以及各个检测对象对应的二维检测框的预测宽度和预测高度，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象对应的三维检测框的中心点的预测空间坐标；
基于各个检测对象的二维预测图像特征，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象的三维预测图像特征和其对应的三维检测框的预测长度、预测宽度和预测高度、各个检测对象对应的三维检测框中的检测对象的朝向角以及相机内参和地面法向量。

5.根据权利要求4所述的方法，其特征在于，所述基于各个检测对象的对应的二维检测框的中心点的预测平面坐标以及各个检测对象对应的二维检测框的预测宽度和预测高度，通过所述待训练的物体检测模型对各个检测对象进行三维检测，得到各个检测对象对应的三维检测框的中心点的空间坐标，包括：
根据各个检测对象对应的二维检测框的中心点的预测平面坐标、各个检测对象对应的二维检测框的预测宽度和预测高度以及预先确定的各个检测对象的网络训练目标，得到各个检测对象对应的三维检测框的中心点的预测投影坐标；
根据各个检测对象对应的三维检测框的中心点的预测投影坐标，得到各个检测对象对应的三维检测框的中心点的预测空间坐标。

6.根据权利要求5所述的方法，其特征在于，在所述根据各个检测对象对应的二维检测框的中心点的预测平面坐标、各个检测对象对应的二维检测框的预测宽度和预测高度以及预先确定的各个检测对象的网络训练目标，得到各个检测对象对应的三维检测框的中心点的图像投影坐标之前，所述方法还包括：
根据预先确定的各个检测对象的真实空间坐标，计算出各个检测对象对应的三维检测框的中心点的真实投影坐标；
基于各个检测对象对应二维检测框的中心点的真实投影坐标和各个检测对象的真实空间坐标以及预先确定的各个检测对象对应的二维检测框的真实宽度和真实高度，计算出各个检测对象的网络训练目标。

7.根据权利要求1所述的方法，其特征在于，所述根据各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数，以及各个检测对象的三维图像特征和其对应的三维检测框的预测参数，对所述物体检测模型进行训练，包括：
使用预先设定的二维检测阶段对应的损失函数，计算各个检测对象的二维预测数据与预先确定的各个检测对象的二维真实数据的二维差异；其中，所述二维预测数据包括：各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数；所述二维真实数据包括：各个检测对象的二维真实图像特征和其对应的二维检测框的真实参数；
使用预先设定的三维检测阶段对应的损失函数，计算各个检测对象的三维预测数据与预先确定的各个检测对象的三维真实数据的三维差异，其中，所述三维预测数据包括：各个检测对象的三维预测图像特征和其对应的三维检测框的预测参数；所述三维真实数据包括：各个检测对象的三维真实图像特征和其对应的三维检测框的真实参数；
基于所述二维差异和所述三维差异对物体检测模型进行训练。

8.一种物体检测模型的预测方法，其特征在于，所述方法包括：
将待检测图像输入至预先训练的物体检测模型；通过所述预先训练的物体检测模型对所述待检测图像中的至少一个检测对象进行二维检测，得到各个检测对象的二维预测图像特征和其对应的二维检测框的预测参数；
基于各个检测对象的二维预测图像特征以及对应的二维检测框的预测参数，通过...

【专利技术属性】
技术研发人员：叶晓青，谭啸，孙昊，章宏武，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人