【技术实现步骤摘要】
模型训练方法、目标检测方法、装置、设备以及存储介质
[0001]本公开涉及人工智能
中的计算机视觉、图像处理、增强现实、深度学习、智能机器人、自动驾驶等
,尤其涉及一种模型训练方法、目标检测方法、装置、设备以及存储介质。
技术介绍
[0002]随着人工智能技术的发展,可通过传感器感知周围环境,并基于传感器的传感数据检测周围环境中的人、车辆等三维目标。
[0003]相关技术中,在单目的三维目标检测方法中,传感数据包括雷达传感器采集周围场景得到的点云数据和相机传感器采集周围场景得到的图像数据。在模型训练中,需在传感数据上进行三维标注,基于传感数据上的三维标注,进行目标检测网络的有监督训练。
[0004]然而,三维标注过程复杂,耗时长且对标注人员的专业性要求高,无法大规模数据标注,导致海量数据无法使用,进而导致目标检测精度较低。
技术实现思路
[0005]本公开提供了一种用于提高三维目标检测的检测精度的模型训练方法、目标检测方法、装置、设备以及存储介质。
[0006]根据本公开的第一方面,提供了一种模型训练方法,包括:
[0007]获取训练数据,所述训练数据包括训练图像和所述训练图像的二维标签;
[0008]将所述训练图像输入目标检测网络,在所述目标检测网络中对所述训练图像进行目标检测,得到所述训练图像的目标检测结果,所述目标检测结果包括所述训练图像上对象的二维预测属性和所述对象的三维预测属性;
[0009]根据所述二维标签和所述目标检测结果,确定 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,包括:获取训练数据,所述训练数据包括训练图像和所述训练图像的二维标签;将所述训练图像输入目标检测网络,在所述目标检测网络中对所述训练图像进行目标检测,得到所述训练图像的目标检测结果,所述目标检测结果包括所述训练图像上对象的二维预测属性和所述对象的三维预测属性;根据所述二维标签和所述目标检测结果,确定训练损失值;根据所述训练损失值,对所述目标检测网络的网络参数进行调整。2.根据权利要求1所述的模型训练方法,其中,所述根据所述二维标签和所述目标检测结果,确定训练损失值,包括:从所述二维标签中获取所述对象的二维真实属性;根据所述二维真实属性和所述二维预测属性,确定第一损失值;根据所述二维真实属性和所述三维预测属性,确定第二损失值;对所述第一损失值和所述第二损失值进行融合,得到所述训练损失值。3.根据权利要求2所述的模型训练方法,其中,所述三维预测属性反映所述对象在三维空间的位置预测情况,所述二维真实属性反映所述对象在所述训练图像上的真实图像位置,所述第二损失值包括空间位置预测损失,所述根据所述二维真实属性和所述三维预测属性,确定第二损失值,包括:对所述三维预测属性和所述二维真实属性进行位置比较,确定空间位置预测损失。4.根据权利要求3所述的模型训练方法,其中,所述三维预测属性包括所述对象的预测空间位置、所述对象的预测空间姿态和所述对象的预测空间尺寸,所述二维真实属性包括所述对象的真实目标框,所述对所述三维预测属性和所述二维真实属性进行位置比较,确定空间位置预测损失,包括:根据所述预测空间位置、所述预测空间姿态和所述预测空间尺寸,确定所述对象的三维预测框;将所述三维预测框投影至所述训练图像上,得到所述对象的投影框;根据所述投影框和所述真实目标框,得到所述空间位置预测损失。5.根据权利要求4所述的模型训练方法,其中,所述根据所述投影框和所述真实目标框,得到所述空间位置预测损失值,包括:确定所述投影框的最小包围框;通过交并比损失函数,比较所述最小包围框和所述真实目标框,得到所述空间位置预测损失。6.根据权利要求3所述的模型训练方法,其中,所述第二损失值还包括距离损失,所述根据所述二维真实属性和所述三维预测属性,确定第二损失值,还包括:根据所述三维预测属性,确定所述对象的横坐标、所述对象的纵坐标以及所述对象的深度,所述对象为多个;根据所述对象的横坐标,在所述对象中筛选第一对象和第二对象,所述第一对象与所述第二对象的横坐标距离小于距离阈值;利用成像原理,基于所述第一对象的纵坐标、所述第二对象的纵坐标、所述第一对象的深度和所述第二对象的深度,确定所述距离损失。
7.根据权利要求2
‑
6中任一项所述的模型训练方法,其中,所述二维真实属性包括所述对象的真实类别和所述对象的真实图像位置,所述二维预测属性包括所述对象的预测类别和所述对象的预测图像位置,所述第一损失值包括类别预测损失和图像位置预测损失,所述根据所述二维真实属性和所述二维预测属性,确定第一损失值,包括:对所述真实类别和所述预测类别进行比较,得到所述类别预测损失;对所述真实图像位置和所述预测图像位置进行比较,得到所述图像位置预测损失。8.根据权利要求1
‑
6中任一项所述的模型训练方法,其中,所述目标检测网络包括特征提取网络、二维预测网络和三维预测网络,所述将所述训练图像输入目标检测网络,在所述目标检测网络中对所述训练图像进行目标检测,得到所述训练图像的目标检测结果,包括:将所述训练图像输入所述特征提取网络,在所述特征提取网络中对所述训练图像进行特征提取,得到所述训练图像的图像特征;将所述图像特征输入所述二维预测网络,在所述二维预测网络中基于所述图像特征进行二维属性预测,得到所述二维预测属性;将所述图像特征输入所述三维预测网络,在所述三维预测网络中基于所述图像特征进行三维属性预测,得到所述三维预测属性。9.一种目标检测方法,包括:获取待检测图像;将所述待检测图像输入目标检测网络,在所述目标检测网络中对所述待检测图像进行目标检测,得到所述待检测图像的目标检测结果,所述目标检测结果包括所述待检测图像上对象的三维预测属性,其中,所述目标检测网络通过权利要求1
‑
8中任一项所述的模型训练方法训练得到。10.一种模型训练装置,包括:训练数据获取单元,用于获取训练数据,所述训练数据包括训练图像和所述训练图像的二维标签;目标检测单元,用于将所述训练图像输入目标检测网络,在所述目标检测网络中对所述训练图像进行目标检测,得到所述训练图像的目标检测结果,所述目标检测结果包括所述训练图像上对象的二维预测属性和所述对象的三维预测属性;损失确定单元,用于根据所述二维标签和所述目标检测结果,确定训练损失值;参数调整单元,用于根据所述训练损失值,对所述目...
【专利技术属性】
技术研发人员:邹智康,叶晓青,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。