【技术实现步骤摘要】
目标检测模型的训练、目标检测方法、装置、设备和介质
[0001]本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术,可应用于3D视觉场景下,尤其涉及目标检测模型的训练、目标检测方法、装置、设备和介质。
技术介绍
[0002]计算机视觉技术正是想要赋予计算机人类的视觉识别和定位的功能。通过复杂的图像计算,计算机能够识别和定位出目标对象。
[0003]3D目标检测主要是检测3D物体,其中,3D物体通常以空间坐标(x,y,z)、尺寸大小(长,宽,高)和朝向角等参数表示。
技术实现思路
[0004]本公开提供了一种目标检测模型的训练、目标检测方法、装置、设备和介质。
[0005]根据本公开的一方面,提供了一种目标检测模型的训练方法,包括:
[0006]将样本图像输入至第一目标检测模型的点云特征提取网络中,得到生成点云的图像特征;
[0007]将所述生成点云的图像特征输入至所述第一目标检测模型的第一鸟瞰图特征提取网络中,得到第一鸟瞰图特征;
[0008]将所述第一鸟瞰图特征输入至所述第一目标检测模型的预测网络中,得到第一检测结果;
[0009]根据所述样本图像的标准3D识别结果和所述第一检测结果,计算第一损失,并根据所述第一损失,训练所述第一目标检测模型。
[0010]根据本公开的一方面,还提供了一种目标检测方法,包括:
[0011]将图像输入至目标检测模型中,在所述图像中识别3D目标空间,以及所述3D目标空间的目标类别;
[0012 ...
【技术保护点】
【技术特征摘要】
1.一种目标检测模型的训练方法,包括:将样本图像输入至第一目标检测模型的点云特征提取网络中,得到生成点云的图像特征;将所述生成点云的图像特征输入至所述第一目标检测模型的第一鸟瞰图特征提取网络中,得到第一鸟瞰图特征;将所述第一鸟瞰图特征输入至所述第一目标检测模型的预测网络中,得到第一检测结果;根据所述样本图像的标准3D识别结果和所述第一检测结果,计算第一损失,并根据所述第一损失,训练所述第一目标检测模型。2.根据权利要求1所述的方法,其中,所述将样本图像输入至第一目标检测模型的点云特征提取网络中,得到生成点云的图像特征,包括:将样本图像输入至所述点云特征提取网络中的编码器中,得到所述样本图像的图像特征;将所述图像特征输入至深度预测网络中,得到所述样本图像中像素点的深度;根据所述样本图像中像素点的深度,将所述样本图像中像素点转换为生成点云,并根据所述图像特征确定所述生成点云的图像特征。3.根据权利要求2所述的方法,其中,所述将所述图像特征输入至深度预测网络中,得到所述样本图像中像素点的深度,包括:将所述图像特征输入至深度预测网络中,确定所述样本图像中像素点在预设的备选深度区间对应的深度预测置信度;根据各所述备选深度区间的中间深度值,和所述像素点在各所述备选深度区间对应的深度预测置信度,计算所述像素点的深度。4.根据权利要求3所述的方法,还包括:获取采集点云,所述采集点云与所述样本图像对应于同一采集场景;在所述采集点云中,获取感兴趣点云;根据所述感兴趣点云的深度,对所述采集点云对应的采集场景的深度进行区间划分,确定备选深度区间。5.根据权利要求1所述的方法,还包括:将采集点云输入至第二目标检测模型中,得到第二鸟瞰图特征;根据所述第一鸟瞰图特征和所述第二鸟瞰图特征,确定特征差值,并根据所述特征差值和标准区域,计算特征一致性损失,其中,所述标准区域为所述标准3D识别结果投影在所述样本图像中的区域;所述根据所述第一损失,训练所述第一目标检测模型,包括:根据所述第一损失和所述特征一致性损失,训练所述第一目标检测模型。6.根据权利要求5所述的方法,其中,所述第一鸟瞰图特征包括所述第一鸟瞰图特征提取网络中至少一个第一特征层输出的特征;所述第二目标检测模型包括第二鸟瞰图特征提取网络,所述第二鸟瞰图特征包括所述第二鸟瞰图特征提取网络中至少一个第二特征层输出的特征,所述第一特征层与所述第二特征层对应;所述根据所述第一鸟瞰图特征和所述第二鸟瞰图特征,确定特征差值,包括:
根据所述第一特征层输出的特征与对应的第二特征层输出的特征之间的差异,计算所述第一特征层对应的差值,并确定特征差值。7.根据权利要求5所述的方法,其中,所述第一检测结果包括:第一类别置信度;所述方法,还包括:将采集点云输入至第二目标检测模型中,得到第二检测结果,所述第二检测结果包括第二类别置信度;在所述第一检测结果和所述第二检测结果匹配的情况下,根据所述第一检测结果包括的第一类别置信度和所述第二检测结果包括的第二类别置信度,计算所述第一检测结果的置信度损失,并确定置信度一致性损失;所述根据所述第一损失和所述特征一致性损失,训练所述第一目标检测模型,包括:根据所述第一损失、所述特征一致性损失和所述置信度一致性损失,训练所述第一目标检测模型。8.一种目标检测方法,包括:将图像输入至目标检测模型中,在所述图像中识别3D目标空间,以及所述3D目标空间的目标类别;其中,所述目标检测模型是根据如权利要求1至7中任一项所述的目标检测模型的训练方法训练得到。9.一种目标检测模型的训练装置,包括:生成点云特征提取模块,用于将样本图像输入至第一目标检测模型的点云特征提取网络中,得到生成点云的图像特征;鸟瞰图特征提取模块,用于将所述生成点云的图像特征输入至所述第一目标检测模型的第一鸟瞰图特征提取网络中,得到第一鸟瞰图特征;第一检测结果获取模块,用于将所述第一鸟瞰图特征输入至所述第一目标检测模型的预测网络中,得到第一检测结果;第一损失计算模块,用于根据所述样本图像的标准3D识别结果和所述第一检测结果,计算第一损失,并根据所述第一损失,训练所述第一目标检测模型。10.根...
【专利技术属性】
技术研发人员:叶晓青,谭啸,孙昊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。