【技术实现步骤摘要】
目标检测模型的训练方法及检测目标对象的方法、装置
[0001]本公开涉及人工智能
,具体涉及计算机视觉和深度学习
,可应用于智能家居和智慧城市场景下。
技术介绍
[0002]随着人工智能的发展,以卷积神经网络为代表的深度学习在目标检测、图像分类等领域得到了广泛应用。例如,在手势识别场景下,可以将人手作为待检测目标来建立目标检测任务。
[0003]在人数较多的场景下,手势指令通常会受到除指令发布者的人手外其他人手的干扰,难以保证手势识别的准确性。类似于该手势识别场景,检测可以相对于目标对象的中心点移动的子对象的场景,均存在识别不准确的问题。
技术实现思路
[0004]本公开提供了一种提高检测精度的目标检测模型的训练方法及检测目标对象的方法、装置、设备和存储介质。
[0005]根据本公开的一个方面,提供了一种目标检测模型的训练方法,其中,目标检测模型包括特征提取网络、目标检测网络和条件随机场网络;该方法包括:将样本图像输入特征提取网络,得到第一特征数据,其中,样本图像具有标签,该标签指示样本图像中第一目标对象的第一实际位置和第一目标对象针对第二目标对象的实际条件概率;将第一特征数据输入目标检测网络,得到第一目标对象的第一预测位置和第一目标对象针对第一预测位置的第一出现概率;将第一特征数据输入条件随机场网络,得到第一目标对象针对第二目标对象的第一条件概率;以及基于第一实际位置、第一预测位置、第一出现概率、实际概率和第二出现概率,对目标检测模型进行训练。其中,第二目标对象包含第一目 ...
【技术保护点】
【技术特征摘要】
1.一种目标检测模型的训练方法,其中,所述目标检测模型包括特征提取网络、目标检测网络和条件随机场网络;所述方法包括:将样本图像输入所述特征提取网络,得到第一特征数据,其中,所述样本图像具有标签,所述标签指示所述样本图像中第一目标对象的第一实际位置和所述第一目标对象针对第二目标对象的实际条件概率;将所述第一特征数据输入所述目标检测网络,得到第一目标对象的第一预测位置和所述第一目标对象针对所述第一预测位置的第一出现概率;将所述第一特征数据输入所述条件随机场网络,得到所述第一目标对象针对所述第二目标对象的第一条件概率;以及基于所述第一实际位置、所述第一预测位置、所述第一出现概率、所述实际条件概率和所述第一条件概率,对所述目标检测模型进行训练,其中,所述第二目标对象包含所述第一目标对象,且所述第一目标对象能够相对于所述第二目标对象的中心移动。2.根据权利要求1所述的方法,其中,得到第一目标对象的第一预测位置和所述第一目标对象针对所述第一预测位置的第一出现概率包括:将所述第一特征数据输入所述目标检测网络,得到针对所述第一目标对象的热图,所述热图中各个点指示所述第一目标对象的中心位于所述各个点的概率;以及基于所述热图中的峰值点确定所述第一目标对象的预测中心位置,并确定所述峰值点指示的概率为所述第一出现概率。3.根据权利要求2所述的方法,其中,所述目标检测网络包括中心定位单元和尺寸回归单元;得到第一目标对象的第一预测位置和所述第一目标对象针对所述第一预测位置的第一出现概率还包括:将所述第一特征数据输入所述尺寸回归单元,得到所述第一目标对象的预测高度和预测宽度,其中,所述热图是通过将所述第一特征数据输入所述中心定位单元获得的。4.根据权利要求1所述的方法,还包括:将所述图像特征数据输入所述目标检测网络,得到所述第二目标对象的第二预测位置和所述第二目标对象针对所述第二预测位置的第二出现概率;其中,所述标签还指示所述第二目标对象的第二实际位置;对所述目标检测模型进行训练包括:基于所述第一实际位置、所述第一预测位置、所述第一出现概率、所述实际条件概率、所述第一条件概率、所述第二实际位置和所述第二预测位置,对所述目标检测模型进行训练。5.根据权利要求1所述的方法,其中,对所述目标检测模型进行训练包括:基于所述第一实际位置、所述第一预测位置和所述第一出现概率,确定预定损失函数中第一回归损失子函数的取值,得到第一取值;基于所述第一实际位置和所述第一预测位置,确定预定损失函数中定位损失子函数的取值,得到第二取值;基于所述实际条件概率和所述第一条件概率,确定预定损失函数中第二回归损失子函
数的取值,得到第三取值;以及基于所述第一取值、所述第二取值和所述第三取值,对所述目标检测模型进行训练。6.根据权利要求1~5中任一项所述的方法,其中,所述目标检测模型包括训练时间友好网络模型。7.一种采用目标检测模型检测目标对象的方法,其中,所述目标检测模型包括特征提取网络、目标检测网络和条件随机场网络;所述方法包括:将待检测图像输入所述特征提取网络,得到第二特征数据;将所述第二特征数据输入所述目标检测网络,得到第一目标对象的第三预测位置和所述第一目标对象针对所述第三预测位置的第三出现概率;将所述第二特征数据输入所述条件随机场网络,得到所述第一目标对象针对第二目标对象的第二条件概率;以及基于所述第三出现概率和所述第二条件概率,确定所述待检测图像包括的第一目标对象,其中,所述第二目标对象包含所述第一目标对象,且所述第一目标对象能够相对于所述第二目标对象的中心移动;所述目标检测模型是采用权利要求1~6中任一项所述的方法训练得到的。8.根据权利要求7所述的方法,其中,确定所述待检测图像包括的第一目标对象包括:基于所述第三出现概率和所述第二条件概率,确定所述第一目标对象的目标出现概率;以及确定目标出现概率高于预定阈值的第一目标对象为所述待检测图像包括的第一目标对象。9.一种目标检测模型的训练装置,其中,所述目标检测模型包括特征提取网络、目标检测网络和条件随机场网络;所述装置包括:第一特征数据获得模块,用于将样本图像输入所述特征提取网络,得到第一特征数据,其中,所述样本图像具有标签,所述标签指示所述样本图像中第一目标对象的第一实际位置和所述第一目标对象针对第二目标对象的实际条件概率;第一目标检测模块,用于将所述第一特征数据输入所述目标检测网络,得...
【专利技术属性】
技术研发人员:张健,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。