行人检测模型的训练方法及其装置、行人检测方法制造方法及图纸

技术编号:37054158 阅读:6 留言:0更新日期:2023-03-29 19:31
本申请涉及一种行人检测模型的训练方法及其装置、行人检测方法。方法包括:获取车身周围环境的环视多张图像,并拼接得到鸟瞰图像;获取鸟瞰图像中标注的行人腿部接地点;将鸟瞰图像输入至待训练的行人检测模型中进行处理,输出鸟瞰图像的响应特征图和表征特征图;根据响应特征图和表征特征图,得到预测的行人腿部接地点以及行人腿部接地点的所属行人;根据标注的行人腿部接地点和预测的行人腿部接地点的差异、同一行人的行人腿部接地点的特征距离约束以及不同行人的行人腿部接地点的特征距离约束,调整行人检测模型,得到训练好的行人检测模型。采用本方法能够降低行人检测的复杂性,提高行人检测的准确性。提高行人检测的准确性。提高行人检测的准确性。

【技术实现步骤摘要】
行人检测模型的训练方法及其装置、行人检测方法


[0001]本申请涉及行人检测
,特别是涉及一种行人检测模型的训练方法及其装置、行人检测方法。

技术介绍

[0002]在自动驾驶领域,BEV空间做检测分割等任务已经受到广泛的关注。借助自车上安装的多个环视相机等设备,经过数据采集、标定标注、深度学习模型训练、测试部署等使得自车具备感知周围环境的能力。停车场环境下,车速慢,遮挡严重,为保障行车安全,需要进行行人检测。
[0003]相关技术中,采取单目3D行人检测技术来实现对行人的检测,但是,单目3D行人检测技术需要采取3D框来对行人进行标注处理,导致回归的信息维度高,且3D框表征也较为复杂,导致检测的复杂性过高,且检测准确性不高。因此,如何降低行人检测的复杂性并提高检测的准确性,成为本领域技术人员亟需解决的技术问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高行人检测准确性且降低行人检测复杂性的行人检测模型的训练方法及其装置、行人检测方法。
[0005]第一方面,本申请提供了一种行人检测模型的训练方法。所述方法包括:获取车身周围环境的环视多张图像;将所述环视多张图像进行逆透视变换,并拼接得到鸟瞰图像;获取所述鸟瞰图像中标注的行人腿部接地点;将所述鸟瞰图像输入至待训练的行人检测模型中进行处理,输出所述鸟瞰图像的响应特征图和表征特征图;根据所述响应特征图和所述表征特征图,得到预测的行人腿部接地点以及所述行人腿部接地点的所属行人;根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异、同一行人的所述行人腿部接地点的特征距离约束以及不同行人的所述行人腿部接地点的特征距离约束,调整所述行人检测模型,直到所述行人检测模型收敛时,得到训练好的行人检测模型;所述行人检测模型用于进行行人检测。
[0006]在其中一个实施例中,所述根据所述响应特征图和所述表征特征图,得到预测的行人腿部接地点以及所述行人腿部接地点的所属行人,包括:根据所述响应特征图,得到预测的行人腿部接地点;获取所述行人腿部接地点在所述表征特征图上的接地点特征向量;根据任意两个行人腿部接地点的接地点特征向量,计算任意两个行人腿部接地点的特征距离;根据所述任意两个行人腿部接地点的特征距离,确定所述两个行人腿部接地点是
否属于同一行人。
[0007]在其中一个实施例中,所述根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异、同一行人的所述行人腿部接地点的特征距离约束以及不同行人的所述行人腿部接地点的特征距离约束,调整所述行人检测模型,包括:根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异,计算接地点的位置回归损失;计算同一行人的所述行人腿部接地点的特征距离的第一距离损失;所述第一距离损失的目标为缩小同一行人的两个行人腿部接地点的特征距离;计算不同行人的所述行人腿部接地点的特征距离的第二距离损失;所述第二距离损失的目标为拉大不同行人的两个行人腿部接地点的特征距离;根据接地点的位置回归损失、第一距离损失和第二距离损失得到总损失,并根据所述总损失调整所述行人检测模型。
[0008]第二方面,本申请实施例提供了一种行人检测方法。所述方法包括:获取车身周围环境的环视多张图像;将所述环视多张图像进行逆透视变换,并拼接得到鸟瞰图像;将所述鸟瞰图像输入预先训练好的行人检测模型,通过所述行人检测模型输出响应特征图和表征特征图;根据所述响应特征图确定行人腿部接地点;获取各所述行人腿部接地点在所述表征特征图上接地点特征向量;根据各所述接地点特征向量,确定所述鸟瞰图像中的行人以及每个行人的行人腿部接地点。
[0009]在其中一个实施例中,所述根据各所述接地点特征向量,确定所述鸟瞰图像中的行人以及每个行人的行人腿部接地点,包括:计算各所述接地点特征向量之间的距离,得到特征距离;若所述特征距离小于距离阈值,确定所述特征距离对应的两个行人腿部接地点属于同一行人。
[0010]在其中一个实施例中,所述方法还包括:若所述特征距离大于距离阈值,确定所述特征距离对应的两个行人腿部接地点属于不同行人。
[0011]在其中一个实施例中,所述方法还包括:将每个行人对应的行人腿部接地点进行映射处理,得到对应的行人检测结果;所述行人检测结果包括位置信息。
[0012]第三方面,本申请还提供了一种行人检测模型的训练装置。所述装置包括:环视图像获取模块,用于获取车身周围环境的环视多张图像;图像拼接模块,将所述环视多张图像进行逆透视变换,并拼接得到鸟瞰图像接地点获取模块,用于获取所述鸟瞰图像中标注的行人腿部接地点;第一处理模块,用于将所述鸟瞰图像输入至待训练的行人检测模型中进行处理,输出所述鸟瞰图像的响应特征图和表征特征图;预测模块,用于根据所述响应特征图和所述表征特征图,得到预测的行人腿部接
地点以及所述行人腿部接地点的所属行人;训练模块,用于根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异、同一行人的所述行人腿部接地点的特征距离约束以及不同行人的所述行人腿部接地点的特征距离约束,调整所述行人检测模型,直到所述行人检测模型收敛时,得到训练好的行人检测模型;所述行人检测模型用于进行行人检测。
[0013]第四方面,本申请实施例提供了一种行人检测装置,所述装置包括:环视图像获取模块,用于获取车身周围环境的环视多张图像;图像拼接模块,用于将多个所述环视图像进行逆透视变换,并拼接得到鸟瞰图像;第二处理模块,用于将所述鸟瞰图像输入预先训练好的行人检测模型,通过所述行人检测模型输出响应特征图和表征特征图;行人腿部接地点确定模块,用于根据所述响应特征图确定行人腿部接地点;向量获取模块,用于获取各所述行人腿部接地点在所述表征特征图上接地点特征向量;行人确定模块,用于根据各所述接地点特征向量,确定所述鸟瞰图像中的行人以及每个行人的行人腿部接地点。
[0014]第五方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的行人检测模型的训练方法的步骤;或者,实现行人检测方法的步骤。
[0015]第六方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的行人检测模型的训练方法的步骤;或者,实现行人检测方法的步骤。
[0016]第七方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的行人检测模型的训练方法的步骤;或者,实现行人检测方法的步骤。
[0017]上述行人检测模型的训练方法及其装置、行人检测方法,通过在环视多张图像拼接得到的鸟瞰图像中标注行人腿部接地点,从而降低了标注的复杂性和成本,进而降低了后续处理的复杂性,将鸟瞰图像输入至待训练的行人检测模型中进行处理,输出鸟瞰图像的响应特征图和表征特征图,然后再依据响应特征图和表征特征图,得到预测的行人腿部接地点和行人腿部接地点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种行人检测模型的训练方法,其特征在于,所述方法包括:获取车身周围环境的环视多张图像;将所述环视多张图像进行逆透视变换,并拼接得到鸟瞰图像;获取所述鸟瞰图像中标注的行人腿部接地点;将所述鸟瞰图像输入至待训练的行人检测模型中进行处理,输出所述鸟瞰图像的响应特征图和表征特征图;根据所述响应特征图和所述表征特征图,得到预测的行人腿部接地点以及所述行人腿部接地点的所属行人;根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异、同一行人的所述行人腿部接地点的特征距离约束以及不同行人的所述行人腿部接地点的特征距离约束,调整所述行人检测模型,直到所述行人检测模型收敛时,得到训练好的行人检测模型;所述行人检测模型用于进行行人检测。2.根据权利要求1所述的方法,其特征在于,所述根据所述响应特征图和所述表征特征图,得到预测的行人腿部接地点以及所述行人腿部接地点的所属行人,包括:根据所述响应特征图,得到预测的行人腿部接地点;获取所述行人腿部接地点在所述表征特征图上的接地点特征向量;根据任意两个行人腿部接地点的接地点特征向量,计算任意两个行人腿部接地点的距离;根据所述任意两个行人腿部接地点的距离,确定所述两个行人腿部接地点是否属于同一行人。3.根据权利要求2所述的方法,其特征在于,所述根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异、同一行人的所述行人腿部接地点的特征距离约束以及不同行人的所述行人腿部接地点的特征距离约束,调整所述行人检测模型,包括:根据所述标注的行人腿部接地点和预测的行人腿部接地点的差异,计算接地点的位置回归损失;计算同一行人的所述行人腿部接地点的特征距离的第一距离损失;所述第一距离损失的目标为缩小同一行人的两个行人腿部接地点的特征距离;计算不同行人的所述行人腿部接地点的特征距离的第二距离损失;所述第二距离损失的目标为拉大不同行人的两个行人腿部接地点的特征距离;根据所述接地点的位置回归损失、所述第一距离损失和所述第二距离损失得到总损失,并根据所述总损失调整所述行人检测模型。4.一种行人检测方法,其特征在于,所述方法包括:获取车身周围环境的环视多张图像;将所述环视多张图像进行逆透视变换,并拼接得到鸟瞰图像;将所述鸟瞰图像输入预先训练好的行人检测模型,通过所述行人检测模型输...

【专利技术属性】
技术研发人员:居聪刘国清杨广王启程郑伟
申请(专利权)人:深圳佑驾创新科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1