System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 行人检测模型的训练方法及相关产品技术_技高网

行人检测模型的训练方法及相关产品技术

技术编号:40752584 阅读:3 留言:0更新日期:2024-03-25 20:07
本发明专利技术公开一种行人检测模型的训练方法及相关产品,其中方法包括:将训练数据输入至行人检测模型,获取所述行人检测模型的输出数据,其中,所述训练数据中会对背景样本进行额外标注;若所述输出数据为背景样本,将所述背景样本合并至负样本进行损失计算;若所述输入样本不为背景样本,分割正样本和负样本;至少基于所述框信息标签和所述密度信息标签计算损失并基于所述损失更新所述行人检测模型的参数。本发明专利技术实施例通过判断输出数据是否为背景样本来进行决策,当为背景样本时采用损失计算,不为背景样本时利用高斯核函数信息来辅助训练来解决密集人群遮挡的问题,同时在改善嘈杂背景的时候也不会对场景中的正样本产生影响。

【技术实现步骤摘要】

本专利技术涉及行人检测,尤其涉及一种行人检测模型的训练方法及相关产品


技术介绍

1、在现有技术中行人检测主要运用于安防和自动驾驶等领域,其目的是从图像或视频中把行人的位置寻找出来。行人检测是很多其他视觉任务的基础,例如行人重识别、行人跟踪和行人动作识别等。由于行人场景中存在许多和行人外观十分相似的背景异物,导致行人检测系统在这些场景中会出现错误检测的状况,降低了行人检测的精确度。

2、现有的深度学习网络,只有在图像中存在正样本,才会计算此图像中的loss(损失),当图像中不存在正样本时,则无法计算此图像中的loss,进而不能学习到嘈杂的背景;与此同时,在透视变化严重的图像中,现有网络对不同尺度的目标图像虽然采用多尺度输出,更多的是增加网络层数,但还是不能保证在透视变化严重图像中的检出率和正确率。对于在嘈杂的背景,现有技术更多是数据预处理阶段,将正样本拼接到背景图像中,进而计算图像loss;对于透视变化严重的图像,现有技术一般会采用增加网络层数,通过多尺度输出,来提取更多的图像特征,学习到更多目标特征,进而确保检出率和正确率。

3、专利技术人发现:背景图像因为是拼接的图像,所以不是真实的场景图像,虽然学到了一些背景信息,但是因为拼接的正样本和背景图像存在一定的区别,神经网络学习到的是全局信息,这会对正样本检出数据产生影响,无法保证在透视变化严重图像中的检出率和正确率。


技术实现思路

1、本专利技术实施例旨在至少解决上述技术问题之一。

2、第一方面,本专利技术实施例提供一种行人检测模型的训练方法,包括:将训练数据输入至行人检测模型,获取所述行人检测模型的输出数据,其中,所述训练数据中对背景样本进行额外标注;若所述输出数据为背景样本,将所述背景样本合并至负样本进行损失计算;若所述输入样本不为背景样本,分割正样本和负样本,其中,所述正样本具有框信息标签和密度信息标签,所述密度信息是由框的中心点利用高斯自适应核生成一个人体范围得到;至少基于所述框信息标签和所述密度信息标签计算损失并基于所述损失更新所述行人检测模型的参数。

3、第二方面,本专利技术实施例提供一种行人检测模型的训练装置,包括:输入模块,用于将训练数据输入至行人检测模型,获取所述行人检测模型的输出数据,其中,所述训练数据中对背景样本进行额外标注;判断模块,用于若所述输出数据为背景样本,将所述背景样本合并至负样本进行损失计算;若所述输入样本不为背景样本,分割正样本和负样本,其中,所述正样本具有框信息标签和密度信息标签,所述密度信息是由框的中心点利用高斯自适应核生成一个人体范围得到;计算模块,用于至少基于所述框信息标签和所述密度信息标签计算损失并基于所述损失更新所述行人检测模型的参数。

4、第三方面,本专利技术实施例提供一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的行人检测模型的训练方法的步骤。

5、第四方面,本专利技术实施例提供一种移动装置,包括本体和所述本体上安装的本专利技术任一实施例所述的电子设备。

6、第五方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本专利技术任一实施例的行人检测模型的训练方法的步骤。

7、第六方面,本专利技术实施例还提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本专利技术实施例中任意一项所述的行人检测模型的训练方法。

8、本专利技术实施例的有益效果在于:根据判断输出数据是否为背景样本来进行决策,当为背景样本时采用损失计算,不为背景样本时利用高斯核函数信息来辅助训练以解决密集人群遮挡的问题,同时在改善嘈杂背景的时候也不会对场景中的正样本产生影响,实现了即使在没有正样本图像时也能学习背景信息,同时在不增加网络层数的情况下,解决密集人群遮挡严重的图像数据。

本文档来自技高网...

【技术保护点】

1.一种行人检测模型的训练方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述损失包括分类损失、框回归损失和欧式距离损失,其中,所述框回归损失与所述框信息标签相关,所述欧式距离损失与所述密度信息标签相关。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,在所述将训练数据输入至行人检测模型之前,所述方法还包括:

7.一种行人检测模型的训练装置,包括:

8.一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述方法的步骤。

9.一种移动装置,包括本体以及安装在所述本体上的根据权利要求10所述的电子设备。

10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种行人检测模型的训练方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述损失包括分类损失、框回归损失和欧式距离损失,其中,所述框回归损失与所述框信息标签相关,所述欧式距离损失与所述密度信息标签相关。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,在所述将训练数据输入至行人检测模型之前,所述方...

【专利技术属性】
技术研发人员:贾帅和
申请(专利权)人:北京智行者科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1