一种基于多模型的行人检测方法、装置及存储介质制造方法及图纸

技术编号:37639534 阅读:12 留言:0更新日期:2023-05-25 10:06
本发明专利技术涉及图像识别技术领域,具体提供一种基于多模型的行人检测方法、装置及存储介质,方法包括以下步骤:获取不同场景下的行人图像;基于全图标注对所述行人图像进行行人检测标注,基于抠图标注对所述行人图像进行行人属性标注;基于第一模型和所述行人检测标注获取第一检测结果,基于第二模型和所述行人属性标注获取第二检测结果,基于所述第一检测结果、所述第二检测结果和第三模型获取行人分类结果。本申请采用了两个模型分两阶段来进行行人检测的精确定位,选择Vargnet这种轻量级的网络作为训练模型,适合安装在内存小,环境复杂的车载终端GPU上,能够又好又快地完成行人检测。检测。检测。

【技术实现步骤摘要】
一种基于多模型的行人检测方法、装置及存储介质


[0001]本专利技术属于图像识别
,具体涉及一种基于多模型的行人检测方法、装置及存储介质。

技术介绍

[0002]行人检测是计算机视觉中目标检测任务的重要分支,它涉及识别特定类别的行人,通常是在城市道路上的行人。行人检测是目标检测的基准问题,在自动驾驶、智能交通、客流统计和监控等场景有着很大的实用价值。
[0003]公开号为CN113343785A的中国专利公开了一种基于轻量化YOLOv3的行人检测方法。该专利技术公开了一种基于轻量化YOLOv3的行人检测方法,包括:建立针对周界入侵防护应用场景的行人数据集;构建轻量化YOLOv3行人检测网络;划分行人检测训练集,训练轻量化YOLOv3行人检测网络得到轻量化行人检测模型;划分行人检测验证集,验证训练得到的轻量化行人检测模型效果;将轻量化YOLOv3行人检测模型部署到嵌入式前端设备中。该方法采用高精度的轻量化骨干网络替换传统YOLOv3检测网络的骨干网络,大幅降低了行人检测网络的前向运算量和行人检测网络的参数数据量,在保证了行人检测的精度的同时大幅提升了行人检测速度,适用于计算能力较低、存储空间较小的嵌入式设备,但是该方案对于行人的检测及属性分类不够细化,并不能完整地反映实际应用中行人的属性。

技术实现思路

[0004]本专利技术的目的是:旨在提供一种基于多模型的行人检测方法、装置及存储介质,用来解决现有检测方法对于行人的检测及属性分类不够细致的问题。
[0005]为实现上述技术目的,本专利技术采用的技术方案如下:
[0006]第一方面,本申请提供一种基于多模型的行人检测方法,包括以下步骤,
[0007]S1,获取不同场景下的行人图像;
[0008]S2,基于全图标注对所述行人图像进行行人检测标注,基于抠图标注对所述行人图像进行行人属性标注;
[0009]S3,基于第一模型和所述行人检测标注获取第一检测结果,基于第二模型和所述行人属性标注获取第二检测结果,基于所述第一检测结果、所述第二检测结果和第三模型获取行人分类结果。
[0010]结合第一方面,在一些可选的实施方式中,所述全图标注包括:基于矩形框对所述行人图像进行一次标注,其中,标注的类别包括行人和骑车人。
[0011]结合第一方面,在一些可选的实施方式中,所述抠图标注包括:基于全图标注结果对所述行人图像上行人和骑车人所在的区域进行扣取并进行二次标注,所述二次标注的内容为行人和骑车人的属性,其中,所述行人和骑车人的属性包括人头、年纪、朝向和姿态。
[0012]结合第一方面,在一些可选的实施方式中,所述第一模型、所述第二模型和所述第三模型使用Vargnet模型作为backbone。
[0013]结合第一方面,在一些可选的实施方式中,所述第一模型中backbone的UnitA和UnitB相关block以及通道数大于所述第二模型中backbone的UnitA和UnitB相关block以及通道数。
[0014]结合第一方面,在一些可选的实施方式中,所述第三模型通过在所述第二模型的基础上增加分类head和检测head生成。
[0015]结合第一方面,在一些可选的实施方式中,所述方法还包括:基于DIOU loss算法对第一模型的预测与真实样本的误差进行计算。
[0016]第二方面,本申请提供一种基于多模型的行人检测装置,包括:
[0017]图像获取单元,获取不同场景下的行人图像;
[0018]标注单元,基于全图标注对所述行人图像进行行人检测标注,基于抠图标注对所述行人图像进行行人属性标注;
[0019]处理单元,基于第一模型和所述行人检测标注获取第一检测结果,基于第二模型和所述行人属性标注获取第二检测结果,基于所述第一检测结果、所述第二检测结果和第三模型获取行人分类结果。
[0020]结合第二方面,在一些可选的实施方式中,装置还包括:
[0021]计算单元,基于DIOU loss算法对第一模型的预测与真实样本的误差进行计算。
[0022]第三方面,本申请提供一种计算机储存介质,所述计算机储存介质内储存有计算机程序,当所述计算机程序在计算机上运行时,能够执行上述的方法。
[0023]采用上述技术方案的专利技术,具有如下优点:
[0024]1、本申请采用了两个模型使用两阶段来进行行人检测的精确定位,实现智能驾驶中准确的目标检测。
[0025]2、选择Vargnet这种轻量级的网络作为训练模型,适合安装在内存小,环境复杂的车载终端GPU上,能够又好又快地完成行人检测。
[0026]3、本申请提供了一个模型来进行人属性的分类,用来辅助车辆进行后续的操控。细化了行人检测方法中的行人属性,便于完成后续应对措施的智能选择。
附图说明
[0027]本专利技术可以通过附图给出的非限定性实施例进一步说明;
[0028]图1为本申请实施例中基于多模型的行人检测方法的示意图;
[0029]图2为本申请实施例中全图行人检测模型中UnitA和UnitB的示意图;
[0030]图3为本申请实施例中全图行人检测模型的Backbone结构图;
[0031]图4为本申请实施例中行人再检测模型中的Backbone结构图;
[0032]图5为本申请实施例中基于多模型的行人检测方法的流程图;
[0033]图6为本申请实施例中基于多模型的行人检测装置的示意图。
[0034]主要元件符号说明如下:
[0035]10:图像获取单元;20:标注单元;30:处理单元;31:计算单元。
具体实施方式
[0036]以下将结合附图和具体实施例对本专利技术进行详细说明,需要说明的是,在附图或
说明书描述中,相似或相同的部分都使用相同的图号,附图中未绘示或描述的实现方式,为所属
中普通技术人员所知的形式。另外,实施例中提到的方向用语,例如“上”、“下”、“顶”、“底”、“左”、“右”、“前”、“后”等,仅是参考附图的方向,并非用来限制本专利技术的保护范围。
[0037]如图1所示,本申请实施例提供一种基于多模型的行人检测方法,包括以下步骤:
[0038]S1,获取行人图像;
[0039]S2,基于全图标注对所述行人图像进行行人检测标注,基于抠图标注对所述行人图像进行行人属性标注;
[0040]S3,基于第一模型和所述行人检测标注获取第一检测结果,基于第二模型和所述行人属性标注获取第二检测结果,基于所述第一检测结果、所述第二检测结果和第三模型获取行人分类结果。
[0041]在步骤S1中,获取不同场景下的行人图像。结合附图1和附图5,通过车载前视摄像头进行数据采集,采集白天、夜晚,雨天等不同场景下的行人数据。网上的行人检测数据集无法满足需求,本申请使用车载前视摄像头进行重新采集,并按照需求设计标注文档。优选地,还可采用其他手段对车辆附近的行人数据进行采集,例如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模型的行人检测方法,其特征在于,包括以下步骤,S1,获取行人图像;S2,基于全图标注对所述行人图像进行行人检测标注,基于抠图标注对所述行人图像进行行人属性标注;S3,基于第一模型和所述行人检测标注获取第一检测结果,基于第二模型和所述行人属性标注获取行人第二检测结果,基于所述第一检测结果、所述行人第二检测结果和第三模型获取行人分类结果。2.根据权利要求1所述的行人检测方法,其特征在于,所述全图标注包括:基于矩形框对所述行人图像进行一次标注,其中,标注的类别包括行人和骑车人。3.根据权利要求2所述的行人检测方法,其特征在于,所述抠图标注包括:基于全图标注结果对所述行人图像上行人和骑车人所在的区域进行扣取并进行二次标注,所述二次标注的内容为行人和骑车人的属性,其中,所述行人和骑车人的属性包括人头、年纪、朝向和姿态。4.根据权利要求3所述的行人检测方法,其特征在于,所述第一模型、所述第二模型和所述第三模型基于Vargnet模型作为backbone。5.根据权利要求4所述的行人检测方法,其特征在于,所述第一模型中backbone的UnitA和UnitB相关block以及通道数大于所述第二模型中backbon...

【专利技术属性】
技术研发人员:方柱吴锐
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1