当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于特征增强的多实例行人检测方法技术

技术编号:38861879 阅读:40 留言:0更新日期:2023-09-17 10:03
本发明专利技术公开了一种基于特征增强的多实例行人检测方法,包括:获取数据集,并将所述数据集划分为训练集和测试集;基于所述训练集对改进后的Faster RCNN网络模型进行训练,获取训练好的Faster RCNN网络模型;通过所述测试集对所述训练好的Faster RCNN网络模型进行测试,获取检测结果。本发明专利技术通过使用多实例预测方法对不同的候选框,预测与之相对应的行人个数,来减少行人出现的漏检。来减少行人出现的漏检。来减少行人出现的漏检。

【技术实现步骤摘要】
一种基于特征增强的多实例行人检测方法


[0001]本专利技术涉及目标检测
,尤其涉及一种基于特征增强的多实例行人检测方法。

技术介绍

[0002]目标检测技术是计算机视觉领域中的一个重要研究课题,目的在于识别图像或视频中有哪些物体以及物体的位置。而行人检测作为目标检测的一个重要分支,其目的在于判断图像或视频中是否存在行人并给出精确定位。行人检测与行人跟踪、行人重识别等技术相结合后,在人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域有着巨大的应用前景和实用价值。
[0003]传统的行人检测方法主要通过手工设计特征进行行人检测,现有技术中公开了方向梯度直方图(HOG)特征作为行人特征,并且采用SVM分类器来对行人特征进行分类;还包括积分通道特征(ICF),采用积分图技术,来将行人的梯度、颜色等特征进行随机组合,并且采用SVM分类器对特征进行分类。上述方法初期能够提高行人检测效率,并且对后面的行人检测方法起到极大的促进作用。然而,手工特征提取算法较为复杂,并且手工设计的特征不能很好的表示尺度姿态多变本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于特征增强的多实例行人检测方法,其特征在于,包括:获取数据集,并将所述数据集划分为训练集和测试集;基于所述训练集对改进后的Faster RCNN网络模型进行训练,获取训练好的Faster RCNN网络模型;通过所述测试集对所述训练好的Faster RCNN网络模型进行测试,获取检测结果。2.根据权利要求1所述的基于特征增强的多实例行人检测方法,其特征在于,所述数据集包括带有标注行人可见框和全身框的数据集。3.根据权利要求1所述的基于特征增强的多实例行人检测方法,其特征在于,所述改进后的Faster RCNN网络模型,包括:Backbone单元:用于提取图像中的行人特征,生成特征图;双RPN单元:用于生成行人的可见候选框和全身候选框;Rolpooling单元:用于将候选框中的特征图缩放到相同大小的尺寸;Head单元:用于对候选框中的特征使用多实例进行预测;所述Backbone单元、所述双RPN单元、所述Rol pooling单元和所述Head单元依次连接。4.根据权利要求3所述的基于特征增强的多实例行人检测方法,其特征在于,对所述改进后的Faster RCNN网络模型进行训练,包括:将所述训练集中待检测的行人图像输入到所述Backbone单元中,通过ResNet50提取所述图像中不同层的行人特征,基于FPN将提取到的所述不同层的行人特征进行特征融合,得到不同尺度的特征图;基于所述特征图,通过所述双RPN单元分别生成行人的可见候选框和全身候选框,将所述行人的可见候选框和全身候选框投影到图像的所述特征图上,获取相应行人的可见特征和全身特征,其中所述行人的可见特征为行人未被遮挡的可见部分的特征,通过所述可见候选框获得;行人的全身特征为整个行人的特征,通过所述全身候选框获得;增强所述行人的可见特征,对增强后的行人特征进行多实例预测,完成预测后,获取所述改进后的Faster RCNN网络模型。5.根据权利要求4所述的基于特征增强的多实例行人检测方法,其特征在于,生成所述行人的可见候选框,包括:使用n
×
n的滑动窗口在所述特征图上进行滑动,每滑动到一个位置生成一个一维向量,所述一维向量通过两个...

【专利技术属性】
技术研发人员:刘军清王鹏康维张威威张思甜
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1