一种基于特征增强的多实例行人检测方法技术

技术编号：38861879 阅读：13 留言：0更新日期：2023-09-17 10:03

本发明专利技术公开了一种基于特征增强的多实例行人检测方法，包括：获取数据集，并将所述数据集划分为训练集和测试集；基于所述训练集对改进后的Faster RCNN网络模型进行训练，获取训练好的Faster RCNN网络模型；通过所述测试集对所述训练好的Faster RCNN网络模型进行测试，获取检测结果。本发明专利技术通过使用多实例预测方法对不同的候选框，预测与之相对应的行人个数，来减少行人出现的漏检。来减少行人出现的漏检。来减少行人出现的漏检。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于特征增强的多实例行人检测方法

[0001]本专利技术涉及目标检测
，尤其涉及一种基于特征增强的多实例行人检测方法。

技术介绍

[0002]目标检测技术是计算机视觉领域中的一个重要研究课题，目的在于识别图像或视频中有哪些物体以及物体的位置。而行人检测作为目标检测的一个重要分支，其目的在于判断图像或视频中是否存在行人并给出精确定位。行人检测与行人跟踪、行人重识别等技术相结合后，在人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域有着巨大的应用前景和实用价值。
[0003]传统的行人检测方法主要通过手工设计特征进行行人检测，现有技术中公开了方向梯度直方图(HOG)特征作为行人特征，并且采用SVM分类器来对行人特征进行分类；还包括积分通道特征(ICF)，采用积分图技术，来将行人的梯度、颜色等特征进行随机组合，并且采用SVM分类器对特征进行分类。上述方法初期能够提高行人检测效率，并且对后面的行人检测方法起到极大的促进作用。然而，手工特征提取算法较为复杂，并且手工设计的特征不能很好的表示尺度姿态多变、遮挡严重、背景复杂等状态下的行人，使得传统的行人检测方法不能很好的解决现实生活中的实际问题。近些年来深度学习算法取得了巨大进步，因此大量学者转为利用深度学习框架开展行人检测研究，取得了一定的成果。但是现有的基于深度学习的行人检测方法在行人密集场景下还存在一些问题：(1)由于行人之间高度重叠，导致行人特征高度相似，难以区分。(2)由于行人之间高度重叠，使得原有的单实例检测方法容...

【技术保护点】

【技术特征摘要】
1.一种基于特征增强的多实例行人检测方法，其特征在于，包括：获取数据集，并将所述数据集划分为训练集和测试集；基于所述训练集对改进后的Faster RCNN网络模型进行训练，获取训练好的Faster RCNN网络模型；通过所述测试集对所述训练好的Faster RCNN网络模型进行测试，获取检测结果。2.根据权利要求1所述的基于特征增强的多实例行人检测方法，其特征在于，所述数据集包括带有标注行人可见框和全身框的数据集。3.根据权利要求1所述的基于特征增强的多实例行人检测方法，其特征在于，所述改进后的Faster RCNN网络模型，包括：Backbone单元：用于提取图像中的行人特征，生成特征图；双RPN单元：用于生成行人的可见候选框和全身候选框；Rolpooling单元：用于将候选框中的特征图缩放到相同大小的尺寸；Head单元：用于对候选框中的特征使用多实例进行预测；所述Backbone单元、所述双RPN单元、所述Rol pooling单元和所述Head单元依次连接。4.根据权利要求3所述的基于特征增强的多实例行人检测方法，其特征在于，对所述改进后的Faster RCNN网络模型进行训练，包括：将所述训练集中待检测的行人图像输入到所述Backbone单元中，通过ResNet50提取所述图像中不同层的行人特征，基于FPN将提取到的所述不同层的行人特征进行特征融合，得到不同尺度的特征图；基于所述特征图，通过所述双RPN单元分别生成行人的可见候选框和全身候选框，将所述行人的可见候选框和全身候选框投影到图像的所述特征图上，获取相应行人的可见特征和全身特征，其中所述行人的可见特征为行人未被遮挡的可见部分的特征，通过所述可见候选框获得；行人的全身特征为整个行人的特征，通过所述全身候选框获得；增强所述行人的可见特征，对增强后的行人特征进行多实例预测，完成预测后，获取所述改进后的Faster RCNN网络模型。5.根据权利要求4所述的基于特征增强的多实例行人检测方法，其特征在于，生成所述行人的可见候选框，包括：使用n
×
n的滑动窗口在所述特征图上进行滑动，每滑动到一个位置生成一个一维向量，所述一维向量通过两个...

【专利技术属性】
技术研发人员：刘军清，王鹏，康维，张威威，张思甜，
申请(专利权)人：三峡大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人