基于改进的FasterRCNN的行人检测方法技术

技术编号：32636676 阅读：12 留言：0更新日期：2022-03-12 18:11

本发明专利技术公开了基于改进的Faster RCNN的行人检测方法，首先通过ResNet

全部详细技术资料下载

【技术实现步骤摘要】
基于改进的Faster RCNN的行人检测方法

[0001]本专利技术属于图像处理与计算机视觉
，涉及基于改进的Faster RCNN的行人检测方法。

技术介绍

[0002]目标检测是最重要的计算机视觉任务之一，处理在杂乱的现实场景或输入图像中某一类物体的视觉实例的检测。由于其广泛的应用，目标检测近年来引起了人们极大的关注。目标检测主要包括两项任务:目标定位和目标分类。对象定位通过在一个或多个对象实例周围绘制一个边界框来确定其位置和比例。分类是指为该对象分配类标签的过程。在检测方面，目标检测系统从一组训练数据中构建模型，在泛化方面，需要提供大量的训练数据集。
[0003]目前，智能监控摄像头的普及与图像处理技术的发展为智能监控提供了很好的发展前提。行人流量统计在智能监控中运用广泛，具体可运用于医院、施工现场、学校、商场等等，准确的流量统计可以帮助工作人员进行合理的资源配置，相关部门可以根据行人流量曲线最大限度地预防公共安全事件的发生，及早拟定应急预案。行人流量统计的基础就是行人检测，通过统计行人检测的结果绘出行人流量曲线。
[0004]行人检测作为目标检测的具体应用，具体过程为：给出输入图像或者视频帧，判断图像中是否有行人，有的话框出行人位。
[0005]近十年来，人工智能在人类生活的各个领域都产生了影响，而深度学习就是利用人工神经网络进行表示学习的人工智能领域。深度学习的应用在目标检测领域占领了主要地位，目前，主流的基于深度学习的目标检测算法可分为两种，基于候选框的Two
‑<

【技术保护点】

【技术特征摘要】
1.基于改进的Faster RCNN的行人检测方法，其特征在于，首先通过ResNet
‑
50神经网络提取样本图像的特征图，然后将所得特征图输入RPN模型，并修改了RPN模型的边框回归损失函数，生成候选框；最后将特征图和候选框发送到ROI Head模型，得到目标的类别和定位；具体操作步骤如下：步骤1：对ResNet
‑
50网络进行预训练，提取行人图像的特征图；步骤2：利用RPN模型在图像的特征图上生成候选框，得到1：1比例的正负样本；将所述正负样本作为标签去训练RPN模型，得到候选框中目标的类别和初步定位信息，所述类别包括前景和背景；对步骤3：利用RPN模型得到候选框中的目标的类别、初步定位信息和ResNet
‑
50网络得到的特征图，对随机初始化参数得到的ROI Head模型进行训练，得到目标的类别和定位。2.根据权利要求1所述的基于改进的Faster RCNN的行人检测方法，其特征在于，步骤1具体如下：采用VOC2007数据集对ResNet
‑
50神经网络进行预训练，得到网络权重，将预训练好的权重加载到Faster RCNN的ResNet
‑
50网络，得到预训练后的ResNet
‑
50网络；之后的训练过程冻结ResNet
‑
50网络部分，即ResNet
‑
50网络的参数不进行反向传播，不进行梯度更新；将图像输入预训练好的ResNet
‑
50网络，得到行人图像的特征图。3.根据权利要求1所述的基于改进的Faster RCNN的行人检测方法，其特征在于，步骤2生成候选框的方法具体如下：设定RPN模型初始化信息，所述初始化信息包括锚盒的尺寸、比例；RPN模型的锚盒尺寸为：8
×
8、16
×
16、32
×
32，其中8
×
8、16
×
16适用于小的行人检测，32
×
32适用于大的行人检测；这三种尺寸每种尺寸按1:1，1:2，2:1的长宽比例缩放，共9种尺寸作为RPN模型需要评估的候选框；训练RPN模型的目标就是对特征图中的每个锚点对应的9个锚盒，预测其是否是一个存在目标的框；框与真值框的交并比IoU>0.7就认为这个框是一个候选框，反之，则不是；将步骤1中得到的特征图输入RPN模型，改善...

【专利技术属性】
技术研发人员：赵志强，马培红，黑新宏，赵钦，何文娟，马召熙，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人