【技术实现步骤摘要】
一种基于FasterRCNN的多尺度密集行人检测方法
本专利技术涉及一种基于FasterRCNN(快速区域卷积神经网络)的多尺度密集行人检测方法,属于目标检测和计算机视觉
技术介绍
随着人工智能技术的发展,行人检测技术已经成为计算机视觉领域的关键研究方向。行人检测的最重要的任务就是对行人目标进行准确定位。行人检测技术有很强的使用价值,可以与多人跟踪、行人重识别等技术结合,应用于汽车无人驾驶系统、智能机器人、智能视频监控、人体行为分析、人流量统计系统、智能交通领域。目前的行人检测任务主要分为两类:一是基于传统图像特征的方法,二是基于深度学习的方法。基于传统图像特征的方法,主要通过手动构造行人特征,如HOG等,再结合SVM、Adaboost等分类器训练检测器来实现行人检测。但是,这种方法依赖于人工选取的行人特征,如果选取的特征表达能力不足,检测效果就会比较差。相对于基于传统图像特征进行检测的方法,基于深度学习的方法不依赖于某一单一的特征,对于特征的利用率更高,这种方法具有更好的泛化性和鲁棒性,行人检测结 ...
【技术保护点】
1.一种基于Faster RCNN的多尺度密集行人检测方法,其特征在于,包括以下步骤:/n步骤1:获取行人检测数据样本,并制作数据集;/n步骤1.1:获取行人检测所需的用来训练和检测的数据样本;/n步骤1.2:将获取的数据样本转化为VOC格式数据集;/n步骤2:根据统计结果,确定RPN网络中适合行人目标的anchors的长宽比例和尺寸,其中,行人尺寸的平均长宽比例为0.41;/n步骤3:根据所选择的anchor长宽比例和尺寸,以及行人检测任务修改网络参数,训练Faster RCNN网络,获取训练好的模型;/n步骤3.1:搭建训练模型;/n步骤3.2:对Faster RCNN ...
【技术特征摘要】
20200114 CN 20201003807201.一种基于FasterRCNN的多尺度密集行人检测方法,其特征在于,包括以下步骤:
步骤1:获取行人检测数据样本,并制作数据集;
步骤1.1:获取行人检测所需的用来训练和检测的数据样本;
步骤1.2:将获取的数据样本转化为VOC格式数据集;
步骤2:根据统计结果,确定RPN网络中适合行人目标的anchors的长宽比例和尺寸,其中,行人尺寸的平均长宽比例为0.41;
步骤3:根据所选择的anchor长宽比例和尺寸,以及行人检测任务修改网络参数,训练FasterRCNN网络,获取训练好的模型;
步骤3.1:搭建训练模型;
步骤3.2:对FasterRCNN网络进行训练,采用四阶段训练法:
阶段一:以端到端的模式单独训练RPN网络;
阶段二:使用阶段一得到的建议框,单独训练训练FastRCNN网络;
阶段三:使用阶段二得到的网络初始化RPN模型,训练时固定共享卷积层,只更新RPN网络的参数;
阶段四:保持共享卷积层固定不变,使用阶段三更新后的RPN输出的候选建议框作为输入,更新FastRCNN网络的参数;
在上述四个阶段训练之后,得到最终训练好的FasterRCNN模型;
步骤4:使用训练好的FasterRCNN模型对行人目标进行检测,得到初步检测结果;使用softNMS算法减少对重叠物体检测框的误除情况,得到最终的检测结果。
2.如权利要求1所述的一种基于FasterRCNN的多尺度密集行人检测方法,其特征在于,步骤2中,anchor的高度选为16×1.3n,n∈(1,2,3...9),数量为9个。
3.如权利要求1所述的一种基于FasterRCNN的多尺度密集行人检测方法,其特征在于,步骤3中,在caffe的深度学习框架下搭建FasterRCNN检测网络,并且以ZFnet作为特征提取的网络。
4.如权...
【专利技术属性】
技术研发人员:朱凯,胡东方,李林涛,
申请(专利权)人:北京银河信通科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。