当前位置: 首页 > 专利查询>中南大学专利>正文

一种快速行人检测方法及系统技术方案

技术编号:24252079 阅读:30 留言:0更新日期:2020-05-22 23:51
本发明专利技术公开了一种快速行人检测方法及系统,将MobileNet网络和RPN网络进行组装,构建MobileNet‑RPN检测模型,所述MobileNet‑RPN检测模型以待检测的图像为输入,以待检测图像上的预测的行人边框为输出;获取包含标注有真实的行人边框的行人图像和没有行人的背景图像的训练数据集对所述MobileNet‑RPN检测模型进行训练,得到训练好的MobileNet‑RPN检测模型;将待检测图像输入到所述MobileNet‑RPN检测模型中,得到待检测图像的预测的行人边框。相比现有技术,使用参数量较少的MobileNet的算法构建轻量级的特征选取网络,使得网络前向传播的计算量小,速度快,可达到44FPS。从而大幅度提高了基于深度学习方法的行人检测速度。

A fast pedestrian detection method and system

【技术实现步骤摘要】
一种快速行人检测方法及系统
本专利技术涉及计算机视觉领域里的目标检测
,尤其涉及一种快速行人检测方法及系统。
技术介绍
视觉信息是人类感知世界的重要来源,研究表明,人类获取外界信息中大约有80%到90%的信息来自于视觉信息。人类可以快速的分析感知到的信息并且对其中所有目标进行定位和识别。计算机视觉技术的最终目的就是让计算机可以像人类一样快速定位、识别以及分析目标,一旦计算机具备了人类的视觉识别能力,那么它在许多领域就可以替代人力,从而大大节约人力成本和生产成本。目标检测是计算机视觉的重要分支,其目的是对图像中的目标进行精确的定位和分类,行人检测作为目标检测的一个具体的实际应用,是指给定图像和视频,判断出其中是否有行人,如果有,给出行人的具体位置。它是自动驾驶,智能视频监控以及人的行为分析的基础和前提,因此提高行人检测的准确率和鲁棒性具有重要的意义。传统的行人检测方法是先提取人工设计的分辨率较强的特征,例如梯度直方图特征,Haar(Haar-likefeatures,哈尔特征)特征,然后使用机器学习中的方法训练出一个分类模型。预测的时候,在图像中,使用滑窗方法对每一个不同尺寸的窗口进行分类,得出前景窗口。然而,行人容易受到光照、姿势、服装、尺度、拍摄角度的影响,这些因素限制了此类模型检测的精度。2012年以来,深度学习卷积神经网络(Convolutionalneuralnetworks,CNN),被用于图像分类和目标检测,并被引入行人检测,大幅度提高检测的精度和鲁棒性,但是CNN的模型参数量大,预测时计算量较大,使得模型的实时性不高,MobileNet(中文名)(领域专有名词,无需中文名)的提出大幅度缓解了这一问题,MobileNet使用可分离卷积层,参数数量较少,但是再ImageNet(一个用于视觉对象识别软件研究的大型可视化数据库)上的分类识别精度却只比VGG(VisualGeometryGroupNetwork,VGG网络由牛津大学的视觉几何组(VisualGeometryGroup)和GoogleDeepMind公司的研究员一起研发的深度卷积神经网络)要低约1%。CN105335716A公开了一种基于改进UDN提取联合特征的行人检测方法,该方法包括一下步骤:(1)图像预处理:对原始输入图像中的人体的整体特征和头部特征进行不同的预处理,使图像边缘和颜色特征更加突出,便于神经网络特征提取;(2)基于卷积神经网络CNN模型对预处理的图像提取人体整体特征;(3)基于卷积神经网络CNN模型对预处理的图像的上1/3部分提取局部特征;(4)对步骤(2)和(3)输出的类别概率进行加权平均得到最终概率值,根据最终概率值判断原始输入图像是否包含行人。该方法利用人体头部区域易于和电线杆、树木等柱状物体区分开来的特点,联合整体特征和头部特征,加权平均它们在CNN上面的输出值,联合CNN和深度置信网络共同进行行人检测,有效提高行人检测的漏检率和误检率。该专利技术也存在一些明显的不足:(1)网络的深度不够,提取的特征判别性不强。(2)网络未在较大数据集上预训练,利用的数据较少。CN106203506B公开了一种基于深度学习技术的行人检测方法,(1)其训练阶段采用“逐步迁移”的策略微调,将ImageNet上的预训练的ZF-Net(深度神经网络,2013ImageNet图像分类大赛分类任务的冠军)网络在INRIA(一种静态行人检测数据库)和ETH(一种包含行人视频的行人数据库)上面微调;(2)使用“交叉优化”训练方式得到一个改进的FasterR-CNN(一种深度全卷积神经网络)。该方法涉及简单,利用了大量数据,使用改进的FasterR-CNN模型提取特征的鲁棒性强,检测准确率高,漏检率低。但是,该方法存在明显的不足:(1)使用FasterR-CNN模型,参数量大,模型前向传播速度慢,导致检测速度太慢。(2)训练出的模型性能不高。因此,如何解决现有的行人检测方法及系统精确度和检测效率不兼容已成为本领域技术人员亟待解决的技术问题。
技术实现思路
本专利技术提供了一种快速行人检测方法及系统,用以解决现有的行人检测方法及系统精确度和检测效率不兼容已成为本领域技术人员亟待解决的技术问题。为解决上述技术问题,本专利技术提出的技术方案为:一种快速行人检测方法,包括以下步骤:将MobileNet(Google针对手机等嵌入式设备提出的一种轻量级的深层神经网络)网络和RPN(RegionProposalNetwork,区域生成网络)网络进行融合,得到MobileNet-RPN检测模型,所述MobileNet-RPN检测模型以待检测的图像为输入,以待检测图像上的预测的行人边框为输出;获取包含标注有真实的行人边框的行人图像和没有行人的背景图像的训练数据集对所述MobileNet-RPN检测模型进行训练,得到训练好的MobileNet-RPN检测模型;将待检测图像输入到所述MobileNet-RPN检测模型中,得到待检测图像的预测的行人边框。优选的,构建MobileNet-RPN检测模型,包括以下步骤:获取ImageNet预训练的MobileNet网络,去掉网络的输出通道数为1024的卷积层及其后面的网络层,得到的网络输出特征层的featurestride(特征跨度)为16,用这个网络作为骨架网络替换FasterR-CNN中的RPN的VGG网络,得到MobileNet-RPN检测模型,并将所述MobileNet-RPN的anchorstride减小8,并设置所述RPN的预测输出层的任一个预测通道负责4个两两相邻的anchors中心点所对应的所有anchors的分类和回归。优选的,获取包含标注有真实的行人边框的行人图像和没有行人的背景图像的训练数据集对所述MobileNet-RPN检测模型进行训练,具体包括以下步骤:设置MobileNet-RPN检测模型的训练策略和验证策略;获取Caltech数据集(加州理工学院提供的一个图像物体识别数据集)作为训练数据集,并将所述训练数据集分为训练集和验证集,将所述训练集中的图片输入到MobileNet-RPN检测模型,依照训练策略对所述MobileNet-RPN检测模型进行迭代训练,并在训练过程中,将验证集输入MobileNet-RPN检测模型中,并使用验证策略对迭代次数不同的MobileNet-RPN检测模型进行多次验证,选取验证结果最好的MobileNet-RPN检测模型作为训练好的MobileNet-RPN检测模型。优选的,所述训练策略为:当训练图片中包含行人时,按比例从预先设置在图片上的anchors中随机选取若干个正样本和若干个负样本计算损失函数并进行反向传播,其中,与图片中行人的真实边框的IOU(IntersectionoverUnion,重叠度)大于第一真实阈值的anchors为正样本,与行人的真实边框的IOU小于第二真实阈值的anchors为负样本;当训练图片中不包含行人时,使用onlinehardne本文档来自技高网
...

【技术保护点】
1.一种快速行人检测方法,其特征在于,包括以下步骤:/n将MobileNet网络和RPN网络进行融合,构建MobileNet-RPN检测模型,所述MobileNet-RPN检测模型以待检测的图像为输入,以待检测图像上的预测的行人边框为输出;/n获取包含标注有真实的行人边框的行人图像和没有行人的背景图像的训练数据集对所述MobileNet-RPN检测模型进行训练,得到训练好的MobileNet-RPN检测模型;/n将待检测图像输入到所述MobileNet-RPN检测模型中,得到待检测图像的预测的行人边框。/n

【技术特征摘要】
1.一种快速行人检测方法,其特征在于,包括以下步骤:
将MobileNet网络和RPN网络进行融合,构建MobileNet-RPN检测模型,所述MobileNet-RPN检测模型以待检测的图像为输入,以待检测图像上的预测的行人边框为输出;
获取包含标注有真实的行人边框的行人图像和没有行人的背景图像的训练数据集对所述MobileNet-RPN检测模型进行训练,得到训练好的MobileNet-RPN检测模型;
将待检测图像输入到所述MobileNet-RPN检测模型中,得到待检测图像的预测的行人边框。


2.根据权利要求1所述的快速行人检测方法,其特征在于,构建MobileNet-RPN检测模型,包括以下步骤:
获取ImageNet预训练的MobileNet网络,去掉网络的输出通道数为1024的卷积层及其后面的网络层,得到的网络输出特征层的featurestride为16,用这个网络作为骨架网络替换FasterR-CNN中的RPN的VGG网络,得到MobileNet-RPN检测模型,将所述MobileNet-RPN的anchorstride减小为8,并设置所述MobileNet-RPN的预测输出层的任一个预测通道负责4个两两相邻的anchors中心点所对应的所有anchors的分类和回归。


3.根据权利要求2所述的快速行人检测方法,其特征在于,获取包含标注有真实的行人边框的行人图像和没有行人的背景图像的训练数据集对所述MobileNet-RPN检测模型进行训练,具体包括以下步骤:
设置MobileNet-RPN检测模型的训练策略和验证策略;
获取Caltech数据集作为训练数据集,并将所述训练数据集分为训练集和验证集,将所述训练集中的图片输入到MobileNet-RPN检测模型,依照训练策略对所述MobileNet-RPN检测模型进行迭代训练,并在训练过程中,将验证集输入MobileN...

【专利技术属性】
技术研发人员:陈志文陈卓彭涛阳春华
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1