The invention discloses a detection method of human target area based on convolutional neural network calibration, human target upper body human head shoulder model position for the calibration frame, thus reducing the probability of human target is blocked, reducing the failure rate; at the same time, set five different scale image conversion, and the selection of {0.8,1.2} two different ratio of width to height ratio and {48,96144192240} five different scale as anchors generation rules, to further reduce the false negative rate. In addition, the invention also through a human target image of the candidate frame loss value, and selects the largest loss value before the B candidate frame as difficult samples, the loss of feedback to the regional convolutional neural network model parameters, using a stochastic gradient descent method to update regional convolution neural network model, in order to improve the accuracy of human target detection under complex scene, reduce the false detection rate and.
【技术实现步骤摘要】
一种基于区域全卷积神经网络的人体目标检测方法
本专利技术属于计算机视觉、模式识别、机器学习等
,更为具体地讲,涉及在监控场景下一种基于区域全卷积神经网络的人体目标检测方法。
技术介绍
近年来,随着科技的进步,各个行业开始越来越关注安全问题。在银行、机场、地铁、车站、小区等重要区域以及公共场所,人们都安装了监控摄像头进行视频监控。这些监控摄像头一般都安装在较高的位置,以俯视的角度进行监控。而我们所说的监控场景即是指在这种情景下拍摄的监控画面。一般情况下,人是监控场景的主体,对人体目标的跟踪和后续的行为识别分析严重依赖于人体目标检测的精度,因此如何在监控场景下准确检测人体目标已经成为学术界和工业界广泛关注的热点之一。早期的研究者一般将人体目标检测问题分为两个步骤来解决,首先是基于手工设计的模型进行特征提取,然后基于目标特征设计分类器训练检测模型。比如,Viola和Jones将采用haar小波特征,结合adaboost级联分类器的VJ模型应用于人体目标检测中。具体算法原理参见:ViolaP,JonesMJ,SnowD.Detectingpedestriansusingpatternsofmotionandappearance[C].ComputerVision,2003.Proceedings.NinthIEEEInternationalConferenceon.IEEE,2003:734-741。DalalN与TriggsB提出了一种基于梯度直方图(HistogramsofOrientedGradients,HOG)特征和支持向量机(SupportVec ...
【技术保护点】
一种基于区域全卷积神经网络的人体目标检测方法,其特征在于,包括以下步骤:(1)、采集不同监控场景、不同角度的人体目标图像,然后对于每一张采集的人体目标图像,标定人体目标上半身的所在位置作为人体目标的标定框,标定了人体目标标定框的人体目标图像构成训练;人体目标图像不仅包含单一人体目标的简单场景,也包含一些遮挡较为严重,人员数量较多的复杂情景;(2)、设置五个不同的图像尺度,对于训练集中的每一幅人体目标图像,随机选择一个图像尺度,将人体目标图像的短边缩放到该尺度下之后输入到残差网络(Residual Network)进行卷积运算,得到卷积特征;(3)、将卷积特征输入到区域候选网络(Region Proposal Network,简称RPN),生成区域候选框;其中,生成区域候选框时所需锚(anchors),选用{0.8,1.2}两个不同比例的宽高比和{48,96,144,192,240}五个不同比例尺度作为生成anchors的规则;(4)、根据卷积特征、区域候选框,计算位置敏感得分图,得到区域候选框为正候选框的概率S
【技术特征摘要】
1.一种基于区域全卷积神经网络的人体目标检测方法,其特征在于,包括以下步骤:(1)、采集不同监控场景、不同角度的人体目标图像,然后对于每一张采集的人体目标图像,标定人体目标上半身的所在位置作为人体目标的标定框,标定了人体目标标定框的人体目标图像构成训练;人体目标图像不仅包含单一人体目标的简单场景,也包含一些遮挡较为严重,人员数量较多的复杂情景;(2)、设置五个不同的图像尺度,对于训练集中的每一幅人体目标图像,随机选择一个图像尺度,将人体目标图像的短边缩放到该尺度下之后输入到残差网络(ResidualNetwork)进行卷积运算,得到卷积特征;(3)、将卷积特征输入到区域候选网络(RegionProposalNetwork,简称RPN),生成区域候选框;其中,生成区域候选框时所需锚(anchors),选用{0.8,1.2}两个不同比例的宽高比和{48,96,144,192,240}五个不同比例尺度作为生成anchors的规则;(4)、根据卷积特征、区域候选框,计算位置敏感得分图,得到区域候选框为正候选框的概率Si以及负候选框的概率Sj;同时,根据人体目标标定框,得到区域候选框的真实类别概率S;其中,区域候选框与真实的人体目标标定框的交并比大于等于0.5时,判定区域候选框为正候选框样本,真实类别概率S为1;当候选框与真实的人体目标标定框的交并比小于0.5时,判定区域候选框为负候选框样本,真实类别概率S为0;(5)、采用区域候选框的交叉熵损失值作为区域候选框的分类损失值Lc...
【专利技术属性】
技术研发人员:邹见效,周雪,徐红兵,刘鹏飞,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。