The invention discloses a pedestrian detection method based on convolutional neural network based on Multi-task learning, which includes: dividing the pedestrian location area into m*n sub-regions, combining sub-regions according to preset rules, obtaining multiple composite regions, defining each composite region as a pedestrian visible pattern; adopting the same network structure based on the first stage of high-speed convolutional network; Each detection network corresponds to a pedestrian visible mode detection task; the proportion of various pedestrian visible modes in pedestrian detection scene video is counted, and the weighted average of loss function with each task is obtained to obtain the total loss function; the first five pedestrian visible modes generation training is selected. Samples are trained for the corresponding regional recommendation subnetworks, and pedestrian detection is realized. The invention adopts a multi-task learning method to improve the detection ability of the depth network for occlusion pedestrians without increasing the complexity of the depth network in actual use.
【技术实现步骤摘要】
一种基于多任务学习的行人检测方法
本专利技术涉及图像处理、计算机视觉
,尤其涉及一种基于多任务学习的卷积神经网络行人检测方法。
技术介绍
随着近些年辅助驾驶、无人驾驶等技术兴起,行人检测成为一大研究热点。行人检测的目的是在给出的图像或视频中标出行人个体的位置。由于视频可以划分为多帧的图像,目前业界的研究重点放在图像的行人检测。图像检测技术有数十年的发展,其整体框架主要包括为:待检测区域选择、特征提取、特征分类三个部分。在深度学习兴起之前,具有代表性的行人检测方法包括:完全通道特征方法(IntegrateChannelFeatures,ICF)和可变部件模型方法(DeformablePartsModel,DPM)。ICF使用多通道特征和分类器进行行人识别。由于ICF方法以整个个体作为分类目标,尽管在遮挡较弱的情况下行人检测效果优异,但是随着遮挡程度的上升,检测效果下降明显。DPM方法采用多部件辅助的联合检测方式,在HOG(方向梯度直方图)特征金字塔上进行行人检测,巧妙地解决了多尺度问题,并且能够在一定程度上降低遮挡对检测效果的影响。随着深度学习理论研究的不断深入,深度特征被用到检测任务中,使得检测结果的准确度得到了巨大的提升。采用深度学习的物体检测方法中影响最为深远的是区域卷积神经网络(RegionswithConvolutionalNeuralNetwork,RCNN)方法及其后续发展的快速区域卷积神经网络(Fast-RCNN)方法和高速区域卷积神经网络(Faster-RCNN)方法。该类方法采用两阶段的检测框架,首先采用区域推荐方法产生推荐区域,然 ...
【技术保护点】
1.一种基于多任务学习的卷积神经网络行人检测方法,其特征在于,所述方法包括以下步骤:将行人位置所在的区域划分为m*n个子区域,按照预设规则将子区域进行组合,获取多个组合区域,将每个组合区域定义为行人可见模式;基于高速区域卷积网络的第一阶段网络结构,采用同一个特征提取网络提供输入图像的深度特征,并联多个检测网络,每一个检测网络对应一种行人可见模式的检测任务;统计行人检测场景视频中各种行人可见模式出现的比例、与每一个任务的损失函数加权平均,得到总的损失函数;选取前五种行人可见模式生成训练样本,分别训练对应的区域推荐子网络,进而实现对行人的检测。
【技术特征摘要】
1.一种基于多任务学习的卷积神经网络行人检测方法,其特征在于,所述方法包括以下步骤:将行人位置所在的区域划分为m*n个子区域,按照预设规则将子区域进行组合,获取多个组合区域,将每个组合区域定义为行人可见模式;基于高速区域卷积网络的第一阶段网络结构,采用同一个特征提取网络提供输入图像的深度特征,并联多个检测网络,每一个检测网络对应一种行人可见模式的检测任务;统计行人检测场景视频中各种行人可见模式出现的比例、与每一个任务的损失函数加权平均,得到总的损失函数;选取前五种行人可见模式生成训练样本,分别训练对应的区域推荐子网络,进而实现对行人的检测。2.根据权利要求1所述的一种基于多任务学习的卷积神经网络行人检测方法,其特征在于,所述预设规则为:每个子区域仅能与相邻的子区域进行组合...
【专利技术属性】
技术研发人员:雷建军,陈越,侯春萍,彭勃,郭亭佚,牛力杰,
申请(专利权)人:天津大学,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。