当前位置: 首页 > 专利查询>长安大学专利>正文

一种基于多视域图卷积网络的行人检测方法技术

技术编号:24685932 阅读:34 留言:0更新日期:2020-06-27 08:39
本发明专利技术公开了一种基于多视域图卷积网络的行人检测方法,采用卷积神经网络从待处理图像进行特征提取,对提取的特征图像进行多次池化、卷积处理得到预处理特征图像,然后采用多视域池化金字塔提取中得到的预处理特征图像的多尺度特征信息特征图,然后进行人体图卷积得到多个人体图卷积后的特征图,采用N

A pedestrian detection method based on convolution network of multi view graph

【技术实现步骤摘要】
一种基于多视域图卷积网络的行人检测方法
本专利技术属于目标检测
,具体涉及一种基于多视域图卷积网络的行人检测方法。
技术介绍
随着深度学习的出现,一般目标检测已经取得了很大进展,目前已经提出了各种图像处理和基于机器学习的方法来改善目标检测的性能,尽管这些方法显示了很好的结果,但考虑到它们的计算成本,仍然难以在实时系统中使用它们。而且当其应用于遮挡行人检测任务时仍然存在一些限制。行人检测是智能交通系统的重要组成部分,可用于告知驾驶员道路上个人的位置,以便更安全地进行驾驶。尽管一些基于深度CNN的方法在一般目标检测方面获得了很好的性能提升,但在应用于遮挡行人检测任务时仍存在一些局限性。由于准确检测行人在自动驾驶和监视等各种应用中具有很大的潜力,因此需要对其进行广泛研究,处理尺度变化和遮挡问题。一个限制是行人尺度可以在一个框架内大幅度变化,这使得难以实时准确地检测。此外,遮挡是行人检测的另一个限制。
技术实现思路
本专利技术的目的在于提供一种基于多视域图卷积网络的行人检测方法,以克服现有行人检测中的尺度变化和遮挡问题本文档来自技高网...

【技术保护点】
1.一种基于多视域图卷积网络的行人检测方法,其特征在于,包括以下步骤:/n步骤1)、采用卷积神经网络从待处理图像进行特征提取,对提取的特征图像进行多次池化、卷积处理得到预处理特征图像;/n步骤2)、采用多视域池化金字塔提取步骤1)中得到的预处理特征图像的多尺度特征信息特征图;/n步骤3)、在步骤1)中提取的特征图像进行倒数第二次池化、卷积处理得到特征图像和步骤2)中得到的多尺度特征信息图上分别建立人体部位图模型,然后进行人体图卷积得到多个人体图卷积后的特征图;/n步骤4)、采用N

【技术特征摘要】
1.一种基于多视域图卷积网络的行人检测方法,其特征在于,包括以下步骤:
步骤1)、采用卷积神经网络从待处理图像进行特征提取,对提取的特征图像进行多次池化、卷积处理得到预处理特征图像;
步骤2)、采用多视域池化金字塔提取步骤1)中得到的预处理特征图像的多尺度特征信息特征图;
步骤3)、在步骤1)中提取的特征图像进行倒数第二次池化、卷积处理得到特征图像和步骤2)中得到的多尺度特征信息图上分别建立人体部位图模型,然后进行人体图卷积得到多个人体图卷积后的特征图;
步骤4)、采用Nbox个锚点的预测框分别对人体图卷积后的特征图中的人体目标区域进行预测并识别,完成预测框及预测类别概率值,即完成行人目标的检测。


2.根据权利要求1所述的一种基于多视域图卷积网络的行人检测方法,其特征在于,构建多分辨率和多视域特征金字塔模型,包含四个用于对采集的特征图的空间大小进行下采样的最大池化层,利用四个最大池化层依次进行池化后得到具有不同空间分辨率的五个特征图。


3.根据权利要求2所述的一种基于多视域图卷积网络的行人检测方法,其特征在于,具体包括以下步骤:
步骤1.1,采用卷积神经网络将待处理图像缩放至分辨率为300×300得到缩放后的图像A;
步骤1.2,采用2组卷积层对图像A进行卷积得到300×300大小的特征图像B,每组卷积采用64个卷积核;
步骤1.3,对特征图像B进行池化,得到分辨率为150×150的特征图像BP,并采用2组卷积层对特征图像BP进行卷积,每组卷积采用128个卷积核,得到150×150大小的特征图像C;
步骤1.4,对特征图像C进行池化,得到分辨率为75×75的特征图像CP,并采用3组卷积层对特征图像CP进行卷积,每组卷积采用256个卷积核,得到75×75大小的特征图像D;
步骤1.5,对特征图像D进行池化,得到分辨率为38×38的特征图像DP,并采用3组卷积层对特征图像DP进行卷积,每组卷积采用512个卷积核,得到38×38大小的特征图像E;
步骤1.6,对特征图像E进行池化,得到分辨率为19×19的特征图像EP,并采用3组卷积层对特征图像EP进行卷积,每组卷积采用512个卷积核,得到19×19大小的预处理特征图像F。


4.根据权利要求3所述的一种基于多视域图卷积网络的行人检测方法,其特征在于,步骤2)具体包括以下步骤:
步骤2.1,对19×19大小的预处理特征图像F,分别使用分辨率为1×1、3×3和5×5的卷积核进行卷积成分辨率为19×19大小的特征图F1、特征图F2和特征图F3;
步骤2.2,分别对特征图F1,特征图F2和特征图F3采用不同间隔的空洞卷积进行多视域特征的提取分别得到19×19大小的特征图Fmrc1,特征图Fmrc2和特征图Fmrc3;
步骤2.3,对19×19大小的特征图Fmrc1,特征图Fmrc2和特征图Fmrc3分别进行4次最大池化操作分别得到特征图Fmrc1,特征图Fmrc2和特征图Fmrc3的5组不同尺度的池化特征图;
步骤2.4,对步骤2.3得到的15组池化特征图中相同尺寸的池化特征进行连接得到多尺度特征信息。


5.根据权利要求4所述的一种基于多视域图卷积网络的行人检测方法,其特征在于,其中分辨率为5×5的卷积核采用1个分辨率为1×1和2个分辨率为3×3的卷积核。


6.根据权利要求4所述的一种基于多视域图卷积网络的行人检测方法,其特征在于,采用空洞为1的3×3卷积核对特征图F1进行卷积...

【专利技术属性】
技术研发人员:刘占文沈超高涛樊星徐江王润民窦瑞娟阿比班邵雄齐明远曾高文范颂华
申请(专利权)人:长安大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1