一种基于卷积神经网络的行人检测方法技术

技术编号:32130664 阅读:61 留言:0更新日期:2022-01-29 19:29
本发明专利技术公开了一种基于卷积神经网络的行人检测方法,涉及计算机视觉中的深度学习领域,该方法利用卷积神经网络检测出行人,可以根据检测目标的尺寸不同动态的选择训练分支,得到更加准确的行人特征描述,无需手动设计行人特征,并且其检测准确率较高,检测速度较快,省时省力,可以应用在自动驾驶,辅助驾驶系统,安保系统以及机器人等多个领域,并且因为其基于深度学习方法,可以根据不同的应用场景获取不同的行人数据集进行训练,使其能够适用多种不同的领域,并且保持较高的检测准确率。并且保持较高的检测准确率。并且保持较高的检测准确率。

【技术实现步骤摘要】
一种基于卷积神经网络的行人检测方法


[0001]本专利技术属于计算机视觉中的目标检测领域,特别是一种基于卷积神经网络的行人检测方法。

技术介绍

[0002]行人检测技术是在给定的图像上判断是否有行人,并且要标注出行人的位置,一般使用矩形框进行标注,行人检测技术可以与行人跟踪、行人重识别等技术相结合,应用于汽车无人驾驶系统(ADAS)、智能机器人、智能视频监控、人体行为分析、客流统计系统以及智能交通等领域。
[0003]传统的行人检测方法包括背景差法、帧差法、光流法、模板匹配法以及基于机器学习的方法,此类方法由于行人姿态变化,行人所处的环境较为复杂的因素检测精度不高,所以就催生了基于深度学习的行人检测方法,基于深度学习的行人检测方法检测精度远远高于其他传统方法,应用领域广泛;同时基于深度学习的目标检测方法大致分为单阶段法与两阶段法,其中单阶段法检测速度快,但检测精度略低于两阶段法,而两阶段法虽然检测精度较高,但是由于其检测速度过低,不能应用于实际检测的检测环境中,所以本专利技术就提供了一种能应用于实际检测环境中的行人检测方法。

技术实现思路

[0004]本专利技术的目的在于提供一种基于卷积神经网络的行人检测方法,以解决行人检测领域中传统方法检测精度低,以及基于两阶段法检测速度过慢的问题。
[0005]实现本专利技术目的的技术解决方案为:一种基于卷积神经网络的行人检测方法,所述方法包括以下步骤:
[0006]步骤A,采集行人图像数据集且进行预处理,并将数据集按照预设比例划分为训练集以及测试集;
[0007]步骤B,构建卷积神经网络模型,并对模型中的参数进行初始化设置;
[0008]步骤C,标注训练集图像中目标的尺寸,利用训练集训练所述卷积神经网络模型;
[0009]步骤D,利用训练好的深度卷积神经网络模型检测行人,得到准确位置的行人检测框。
[0010]进一步地,步骤B所述构建卷积神经网络模型,并对模型中的参数进行初始化设置,具体过程包括:
[0011]步骤B1,构建用于提取行人图像中的特征的特征提取网络,并对其进行参数初始化;
[0012]步骤B2,构建用于对不同尺寸的目标的图像分别进行处理的特征提取分支网络,并对其进行参数初始化;
[0013]步骤B3,构建行人回归网络,并对其进行参数初始化。
[0014]进一步地,步骤B1中所述特征提取网络具体包括依次连接的:第一卷积层、最大池
化层、三个相同的第一残差模块、四个相同的第二残差模块、六个相同的第三残差模块、以及三个相同的第四残差模块,网络的输入与第一残差模块的输出相连;所述第一卷积层的卷积核大小为7
×
7、通道数为64、步长为2,最大池化层的卷积核为3
×
3、步长为2;所述第一残差模块包括依次连接的卷积核为1
×
1、通道数为64的卷积层,卷积核为3
×
3、通道数为64的卷积层,以及卷积核为1
×
1、通道数为256的卷积层;所述第二残差模块包括依次连接的卷积核为1
×
1、通道数为128的卷积层,卷积核为3
×
3,通道数为128的卷积层,以及卷积核为1
×
1、通道数为512的卷积层;所述第三残差模块包括依次连接的卷积核为1
×
1、通道数为256的卷积层,卷积核为3
×
3、通道数为256的卷积层,以及卷积核为1
×
1、通道数为1024的卷积层;所述第四残差模块包括依次连接的卷积核为1
×
1、通道数为512的卷积层,卷积核为3
×
3、通道数为512的卷积层,以及卷积核为1
×
1,通道数为2048的卷积层;
[0015]对所述特征提取网络进行参数初始化,具体包括:
[0016](1)设置残差模块参数,卷积层参数以及池化层参数,其中残差模块的前向传播公式如式(1)所示:
[0017][0018]其中,x
L
表示残差模块的输出,x
l
表示残差模块的输入,表示对输入进行卷积操作,F(
·
)表示卷积函数,W
i
表示卷积结构的待训练参数;
[0019]残差模块的逆向传播公式如式(2)所示:
[0020][0021]卷积层的前向传播公式如式(3)所示:
[0022][0023]式中,f表示激励函数,l表示层数,m和n表示上一层和当前层上特征图的映射编号,表示当前第l层的第n个特征图,表示第l

1层的第m个特征图,表示第l层的第n个特征图与第l

1层的第m个特征图之间相关的卷积核,表示第l层的第n个特征图对应的偏置,M
n
表示输入特征图的一个子集,*表示卷积操作;
[0024]卷积层的逆向误差传播公式如式(4)所示:
[0025][0026]式中,表示第l层的第n个神经节点的灵敏度,表示下采样层的权值,o表示点乘,up()表示上采样操作,f
T
(
·
)表示对函数f求转置,其中,和分别表示第l层第n个特征图对应的权值和偏导,表示第l

1层的第n个特征图;
[0027]卷积层的偏置以及卷积核的反向传播公式分别如式(5)、(6)所示:
[0028][0029][0030]式中,E表示损失函数,为计算卷积时的每一个小区域,u、v分别表示灵敏度中的元素位置;
[0031]对于池化层前向传播,直接对上一层的特征图相邻的4个像素进行求均值即可,而对于池化层的反向传播,当池化层的下一层是卷积层时,其反向误差传播公式如式(7)所示:
[0032][0033]式中,M表示输入特征的集合,表示第l+1层的第n个特征图与第l层第m个特征图之间相关的卷积核,表示第l+1层的第n个神经节点的灵敏度,表示第l层的第m个神经节点的灵敏度;当池化层的下一层不是卷积层时,池化层的反向误差传播与BP网络误差传播形式相同;
[0034](2)采用高斯初始化对特征提取网络进行初始化操作。
[0035]进一步地,所述特征提取分支网络的输入为特征提取网络的输出,包括三路分支,每一路分支包括依次连接的1
×
1卷积层、3
×
3卷积层、1
×
1卷积层,分支的输入与输出相连,同时每个分支与其他分支共享权值,三路分支的区别在于空洞卷积的膨胀率不同,分别设置为1,2,3;
[0036]对所述特征提取分支网络进行参数初始化,具体包括:
[0037](1)设置空洞卷积的参数,空洞卷积的前向传播公式以及反向传播公式与卷积层的前向传播以及反向传播相同,如式(5)、式(6)所示,空洞卷积感受野的计算公式如式(8)所示:
[0038][0039]式中,r
n
‑1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的行人检测方法,其特征在于,所述方法包括以下步骤:步骤A,采集行人图像数据集且进行预处理,并将数据集按照预设比例划分为训练集以及测试集;步骤B,构建卷积神经网络模型,并对模型中的参数进行初始化设置;步骤C,标注训练集图像中目标的尺寸,利用训练集训练所述卷积神经网络模型;步骤D,利用训练好的深度卷积神经网络模型检测行人,得到准确位置的行人检测框。2.根据权利要求1所述的基于卷积神经网络的行人检测方法,其特征在于,步骤A中所述预处理包括高斯滤波以及归一化处理,具体过程包括:步骤A1a,将行人图像数据集中图像的大小统一设置为512x512,对图像进行高斯滤波,所用公式为:式中,(x,y)为图像中点的坐标,σ为标准差;步骤A1b,对图像中的每一个像素进行归一化,所用公式为:式中,(i,j)表示图像中像素的位置,x
ij
表示位置(i,j)的像素值,x
min
、x
max
分别表示图像中像素的最小值与最大值。3.根据权利要求1或2所述的基于卷积神经网络的行人检测方法,其特征在于,步骤B所述构建卷积神经网络模型,并对模型中的参数进行初始化设置,具体过程包括:步骤B1,构建用于提取行人图像中的特征的特征提取网络,并对其进行参数初始化;步骤B2,构建用于对不同尺寸的目标的图像分别进行处理的特征提取分支网络,并对其进行参数初始化;步骤B3,构建行人回归网络,并对其进行参数初始化。4.根据权利要求3所述的基于卷积神经网络的行人检测方法,其特征在于,步骤B1中所述特征提取网络具体包括依次连接的:第一卷积层、最大池化层、三个相同的第一残差模块、四个相同的第二残差模块、六个相同的第三残差模块、以及三个相同的第四残差模块,网络的输入与第一残差模块的输出相连;所述第一卷积层的卷积核大小为7
×
7、通道数为64、步长为2,最大池化层的卷积核为3
×
3、步长为2;所述第一残差模块包括依次连接的卷积核为1
×
1、通道数为64的卷积层,卷积核为3
×
3、通道数为64的卷积层,以及卷积核为1
×
1、通道数为256的卷积层;所述第二残差模块包括依次连接的卷积核为1
×
1、通道数为128的卷积层,卷积核为3
×
3,通道数为128的卷积层,以及卷积核为1
×
1、通道数为512的卷积层;所述第三残差模块包括依次连接的卷积核为1
×
1、通道数为256的卷积层,卷积核为3
×
3、通道数为256的卷积层,以及卷积核为1
×
1、通道数为1024的卷积层;所述第四残差模块包括依次连接的卷积核为1
×
1、通道数为512的卷积层,卷积核为3
×
3、通道数为512的卷积层,以及卷积核为1
×
1,通道数为2048的卷积层;对所述特征提取网络进行参数初始化,具体包括:(1)设置残差模块参数,卷积层参数以及池化层参数,其中残差模块的前向传播公式如
式(3)所示:其中,x
L
表示残差模块的输出,x
l
表示残差模块的输入,表示对输入进行卷积操作,F(
·
)表示卷积函数,W
i
表示卷积结构的待训练参数;残差模块的逆向传播公式如式(4)所示:卷积层的前向传播公式如式(5)所示:式中,f表示激励函数,l表示层数,m和n表示上一层和当前层上特征图的映射编号,表示当前第l层的第n个特征图,表示第l

1层的第m个特征图,表示第l层的第n个特征图与第l

1层的第m个特征图之间相关的卷积核,表示第l层的第n个特征图对应的偏置,M
n
表示输入特征图的一个子集,*表示卷积操作;卷积层的逆向误差传播公式如式(6)所示:式中,表示第l层的第n个神经节点的灵敏度,表示下采样层的权值,o表示点乘,up()表示上采样操作,f
T
(
·
)表示对函数f求转...

【专利技术属性】
技术研发人员:李军付孟祥刘江余瑞欣鲍雯
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1