【技术实现步骤摘要】
一种基于卷积神经网络的行人检测方法
[0001]本专利技术属于计算机视觉中的目标检测领域,特别是一种基于卷积神经网络的行人检测方法。
技术介绍
[0002]行人检测技术是在给定的图像上判断是否有行人,并且要标注出行人的位置,一般使用矩形框进行标注,行人检测技术可以与行人跟踪、行人重识别等技术相结合,应用于汽车无人驾驶系统(ADAS)、智能机器人、智能视频监控、人体行为分析、客流统计系统以及智能交通等领域。
[0003]传统的行人检测方法包括背景差法、帧差法、光流法、模板匹配法以及基于机器学习的方法,此类方法由于行人姿态变化,行人所处的环境较为复杂的因素检测精度不高,所以就催生了基于深度学习的行人检测方法,基于深度学习的行人检测方法检测精度远远高于其他传统方法,应用领域广泛;同时基于深度学习的目标检测方法大致分为单阶段法与两阶段法,其中单阶段法检测速度快,但检测精度略低于两阶段法,而两阶段法虽然检测精度较高,但是由于其检测速度过低,不能应用于实际检测的检测环境中,所以本专利技术就提供了一种能应用于实际检测环境中的行人检测方法。
技术实现思路
[0004]本专利技术的目的在于提供一种基于卷积神经网络的行人检测方法,以解决行人检测领域中传统方法检测精度低,以及基于两阶段法检测速度过慢的问题。
[0005]实现本专利技术目的的技术解决方案为:一种基于卷积神经网络的行人检测方法,所述方法包括以下步骤:
[0006]步骤A,采集行人图像数据集且进行预处理,并将数据集按照预设比例划分为训练集 ...
【技术保护点】
【技术特征摘要】
1.一种基于卷积神经网络的行人检测方法,其特征在于,所述方法包括以下步骤:步骤A,采集行人图像数据集且进行预处理,并将数据集按照预设比例划分为训练集以及测试集;步骤B,构建卷积神经网络模型,并对模型中的参数进行初始化设置;步骤C,标注训练集图像中目标的尺寸,利用训练集训练所述卷积神经网络模型;步骤D,利用训练好的深度卷积神经网络模型检测行人,得到准确位置的行人检测框。2.根据权利要求1所述的基于卷积神经网络的行人检测方法,其特征在于,步骤A中所述预处理包括高斯滤波以及归一化处理,具体过程包括:步骤A1a,将行人图像数据集中图像的大小统一设置为512x512,对图像进行高斯滤波,所用公式为:式中,(x,y)为图像中点的坐标,σ为标准差;步骤A1b,对图像中的每一个像素进行归一化,所用公式为:式中,(i,j)表示图像中像素的位置,x
ij
表示位置(i,j)的像素值,x
min
、x
max
分别表示图像中像素的最小值与最大值。3.根据权利要求1或2所述的基于卷积神经网络的行人检测方法,其特征在于,步骤B所述构建卷积神经网络模型,并对模型中的参数进行初始化设置,具体过程包括:步骤B1,构建用于提取行人图像中的特征的特征提取网络,并对其进行参数初始化;步骤B2,构建用于对不同尺寸的目标的图像分别进行处理的特征提取分支网络,并对其进行参数初始化;步骤B3,构建行人回归网络,并对其进行参数初始化。4.根据权利要求3所述的基于卷积神经网络的行人检测方法,其特征在于,步骤B1中所述特征提取网络具体包括依次连接的:第一卷积层、最大池化层、三个相同的第一残差模块、四个相同的第二残差模块、六个相同的第三残差模块、以及三个相同的第四残差模块,网络的输入与第一残差模块的输出相连;所述第一卷积层的卷积核大小为7
×
7、通道数为64、步长为2,最大池化层的卷积核为3
×
3、步长为2;所述第一残差模块包括依次连接的卷积核为1
×
1、通道数为64的卷积层,卷积核为3
×
3、通道数为64的卷积层,以及卷积核为1
×
1、通道数为256的卷积层;所述第二残差模块包括依次连接的卷积核为1
×
1、通道数为128的卷积层,卷积核为3
×
3,通道数为128的卷积层,以及卷积核为1
×
1、通道数为512的卷积层;所述第三残差模块包括依次连接的卷积核为1
×
1、通道数为256的卷积层,卷积核为3
×
3、通道数为256的卷积层,以及卷积核为1
×
1、通道数为1024的卷积层;所述第四残差模块包括依次连接的卷积核为1
×
1、通道数为512的卷积层,卷积核为3
×
3、通道数为512的卷积层,以及卷积核为1
×
1,通道数为2048的卷积层;对所述特征提取网络进行参数初始化,具体包括:(1)设置残差模块参数,卷积层参数以及池化层参数,其中残差模块的前向传播公式如
式(3)所示:其中,x
L
表示残差模块的输出,x
l
表示残差模块的输入,表示对输入进行卷积操作,F(
·
)表示卷积函数,W
i
表示卷积结构的待训练参数;残差模块的逆向传播公式如式(4)所示:卷积层的前向传播公式如式(5)所示:式中,f表示激励函数,l表示层数,m和n表示上一层和当前层上特征图的映射编号,表示当前第l层的第n个特征图,表示第l
‑
1层的第m个特征图,表示第l层的第n个特征图与第l
‑
1层的第m个特征图之间相关的卷积核,表示第l层的第n个特征图对应的偏置,M
n
表示输入特征图的一个子集,*表示卷积操作;卷积层的逆向误差传播公式如式(6)所示:式中,表示第l层的第n个神经节点的灵敏度,表示下采样层的权值,o表示点乘,up()表示上采样操作,f
T
(
·
)表示对函数f求转...
【专利技术属性】
技术研发人员:李军,付孟祥,刘江,余瑞欣,鲍雯,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。