一种基于超大卷积核的近距离人体检测的方法及系统技术方案

技术编号:36350450 阅读:55 留言:0更新日期:2023-01-14 18:05
本发明专利技术涉及人体检测技术领域,提供一种基于超大卷积核的近距离人体检测的方法,包括:步骤100,获取检测图片;步骤200,将检测图片输入特征提取网络中,进行特征提取,得到特征图;特征提取网络采用SLaK网络;SLaK网络结构,包括:Stem模块、Res2模块、Res3模块、Res4模块、Res5模块;所述Res2模块、Res3模块、Res4模块、Res5模块的重复个数依次为2、3、5、2;步骤300,将输出的特征图,依次输入一个3

【技术实现步骤摘要】
一种基于超大卷积核的近距离人体检测的方法及系统


[0001]本专利技术涉及人体检测
,尤其涉及一种基于超大卷积核的近距离人体检测的方法及系统。

技术介绍

[0002]在深度学习视觉领域,智慧城市,智慧社区,智能安防,智慧校园,人机互动游戏等领域,人体检测识别是一项重要的任务。为了确保算法在各个场景的速度和精度,需要提高人体检测的速度和精度。
[0003]目前深度学习视觉领域出名的算法有单阶段的YOLO系列,Centernet;双阶段的Faster rcnn(faster regions with cnn features)等网络算法,对图片进行特征提取,进行深度学习算法训练和测试。
[0004]但在很多人机互动游戏里,人体距离摄像头距离很近,大约只有二米到三米的距离,且人体检测算法主要检测最核心的一个人或二个人,人体占据整个屏幕很大的面积,这就对算法的速度和精度要求很高。现有的神经网络检测算法无法对距离摄像头很近的场景有更强的针对性,无法对当前场景的人体进行更为准确的检测。

技术实现思路

[0005]本专利技术主要解决现有的神经网络检测算法无法对距离摄像头很近的场景有更强的针对性,无法对当前场景的人体进行更为准确检测的技术问题,提出一种基于超大卷积核的近距离人体检测的方法及系统,以提高近距离人体检测的速度和精度。
[0006]本专利技术提供了一种基于超大卷积核的近距离人体检测的方法,包括以下过程:
[0007]步骤100,获取检测图片;
[0008]步骤200,将检测图片输入特征提取网络中,进行特征提取,得到特征图;其中,所述特征提取网络采用SLaK网络;所述SLaK网络结构,包括:Stem模块、Res2模块、Res3模块、Res4模块、Res5模块;所述Res2模块、Res3模块、Res4模块、Res5模块的重复个数依次为2、3、5、2;
[0009]步骤300,将输出的特征图,依次输入一个3
×
3的卷积层和一个1
×
1的卷积层,预测出一个类别信息和二个候选框;
[0010]步骤400,用非最大抑制去除冗余候选框,得到最终的人体信息。
[0011]优选的,所述Stem模块由2d卷积层搭建,其卷积核和步长都是4。
[0012]优选的,所述Res2模块、Res3模块、Res4模块、Res5模块卷积核大小依次为61、49、17、7。
[0013]优选的,所述Res2模块、Res3模块、Res4模块、Res5模块分别由逆瓶颈层组成;所述逆瓶颈层,包括:级联的SLaK Block模块和二个1
×
1卷积层;其中,SLaK Block模块采用61
×
5和5
×
61和5
×
5三个卷积核,在SLaK Block模块后采用Layer Norm归一化层;在二个1
×
1卷积层之间使用GELU激活函数。
[0014]优选的,在SLaK网络结构中,各模块之间具有降采样模块;
[0015]所述降采样模块包括级联的归一化层和卷积核为2步长也为2的卷积层。
[0016]优选的,输入检测图片大小为416
×
416
×
3,得到最终的特征图大小为13
×
13
×
11。
[0017]优选的,每个候选框要预测物体的坐标信息(x,y,w,h)和置信度共5个值;其中,x表示预测物体中心点横坐标,y表示预测物体中心点纵坐标,w表示预测物体的宽度,h表示预测物体的高度。
[0018]对应的,本专利技术还提供一种基于超大卷积核的近距离人体检测的系统,包括:图片获取模块、特征提取模块、预测模块和去冗余候选框模块;
[0019]所述图片获取模块,用于获取检测图片;
[0020]所述特征提取模块,用于将检测图片输入特征提取网络中,进行特征提取,得到特征图;
[0021]所述特征提取网络采用SLaK网络;所述SLaK网络结构,包括:Stem模块、Res2模块、Res3模块、Res4模块、Res5模块;Res2模块、Res3模块、Res4模块、Res5模块的重复个数依次为2、3、5、2;
[0022]所述预测模块,用于将输出的特征图,依次输入一个3
×
3的卷积层和一个1
×
1的卷积层,预测出一个类别信息和二个候选框;
[0023]所述去冗余候选框模块,用于用非最大抑制去除冗余候选框,得到最终的人体信息。
[0024]本专利技术提供的一种基于超大卷积核的近距离人体检测的方法及系统,采用拥有超大卷积核的Slak作为骨干网络,把拥有超大卷积核的backbone对图片进行特征提取,该基准网络整合了大量最前沿的计算机视觉技术,改善了纯卷积神经网络的性能,可以提取更好的特征。同时,模型的参数量和计算复杂度没有大量增加,保持了网络的轻便。不同于传统的广泛应用的3*3卷积核,不能为深层的网络提供有效的感受野,学习能力有限;本专利技术增大卷积核,卷积核大小可以取到7
×
7、31
×
31,甚至最大取到61
×
61,本专利技术网络具有大卷积核,超大卷积网络具有更强的计算能力和更大的感受野,学习和建模能力更强大,从而提高网络特征性能,用于最后的人体检测,进一步提升模型对人体检测的准确度和性能。
附图说明
[0025]图1是本专利技术提供的基于超大卷积核的近距离人体检测的方法的实现流程图;
[0026]图2是本专利技术提供的SLaK网络结构的示意图;
[0027]图3是本专利技术提供的Res2模块的示意图;
[0028]图4是本专利技术提供的Res3模块的示意图;
[0029]图5是本专利技术提供的Res4模块的示意图;
[0030]图6是本专利技术提供的Res5模块的示意图;
[0031]图7是本专利技术提供的SLaK Block模块的示意图;
[0032]图8是本专利技术提供的降采样模块的示意图;
[0033]图9是本专利技术提供的基于超大卷积核的近距离人体检测的系统的示意图。
具体实施方式
[0034]为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。
[0035]实施例一
[0036]如图1所示,本专利技术实施例提供的基于超大卷积核的近距离人体检测的方法,包括以下过程:
[0037]步骤100,获取检测图片。
[0038]检测图片可通过图像采集设备进行采集,也可以上传设备自身保存的图片。所述图像采集设备不限于手机、高速运动相机等。采集后的检测图片,进行数据预处理。
[0039本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超大卷积核的近距离人体检测的方法,其特征在于,包括以下过程:步骤100,获取检测图片;步骤200,将检测图片输入特征提取网络中,进行特征提取,得到特征图;其中,所述特征提取网络采用SLaK网络;所述SLaK网络结构,包括:Stem模块、Res2模块、Res3模块、Res4模块、Res5模块;所述Res2模块、Res3模块、Res4模块、Res5模块的重复个数依次为2、3、5、2;步骤300,将输出的特征图,依次输入一个3
×
3的卷积层和一个1
×
1的卷积层,预测出一个类别信息和二个候选框;步骤400,用非最大抑制去除冗余候选框,得到最终的人体信息。2.根据权利要求1所述的基于超大卷积核的近距离人体检测的方法,其特征在于,所述Stem模块由2d卷积层搭建,其卷积核和步长都是4。3.根据权利要求2所述的基于超大卷积核的近距离人体检测的方法,其特征在于,所述Res2模块、Res3模块、Res4模块、Res5模块卷积核大小依次为61、49、17、7。4.根据权利要求3所述的基于超大卷积核的近距离人体检测的方法,其特征在于,所述Res2模块、Res3模块、Res4模块、Res5模块分别由逆瓶颈层组成;所述逆瓶颈层,包括:级联的SLaK Block模块和二个1
×
1卷积层;其中,SLaK Block模块采用61
×
5和5
×
61和5
×
5三个卷积核,在SLaK Block模块后采用Layer Norm归一化层;在二个1
×
1卷积层之间使...

【专利技术属性】
技术研发人员:李翔韩潼瑜程文锋
申请(专利权)人:功夫链上海体育文化发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1