一种面向监控场景中行人目标的轻量化检测方法技术

技术编号:36609279 阅读:15 留言:0更新日期:2023-02-08 09:56
本发明专利技术涉及面向监控场景中行人目标的轻量化检测方法,将CSPDarknet53中第一个标准卷积模块以外的所有卷积层均使用去冗余卷积模块替代,得到了更加轻量化的特征提取网络CompactNet;在将CompactNet提取到的特征输入到YOLOv5检测网络时,延续了YOLOv5与CSPDarknet

【技术实现步骤摘要】
一种面向监控场景中行人目标的轻量化检测方法


[0001]本专利技术属于视频处理和图像智能分析
,涉及一种面向监控场景中行人目标的轻量化检测方法。

技术介绍

[0002]目标检测算法分为两大类:传统方法和基于深度学习的方法。传统的目标检测中,比较经典的方法包括HOG和SIFT等。而基于深度学习的目标检测算法,其检测精度远远高于传统的目标检测算法,比较经典的方法包括Faster R

CN、FPN、YOLO、SSD、RefineDet、SNIPER、YOLOv5、Centernet、Fcos等。从以Faster R

CNN为代表的高精度、低速度的two

stage算法,到以YOLO为代表的低精度、高速度的one

stage算法,再到后来的YOLOv5为代表的高精度、高速度的one

stage算法,可以说,在目标检测的发展过程中,实用性一直是一个重要的发展方向。目前YOLOv5仍然是所有的检测算法中在速度和精度之间做出了较好权衡的目标检测网络。
[0003]目标检测算法往往需要部署在嵌入式系统,甚至移动终端上,并且实时输出检测结果,虽然目标检测网络的性能得到了提高,但是近百层的神经网络模型的计算开销和参数体量巨大,因而对于模型轻量化的需求尤为突出。近几年有很多的轻量化模型被提出,包括SqueezeNet、MobileNet、ShuffleNet、MobileNetv2、ShuffleNetv2、MobileNetv3、GhostNet、TinyNet等,这些模型的主要思想在于设计更加高效的卷积神经网络的计算方式,从而使得模型参数量大大降低的同时,尽量将模型的性能保持在一个相对较高的水平上。其中,SqueezeNet主要通过1
×
1的卷积对通道数进行压缩,随后再使用1
×
1和3
×
3的卷积分别提取特征之后进行通道维度上的拼接操作降低网络参数。MobileNet和ShuffleNet均利用了depthwise convolution,只是随后为了解决depthwise convolution带来的信息流通不畅的问题而分别采用了不同的方法,MobileNet采用了pointwise convolution而ShuffleNet采用了channel shuffle。GhostNet对沿通道方向压缩后的特征进行简单的线性变换和恒等映射来降低模型参数量。上述方法虽已显著降低了模型参数量和计算开销,但在一些对空间和功耗要求苛刻的场景,仍然无法满足要求。例如,YOLOv5仅特征提取网络的参数量就达到27.3M,仍然很难部署在一些低成本的嵌入式平台。

技术实现思路

[0004]本专利技术的目的在于克服现有技术的不足,从减少模型冗余参数的角度出发,提供一种面向监控场景中行人目标的轻量化检测方法。
[0005]本专利技术的技术方案如下:
[0006]面向监控场景中行人目标的轻量化检测方法,其特征在于包括以下步骤:
[0007](1)构造数据集,以RGB图像作为输入,通过CompactNet网络进行特征提取,分别得到分辨率为输入图像的8倍和16倍下采样的特征图F8和F
16
作为细粒度特征,并将得到的分辨率为输入图像的32倍下采样的特征图F
32
作为语义特征;
[0008](2)通过标准卷积模块对F
32
进行特征变换,然后进行上采样操作将其分辨率放大为与F
16
一致并与F
16
沿通道方向拼接在一起得到新的特征图
[0009](3)通过标准卷积模块对进行特征变换,然后进行上采样操作将其分辨率放大为与F8一致并与F8沿通道方向拼接在一起得到新的特征图
[0010](4)借助标准卷积模块对F
32
、和进行进一步的特征提取,并使用标准的卷积操作对提取到的特征进行增强,随后在三个不同细粒度的特征图上进行互相独立的分类和回归,得到3个检测目标集合S
32
、S
16
和S8;
[0011](5)将检测目标集合S
32
、S
16
和S0中置信度高于检测阈值的结果合并到一个集合中,并对该合集中的所有检测目标通过NMS算法去掉同一目标的重叠检测框,最后将合集中剩下的目标作为检测模型最终的预测结果。
[0012]本专利技术以当前性能较好的目标检测网络YOLOv5为基础,通过引入一种新颖的去冗余卷积模块(compact convolution),提出了一种新型超轻量化目标检测网络模型。该模型借鉴CSPDarknet

53的网络结构,使用去冗余卷积模块替换网络中的标准卷积模块,提出了更加轻量化的特征提取网络(CompactNet)。
[0013]本专利技术首先将CSPDarknet

53中的标准卷积换成了MobileNetv2中的深度可分离卷积,得到了轻量化特征提取网络CSPMobilenetV2。然后将CSPDarknet

53中的标准卷积换成了去冗余卷积,得到了更加轻量化的特征提取网络CompactNet。三者参数量的对比实验如表1所示。
[0014][0015][0016]表1模型参数对比
[0017]从中可以看出,通过使用本专利技术提出的去冗余卷积,CompactNet相比标准卷积模型CSPDarknet

53减少了81.3%的参数量,相比轻量化网络MobilenetV2减少了62.8%的参数量,实验结果表明,新的网络模型(CompactNet)在精度略微下降的前提下,大大降低了原模型的参数体量,取得了非常好的轻量化效果。
[0018]而且,以CompactNet进行特征提取的轻量化检测器能够适应各种场景、天气和光照的变化,具有较强的鲁棒性,检测效果稳定。
附图说明
[0019]图1是去冗余卷积模块的处理流程示意图。
具体实施方式
[0020]本专利技术借鉴了YOLOv5的检测网络结构和特征提取网络结构:将CSPDarknet53中第一个标准卷积模块以外的所有卷积层均使用去冗余卷积模块替代,得到了更加轻量化的特
征提取网络CompactNet;在将CompactNet提取到的特征输入到YOLOv5检测网络时,延续了YOLOv5与CSPDarknet

53连接的规则,即分别将CompactNet中分辨率为输入图像的8倍、16倍和32倍下采样的特征层中的最后一层作为细粒度特征与检测网络中上采样之后的高级语义特征融合,增强网络的物体识别能力,尤其是小目标。
[0021]本专利技术提出了新的去冗余卷积模块,其具体结构如图1所示。
[0022]在对场景限定、种类限定的图像目标进行检测时,比如监控场景下的行人检测,现有的基于深度学习的检测器中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向监控场景中行人目标的轻量化检测方法,其特征在于包括以下步骤:(1)构造数据集,以RGB图像作为输入,通过CompactNet网络进行特征提取,分别得到分辨率为输入图像的8倍和16倍下采样的特征图F8和F
10
作为细粒度特征,并将得到的分辨率为输入图像的32倍下采样的特征图F
32
作为语义特征;(2)通过标准卷积模块对F
32
进行特征变换,然后进行上采样操作将其分辨率放大为与F
16
一致并与F
16
沿通道方向拼接在一起得到新的特征图(3)通过标准卷积模块对进行特征变换,然后进行上采...

【专利技术属性】
技术研发人员:杨振
申请(专利权)人:北京航天长峰科技工业集团有限公司北京分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1