一种用于道路监控场景的无锚框快速行人检测方法及系统技术方案

技术编号:39778394 阅读:6 留言:0更新日期:2023-12-22 02:24
本申请涉及一种用于道路监控场景的无锚框快速行人检测方法及系统,所述方法包括以下步骤:

【技术实现步骤摘要】
一种用于道路监控场景的无锚框快速行人检测方法及系统


[0001]本申请涉及行人检测的
,尤其是涉及一种用于道路监控场景的无锚框快速行人检测方法及系统


技术介绍

[0002]主流的目标检测方法可以分为二阶段方法和一阶段方法两类

二阶段方法诸如
Faster R

CNN、Mask R

CNN
等方法先在图像中确定检测对象的候选框,而后对各个候选框进行检测与修正,得到预测框

这类方法检测精度较高,但速度较慢

目前,具备实时性要求的道路行人检测算法绝大多数是基于各版本
YOLO
等一阶段方法的框架实现的

对于最主流的
YOLO v5

v7
模型,由于其锚框设置决定了检测器的表现,虽然预设的锚框设置合理时能够涵盖大部分检测对象,但是仍然可能存在一些特定尺度的对象模型检测效果不佳的情况

且道路监控场景的摄像头机位复杂多变,预设的锚框往往无法涵盖所有场景,可能影响检测系统鲁棒性
。YOLO v8
虽然时无锚框设计,但本质上是输出了给定尺度范围的一组预测框,因此在多个结构下输出维度均是增加的,且带来了更高的模型训练难度

技术实现思路

[0003]针对上述
技术介绍
中的技术问题
,
本申请提出了一种用于道路监控场景的无锚框快速行人检测方法及系统

[0004]第一方面,本申请提出了一种用于道路监控场景的无锚框快速行人检测方法,包括以下步骤:
[0005]S1
:使用特征提取网络提取道路监控图像特征
x

[0006]S2
:将道路监控图像特征
x
输入自定义的实例积分模块,获得实例积分值
s

[0007]S3
:将特征网络输出
f
和实例积分值
s
输入检测头进行行人检测

[0008]通过采用上述技术方案,在特征提取网络后连接自研的实例积分模块,之后直接连接单个检测头,大幅缩减了模型层数与输出维度,从而提升检测系统的推理速度和在道路监控场景下的行人检测性能

[0009]优选的,所述
S2
中的自定义的实例积分模块由以下步骤获得:
[0010]S201
:对特征图的每个像素位置,输入线性层计算出查询
q、
键值
k
以及数值
v

[0011]S202
:计算
k
矩阵最后两维的转置;
[0012]S203
:计算
q

k
转置的矩阵乘积,获得每个像素点对特征图关联系数
r

[0013]S204
:利用自定义的
ScaledSiLU
函数将
r
的数值约束为值域在0到1之间的分布;
[0014]S205
:将
v
输入
softmax
函数后计算激活值;
[0015]S206
:计算
r
与激活后的
v
的矩阵乘积,获得实例积分值
s。
[0016]优选的,在所述
S204
中,所述自定义的
ScaledSiLU
函数为:
[0017]ScaledSiLU(x)

SiLU(x)/max[1,d*Mean(SiLU(x))];
[0018]其中,
d
为常系数

[0019]优选的,所述
S3
具体包括:将特征网络输出
f
和实例积分值
s
输入检测头,获得预测框坐标

置信度与预测类别

[0020]第二方面,本申请还提出了一种用于道路监控场景的无锚框快速行人检测系统,所述系统包括:
[0021]道路监控图像模块,配置用于使用特征提取网络提取道路监控图像特征
x

[0022]实例积分值计算模块,配置用于将道路监控图像特征
x
输入自定义的实例积分模块,获得实例积分值
s

[0023]行人检测模块,配置用于将特征网络输出
f
和实例积分值
s
输入检测头进行行人检测

[0024]优选的,所述实例积分值计算模块具体用于:
[0025]对特征图的每个像素位置,输入线性层计算出查询
q、
键值
k
以及数值
v

[0026]计算
k
矩阵最后两维的转置;
[0027]计算
q

k
转置的矩阵乘积,获得每个像素点对特征图关联系数
r

[0028]利用自定义的
ScaledSiLU
函数将
r
的数值约束为值域在0到1之间的分布;
[0029]将
v
输入
softmax
函数后计算激活值;
[0030]计算
r
与激活后的
v
的矩阵乘积,获得实例积分值
s。
[0031]优选的,所述自定义的
ScaledSiLU
函数为:
[0032]ScaledSiLU(x)

SiLU(x)/max[1,d*Mean(SiLU(x))];
[0033]其中,
d
为常系数

[0034]优选的,所述行人检测模块具体用于:将特征网络输出
f
和实例积分值
s
输入检测头,获得预测框坐标

置信度与预测类别

[0035]本申请提出了一种用于道路监控场景的无锚框快速行人检测方法,在无锚框设计的同时,不需计算多尺度的特征,在特征提取网络后连接自研的实例积分模块,之后直接连接单个检测头,大幅缩减了模型层数与输出维度,从而提升检测系统的推理速度和在道路监控场景下的行人检测性能

附图说明
[0036]包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分

附图图示了实施例并且与描述一起用于解释本申请的原理

将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解

附图的元件不一定是相互按照比例的

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:所述方法包括以下步骤:
S1
:使用特征提取网络提取道路监控图像特征
x

S2
:将道路监控图像特征
x
输入自定义的实例积分模块,获得实例积分值
s

S3
:将特征网络输出
f
和实例积分值
s
输入检测头进行行人检测
。2.
根据权利要求1所述的一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:所述
S2
中的自定义的实例积分模块由以下步骤获得:
S201
:对特征图的每个像素位置,输入线性层计算出查询
q、
键值
k
以及数值
v

S202
:计算
k
矩阵最后两维的转置;
S203
:计算
q

k
转置的矩阵乘积,获得每个像素点对特征图关联系数
r

S204
:利用自定义的
ScaledSiLU
函数将
r
的数值约束为值域在0到1之间的分布;
S205
:将
v
输入
softmax
函数后计算激活值;
S206
:计算
r
与激活后的
v
的矩阵乘积,获得实例积分值
s。3.
根据权利要求2所述的一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:在所述
S204
中,所述自定义的
ScaledSiLU
函数为:
ScaledSiLU(x)

SiLU(x)/max[1,d*Mean(SiLU(x))]
;其中,
d
为常系数
。4.
根据权利要求1所述的一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:所述
S3
具体包括:将...

【专利技术属性】
技术研发人员:张泽洋陈子沣周成祖蔡炎华魏超王海滨
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1