【技术实现步骤摘要】
一种用于道路监控场景的无锚框快速行人检测方法及系统
[0001]本申请涉及行人检测的
,尤其是涉及一种用于道路监控场景的无锚框快速行人检测方法及系统
。
技术介绍
[0002]主流的目标检测方法可以分为二阶段方法和一阶段方法两类
。
二阶段方法诸如
Faster R
‑
CNN、Mask R
‑
CNN
等方法先在图像中确定检测对象的候选框,而后对各个候选框进行检测与修正,得到预测框
。
这类方法检测精度较高,但速度较慢
。
目前,具备实时性要求的道路行人检测算法绝大多数是基于各版本
YOLO
等一阶段方法的框架实现的
。
对于最主流的
YOLO v5
和
v7
模型,由于其锚框设置决定了检测器的表现,虽然预设的锚框设置合理时能够涵盖大部分检测对象,但是仍然可能存在一些特定尺度的对象模型检测效果不佳的情况
。
且道路监控场景的摄像头机位复杂多变,预设的锚框往往无法涵盖所有场景,可能影响检测系统鲁棒性
。YOLO v8
虽然时无锚框设计,但本质上是输出了给定尺度范围的一组预测框,因此在多个结构下输出维度均是增加的,且带来了更高的模型训练难度
技术实现思路
[0003]针对上述
技术介绍
中的技术问题
,
本申请提出了一种用于道路监控场景的无锚框快速行人检测方法及系统
。
[ ...
【技术保护点】
【技术特征摘要】
1.
一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:所述方法包括以下步骤:
S1
:使用特征提取网络提取道路监控图像特征
x
;
S2
:将道路监控图像特征
x
输入自定义的实例积分模块,获得实例积分值
s
;
S3
:将特征网络输出
f
和实例积分值
s
输入检测头进行行人检测
。2.
根据权利要求1所述的一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:所述
S2
中的自定义的实例积分模块由以下步骤获得:
S201
:对特征图的每个像素位置,输入线性层计算出查询
q、
键值
k
以及数值
v
;
S202
:计算
k
矩阵最后两维的转置;
S203
:计算
q
与
k
转置的矩阵乘积,获得每个像素点对特征图关联系数
r
;
S204
:利用自定义的
ScaledSiLU
函数将
r
的数值约束为值域在0到1之间的分布;
S205
:将
v
输入
softmax
函数后计算激活值;
S206
:计算
r
与激活后的
v
的矩阵乘积,获得实例积分值
s。3.
根据权利要求2所述的一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:在所述
S204
中,所述自定义的
ScaledSiLU
函数为:
ScaledSiLU(x)
=
SiLU(x)/max[1,d*Mean(SiLU(x))]
;其中,
d
为常系数
。4.
根据权利要求1所述的一种用于道路监控场景的无锚框快速行人检测方法,其特征在于:所述
S3
具体包括:将...
【专利技术属性】
技术研发人员:张泽洋,陈子沣,周成祖,蔡炎华,魏超,王海滨,
申请(专利权)人:厦门市美亚柏科信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。