【技术实现步骤摘要】
一种基于随机不确定性的目标检测方法
[0001]本专利技术涉及目标检测领域,具体涉及一种基于随机不确定性的目标检测方法
。
技术介绍
[0002]目标检测作为计算机视觉领域的重要任务之一,被广泛应用于自动驾驶
、
物体跟踪等领域
。
近年来,基于深度学习的目标检测方法极大地提高了模型的精度和推理速度
。
主流的目标检测方法由两个模块组成,分别是特征提取模块与检测器模块,检测器模块通常由分类分支与回归分支组成
。
大多数基于深度学习的目标检测方法都提出了确定性的目标检测模型,将检测框坐标表示为确定值,将检测器分类分支的卷积采样过程建模为确定的过程
。
[0003]然而,由于信号采集噪声
、
数据标注误差等与观测数据本身相关的原因,导致深度学习方法存在随机不确定性
。
基于深度学习的目标检测方法同样存在随机不确定性问题,根据目标检测中的回归任务和分类任务,可以将随机不确定性问题进一步分为空间不确定性和语义不确定性
。
[0004]首先,对于回归任务,由于存在物体被截断
、
被遮挡
、
输入图像模糊等问题,导致检测框的边界是不确定的,即目标检测任务存在空间不确定性
。
然后,对于分类任务,输入图像中每个物体的形状是随机的,而检测器分类分支的卷积感受野是确定的,卷积特征与物体位置不对齐,导致物体的类别存在不确定性,即目标检测任务存在语义不确定性
【技术保护点】
【技术特征摘要】
1.
一种基于随机不确定性的目标检测方法,构建一个目标检测模型,将待识别图像输入目标检测模型,输出图像中物体的类别及坐标,目标检测模型的训练包括以下步骤:步骤一,准备图像数据进行目标类别及类别分数标注
、
检测框坐标标注,将标注过的图像预处理后作为训练数据;步骤二,将训练数据输入特征提取网络提取其空间语义特征;步骤三,将空间语义特征分别输入到分类分支特征提取网络和回归分支特征提取网络得到原始分类特征
X
cls
与原始回归特征
X
reg
;步骤四,将原始分类特征
X
cls
与原始回归特征
X
reg
输入到自适应特征对齐模块得到优化分类特征步骤五,根据原始回归特征
X
reg
计算检测框坐标的一般分布和检测框坐标的确定值
y
dtrmd
;步骤六,将原始回归特征
X
reg
、
优化分类特征检测框坐标的确定值
y
dtrmd
,输入到预测框加权平均模块得到优化的检测框坐标
r
refine
;步骤七,将优化分类特征和检测框坐标的一般分布输入到目标类别预测网络得到优化的类别分数;步骤八,根据分类损失函数
FocalLoss
和回归损失函数
GIoULoss
训练目标检测模型,直到达到预设的训练完成条件
。2.
根据权利要求1所述一种基于随机不确定性的目标检测方法,其特征在于,步骤二具体包括,将训练数据输入到卷积特征提取网络,得到多层卷积特征,将多层卷积特征输入到空间语义特征增强网络,得到空间语义特征
。3.
根据权利要求2所述一种基于随机不确定性的目标检测方法,其特征在于,卷积特征提取网络为
ResNet
‑
50
或
ResNet
‑
101。4.
根据权利要求2所述一种基于随机不确定性的目标检测方法,其特征在于,空间语义特征增强网络为多级特征金字塔网络
FPN。5.
根据权利要求1所述一种基于随机不确定性的目标检测方法,其特征在于,步骤四具体包括:将原始回归特征
X
reg
输入到卷积层,生成随机偏移量
P
;将随机偏移量
P
和原始分类特征
X
cls
进行随机采样操作,得到对齐的分类特征
X
align
:其中,
m
为卷积采样点个数,
p
i
表示当前卷积核中心点所在位置,
R
是卷积在特性图上的采样位置集合,
p
m
表示
R
上的每个位置,
Δ
p
m
表示
p
m
位置学习到的偏移量,
w(p
m
)
表示卷积核上
p
m
位置的权重;将原始分类特征
X
cls
和对齐的分类特征<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。