一种基于随机不确定性的目标检测方法技术

技术编号:39412806 阅读:10 留言:0更新日期:2023-11-19 16:04
本发明专利技术涉及目标检测领域,具体涉及一种基于随机不确定性的目标检测方法

【技术实现步骤摘要】
一种基于随机不确定性的目标检测方法


[0001]本专利技术涉及目标检测领域,具体涉及一种基于随机不确定性的目标检测方法


技术介绍

[0002]目标检测作为计算机视觉领域的重要任务之一,被广泛应用于自动驾驶

物体跟踪等领域

近年来,基于深度学习的目标检测方法极大地提高了模型的精度和推理速度

主流的目标检测方法由两个模块组成,分别是特征提取模块与检测器模块,检测器模块通常由分类分支与回归分支组成

大多数基于深度学习的目标检测方法都提出了确定性的目标检测模型,将检测框坐标表示为确定值,将检测器分类分支的卷积采样过程建模为确定的过程

[0003]然而,由于信号采集噪声

数据标注误差等与观测数据本身相关的原因,导致深度学习方法存在随机不确定性

基于深度学习的目标检测方法同样存在随机不确定性问题,根据目标检测中的回归任务和分类任务,可以将随机不确定性问题进一步分为空间不确定性和语义不确定性

[0004]首先,对于回归任务,由于存在物体被截断

被遮挡

输入图像模糊等问题,导致检测框的边界是不确定的,即目标检测任务存在空间不确定性

然后,对于分类任务,输入图像中每个物体的形状是随机的,而检测器分类分支的卷积感受野是确定的,卷积特征与物体位置不对齐,导致物体的类别存在不确定性,即目标检测任务存在语义不确定性,最终导致物体的类别预测不准确

[0005]其次,目标检测器的分类与回归分支的并行结构也会导致空间预测不对齐,影响模型的检测性能

[0006]最后,主流的目标检测方法仅使用类别分数作为检测框的质量表示分数,而忽略了检测框的位置质量,不能准确地表示检测框质量,导致在目标检测后处理过程中存在高质量检测框被误删的现象,即目标检测结果不准确

不完整

质量指检测框的准确度和可靠性,高质量的检测框指定位准确

大小适当

目标物体类别和置信度预测准确的检测框


技术实现思路

[0007]为解决上述问题,本专利技术提供一种基于随机不确定性的目标检测方法

[0008]该方法构建一个目标检测模型,将待识别图像输入目标检测模型,输出图像中物体的类别及坐标,目标检测模型的训练包括以下步骤:
[0009]步骤一,准备图像数据进行目标类别及类别分数标注

检测框坐标标注,将标注过的图像预处理后作为训练数据;
[0010]步骤二,将训练数据输入特征提取网络提取其空间语义特征;
[0011]步骤三,将空间语义特征分别输入到分类分支特征提取网络和回归分支特征提取网络得到原始分类特征
X
cls
与原始回归特征
X
reg

[0012]步骤四,将原始分类特征
X
cls
与原始回归特征
X
reg
输入到自适应特征对齐模块得到
优化分类特征
[0013]步骤五,根据原始回归特征
X
reg
计算检测框坐标的一般分布和检测框坐标的确定值
y
dtrmd

[0014]步骤六,将原始回归特征
X
reg

优化分类特征检测框坐标的确定值
y
dtrmd
,输入到预测框加权平均模块得到优化的检测框坐标
r
refine

[0015]步骤七,将优化分类特征和检测框坐标的一般分布输入到目标类别预测网络得到优化的类别分数;
[0016]步骤八,根据分类损失函数
FocalLoss
和回归损失函数
GIoULoss
训练目标检测模型,直到达到预设的训练完成条件

[0017]进一步的,步骤二具体包括,将训练数据输入到卷积特征提取网络,得到多层卷积特征,将多层卷积特征输入到空间语义特征增强网络,得到空间语义特征

[0018]进一步的,卷积特征提取网络为
ResNet

50

ResNet

101。
[0019]进一步的,空间语义特征增强网络为多级特征金字塔网络
FPN。
[0020]进一步的,步骤四具体包括:
[0021]将原始回归特征
X
reg
输入到卷积层,生成随机偏移量
P

[0022]将随机偏移量
P
和原始分类特征
X
cls
进行随机采样操作,得到对齐的分类特征
X
align

[0023][0024]其中,
m
为卷积采样点个数,
p
i
表示当前卷积核中心点所在位置,
R
是卷积在特性图上的采样位置集合,
p
m
表示
R
上的每个位置,
Δ
p
m
表示
p
m
位置学习到的偏移量,
w(p
m
)
表示卷积核上
p
m
位置的权重;
[0025]将原始分类特征
X
cls
和对齐的分类特征
X
align
进行融合,得到优化分类特征
[0026][0027]其中,
α
表示原始分类特征系数

[0028]进一步的,步骤五具体包括:
[0029]定义检测框坐标的一般分布近似模型为其中,
y
i
表示当前检测框的特征点位置到检测框边界的距离为
i

P()
为概率密度函数,
n
代表一般分布离散值的数量;
[0030]根据检测框坐标的一般分布近似模型,将原始回归特征
X
reg
输入到一层卷积网络,得到特征图;
[0031]将特征图输入到
Softmax
激活函数,得到检测框坐标的一般分布
[0032]将检测框坐标的一般分布输入到数学期望计算模块,得到检测框坐标的确定值
y
dtrmd

[0033]进一步的,步骤六具体包括:
[0034]将原始回归特征
X
reg
与优化分类特征在通道维度上进行拼接,得到融合特征
X
concat

[0035]将融合特征
...

【技术保护点】

【技术特征摘要】
1.
一种基于随机不确定性的目标检测方法,构建一个目标检测模型,将待识别图像输入目标检测模型,输出图像中物体的类别及坐标,目标检测模型的训练包括以下步骤:步骤一,准备图像数据进行目标类别及类别分数标注

检测框坐标标注,将标注过的图像预处理后作为训练数据;步骤二,将训练数据输入特征提取网络提取其空间语义特征;步骤三,将空间语义特征分别输入到分类分支特征提取网络和回归分支特征提取网络得到原始分类特征
X
cls
与原始回归特征
X
reg
;步骤四,将原始分类特征
X
cls
与原始回归特征
X
reg
输入到自适应特征对齐模块得到优化分类特征步骤五,根据原始回归特征
X
reg
计算检测框坐标的一般分布和检测框坐标的确定值
y
dtrmd
;步骤六,将原始回归特征
X
reg

优化分类特征检测框坐标的确定值
y
dtrmd
,输入到预测框加权平均模块得到优化的检测框坐标
r
refine
;步骤七,将优化分类特征和检测框坐标的一般分布输入到目标类别预测网络得到优化的类别分数;步骤八,根据分类损失函数
FocalLoss
和回归损失函数
GIoULoss
训练目标检测模型,直到达到预设的训练完成条件
。2.
根据权利要求1所述一种基于随机不确定性的目标检测方法,其特征在于,步骤二具体包括,将训练数据输入到卷积特征提取网络,得到多层卷积特征,将多层卷积特征输入到空间语义特征增强网络,得到空间语义特征
。3.
根据权利要求2所述一种基于随机不确定性的目标检测方法,其特征在于,卷积特征提取网络为
ResNet

50

ResNet

101。4.
根据权利要求2所述一种基于随机不确定性的目标检测方法,其特征在于,空间语义特征增强网络为多级特征金字塔网络
FPN。5.
根据权利要求1所述一种基于随机不确定性的目标检测方法,其特征在于,步骤四具体包括:将原始回归特征
X
reg
输入到卷积层,生成随机偏移量
P
;将随机偏移量
P
和原始分类特征
X
cls
进行随机采样操作,得到对齐的分类特征
X
align
:其中,
m
为卷积采样点个数,
p
i
表示当前卷积核中心点所在位置,
R
是卷积在特性图上的采样位置集合,
p
m
表示
R
上的每个位置,
Δ
p
m
表示
p
m
位置学习到的偏移量,
w(p
m
)
表示卷积核上
p
m
位置的权重;将原始分类特征
X
cls
和对齐的分类特征<...

【专利技术属性】
技术研发人员:赵峰郭雪松
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1