一种基于噪声数据的半监督三维目标检测方法技术

技术编号:39567970 阅读:7 留言:0更新日期:2023-12-03 19:18
本发明专利技术公开了一种基于噪声数据的半监督三维目标检测方法,包括获取目标检测的数据集,该数据集包括标记数据集和未标记数据集;用标记数据集训练平均教师框架中的教师模型;用训练后的教师模型对未标记数据集进行推理,在未标记数据集上生成伪标签,得到伪标签数据集;从标记数据集和伪标签数据集中进行采样,利用抗噪声实例监督模块和密集特征一致性约束模块对噪声进行监督,获取有用信息,从而训练学生模型;用训练后的学生模型去进行检测任务

【技术实现步骤摘要】
一种基于噪声数据的半监督三维目标检测方法


[0001]本专利技术涉及目标检测领域,具体涉及一种基于噪声数据的半监督三维目标检测方法


技术介绍

[0002]目标检测是计算机视觉领域的传统任务,旨在识别出图像或视频中存在的物体,给出对应的类别,并将该物体的位置通过最小包围框的方式给出,其应用领域包括自动驾驶

监控系统

机器人感知

医学图像分析

航空航天等

根据目标检测任务的维度,可以将其分为二维目标检测和三维目标检测,其中三维目标检测以三维空间中的物体为检测目标,在各种应用中具有重要意义

[0003]相较于传统的三维目标检测方法,半监督目标检测由于其简单性和对昂贵注释的依赖性较弱,近年来显示出很大的前景

当前主流的半监督目标检测主要基于两类框架:平均教师
(Mean

Teacher

MT)
和伪标签
(Pseudo

Labeling

PL)。
[0004]这两类框架都存在较为明显的缺陷:平均教师
(MT)
模型采用了一种教师学生
(teacher

student)
范式,以端到端的训练方式在未标记数据上产生监督信号,但是这种模型不是模型不可知论的,导致模型的泛化能力较差;伪标签
(PL)
模型首先在标记数据上对模型进行训练,然后在未标记的数据上生成伪标签,供后续训练使用,它可以很容易地应用于任何检测器,但是最终的性能往往受到了伪标签质量的限制

尽管已经出现了提高伪标签质量的方法,但是在伪标签的生成过程仍不可避免的会产生噪声,干扰模型的收敛,甚至影响最终的性能


技术实现思路

[0005]为解决上述问题,本专利技术提供一种基于噪声数据的半监督三维目标检测方法,以期设计出具备良好泛化能力,并且对噪声伪标签的容忍度较高的三维目标检测模型

[0006]为解决上述技术问题,本专利技术采用如下技术方案:
[0007]一种基于噪声数据的半监督三维目标检测方法,包括以下步骤:
[0008]步骤一,获取目标检测的数据集,该数据集包括标记数据集和未标记数据集;
[0009]步骤二,用步骤一获得的标记数据集训练平均教师框架中的教师模型;
[0010]步骤三,用步骤二中训练后的教师模型对步骤一中获得的未标记数据集进行推理,在未标记数据集上生成伪标签,得到伪标签数据集;
[0011]步骤四,从步骤一获得的标记数据集和步骤三得到的伪标签数据集中进行采样,利用抗噪声实例监督模块和密集特征一致性约束模块对噪声进行监督,获取有用信息,并通过分类损失函数回归损失函数
L
reg
和一致性损失函数
L
consist
训练学生模型;
[0012]步骤五,用步骤四中训练后的学生模型去进行检测任务,得到检测结果

[0013]进一步地,步骤四中,抗噪声实例监督模块分为分类模块和回归模块,分类模块进行分类和回归模块进行回归是目标检测中的两个过程,没有先后顺序,分类确定检测目标
的类别,回归确定检测目标的具体检测框

[0014]进一步地,步骤四中抗噪声实例监督模块的分类模块,将置信度
c
作为衡量伪标签质量的指标,根据置信度
c
以及学生模型预测结果与学生模型匹配的伪标签之间的交并比
τ
,将分类标签软化为在0到1范围内的值,并且将其视作真实结果框本身的质量和学生模型学习能力的结合;
[0015]采用交叉熵损失函数的变体,对非离散的分类标签进行监督,分类标签用质量分数表示,具体形式如下:
[0016][0017][0018]其中,表示教师模型预测的质量分数,
y
表示学生模型预测的质量分数,
α
为可设置的超参数,
β
为调制参数,即为分类损失

[0019]进一步地,
α
设置为
0.75。
[0020]进一步地,步骤二中抗噪声实例监督模块的回归模块,将每个边界框进行学生模型中的网络预测,建模为给定特征向量
x
的高斯分布
h
,具体形式如下:
[0021][0022]其中
μ
(x)

σ
(x)
表示学生模型中的网络预测的每个回归项的均值和方差,表示高斯分布的符号;
[0023]将回归损失
L
reg
转化为负对数似然损失,具体形式如下:
[0024][0025]进一步地,步骤四中,密集特征一致性约束模块用激光雷达点云数据作为输入,采用旋转

翻转操作对输入数据进行增强,对于给定的一个点云框架
P
和一组数据增强策略
A
,从
A
中随机抽取两个变换
A1和
A2,并将
A1和
A2应用于
P
,以生成两种不同的点云视图
P1和
P2,随后将增强的点云输入到点特征提取器中,生成鸟瞰图的特征;将获得的鸟瞰图特征反向返回到原始空间,并记录变换过程,得到返回后的特征和由此便推导出损失函数,即具有标准欧式距离损失的像素级特征一致性约束
L
consist

[0026][0027]进一步地,引入前景聚焦掩模来选择性地正则化增强的鸟瞰图特征,在空间中为每个真实结果的中心
(x
i

y
i
)
绘制高斯分布:
[0028][0029]其中
σ
i
为常数,表示对象尺寸的标准差,为参考中心点,
φ
i,x,y
表示第
i
纬度下坐标
(x

y)
位置的高斯分布

[0030]进一步地,
σ
i

2。
[0031]进一步地,通过在
i
维度上取最大值,将所有
φ
i,x,y
合并为一个掩码
Φ
,便得到了最终的密集特征一致性约束
L
consist

[0032][0033]其中
H

W
分别表示特征图像的高和宽,
φ
xy
表示特征图像上以
(x

y)
为中心的掩码

[0034]与现有技术相比,本专利技术的有益效果在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于噪声数据的半监督三维目标检测方法,包括以下步骤:步骤一,获取目标检测的数据集,该数据集包括标记数据集和未标记数据集;步骤二,用步骤一获得的标记数据集训练平均教师框架中的教师模型;步骤三,用步骤二中训练后的教师模型对步骤一中获得的未标记数据集进行推理,在未标记数据集上生成伪标签,得到伪标签数据集;步骤四,从步骤一获得的标记数据集和步骤三得到的伪标签数据集中进行采样,利用抗噪声实例监督模块和密集特征一致性约束模块对噪声进行监督,获取有用信息,并通过分类损失函数回归损失函数
L
reg
和一致性损失函数
L
consist
训练学生模型;步骤五,用步骤四中训练后的学生模型去进行检测任务,得到检测结果
。2.
根据权利要求1所述的基于噪声数据的半监督三维目标检测方法,其特征在于,步骤四中,抗噪声实例监督模块分为分类模块和回归模块,分类模块进行分类和回归模块进行回归是目标检测中的两个过程,没有先后顺序,分类确定检测目标的类别,回归确定检测目标的具体检测框
。3.
根据权利要求2所述的基于噪声数据的半监督三维目标检测方法,其特征在于,步骤四中抗噪声实例监督模块的分类模块,将置信度
c
作为衡量伪标签质量的指标,根据置信度
c
以及学生模型预测结果与学生模型匹配的伪标签之间的交并比
τ
,将分类标签软化为在0到1范围内的值,并且将其视作真实结果框本身的质量和学生模型学习能力的结合;采用交叉熵损失函数的变体,对非离散的分类标签进行监督,分类标签用质量分数表示,具体形式如下:示,具体形式如下:其中,表示教师模型预测的质量分数,
y
表示学生模型预测的质量分数,
α
为可设置的超参数,
β
为调制参数,即为分类损失
。4.
根据权利要求3所述的基于噪声数据的半监督三维目标检测方法,其特征在于,
α
设置为
0.75。5.
根据权利要求2所述的基于噪声数据的半监督三维目标检测方法,其特征在于,步骤二中抗噪声实例监督模块的回归模块,将每个边界框进行学生模型中的网络预测,建模为给定特征向量
x
的高斯分布
h
,具体形式如下:其中
μ
(x)

σ
(x)
表示学生模型中的网络预测的每个回归项的均值和方差,表...

【专利技术属性】
技术研发人员:赵峰祁禹坤陈泽徽
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1