一种基于可分辨特征的半监督物体检测系统及其训练方法技术方案

技术编号：36881580 阅读：13 留言：0更新日期：2023-03-15 21:12

本发明专利技术涉及机器视觉的中的目标检测领域，具体涉及一种基于可分辨特征的半监督物体检测系统及其训练方法，系统包括：输入图像特征提取模块、可分辨特征敏感的区域建议模块、可分辨特征提取与存储模块、可分辨特征的数据增强模块和物体识别与定位模块；所述训练方法包括：步骤1：确定目标检测网络，并搭建如上所述的系统；步骤2：收集应用场景数据集，所述应用场景数据集包括有标签数据和无标签数据；步骤3：使用所述应用场景数据集对系统进行训练；步骤4：迭代前一步骤，直到训练的系统模型达到理想物体检测效果。通过本发明专利技术，提高模型对数据的利用能力，有效解决半监督学习中过分依赖有标签数据而对无标签数据利用不足的问题。标签数据而对无标签数据利用不足的问题。标签数据而对无标签数据利用不足的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于可分辨特征的半监督物体检测系统及其训练方法

[0001]本专利技术涉及机器视觉的中的目标检测领域，尤其涉及一种基于可分辨特征的半监督物体检测系统及其训练方法。

技术介绍

[0002]深度学习在近些年取得了巨大的成功。然而深度学习算法对数据量的需求是巨大的，尽管在实际应用中已经拥有了大量开源的可实现的深度学习算法且可以获得较高的准确率，但是这仍依赖于使用者根据特定场景建立自己的数据集，这会花费大量的金钱和人力成本。在目标检测领域，相较图像分类等简单视觉任务仅需标注图片中物体类别，在标注目标检测数据集过程中，除了对单个目标实例的分类还需对四个边界点位置标注，单个目标的标注时间在10s左右。特别是在自动驾驶等复杂场景，目标数量更多，标注难度也十分巨大。因此，考虑到获取未标记数据比获取有标签数据容易得多，探索使用少量标记数据和大量未标记数据训练目标检测器的半监督目标检测方法成为一个重要的研究问题。
[0003]虽然半监督学习方法已经被广泛应用在图像分类任务中，但半监督目标检测仍处于研究的初始阶段。限制其发展的难题主要是相比于图像分类，目标检测输入数据中可能包含多个目标实例，这就要求模型不仅需要对每个实例分类同时还要输出每个实例具体的位置。现有的主流半监督方法主要分为两类：基于伪标签的方法和基于一致性正则化的方法。基于伪标签的方法主要是使用有标签数据首先训练一分类器使其对无标签数据输出相应的伪标签。最后使用带伪标签的无标签数据训练模型。基于一致性正则化的方法主要思想是对于无标签图像，添加噪声之后模型预测也应该保...

【技术保护点】

【技术特征摘要】
1.一种基于可分辨特征的半监督物体检测系统，其特征在于，所述系统包括：输入图像特征提取模块：用于提取输入图像数据的特征，并将所述特征编码为高维特征；可分辨特征敏感的区域建议模块：用于基于所述高维特征产生所述输入图像数据的可分辨特征热力图，并通过所述可分辨特征热力图辅助区域建议网络进行定位，生成目标框提案；可分辨特征提取与存储模块：用于提取所述目标框提案中的可分辨特征，并对提取到所述可分辨特征进行对比聚类，形成各类可分辨特征集，再存储各类可分辨特征集的原型向量；可分辨特征数据增强模块：用于遮盖对无标签的所述输入图像数据生成的目标框提案中的部分可分辨特征，迫使系统去不断探索该目标提案中新的可分辨特征；物体识别与定位模块，用于通过所述可分辨特征及所述目标提案中的特征预测正确的物体类别与位置。2.根据权利要求1所述的一种基于可分辨特征的半监督物体检测系统，其特征在于，在所述可分辨特征敏感的区域建议模块中，选择类别激活映射图作为可分辨特征的判别标准，设置类别激活映射图的阈值过滤高维特征，产生可分别特征热力图。3.根据权利要求2所述的一种基于可分辨特征的半监督物体检测系统，其特征在于，在所述可分辨特征敏感的区域建议模块中，在所述区域建议网络生成目标框提案过程中，计算锚内类别激活映射图的均值作为一项加权损失函数项，使得区域建议网络生成的目标框提案内包含尽可能多的可分辨特征。4.根据权利要求3所述的一种基于可分辨特征的半监督物体检测系统，其特征在于，在所述可分辨特征提取与存储模块中，通过引入一对比聚类损失使得相同类特征之间距离靠近，并使不同类特征远离，形成各类的可分辨特征集。5.根据权利要求4所述的一种基于可分辨特征的半监督物体检测系统，其特征在于，定义类的可分辨特征集为提取出的各类别的可分辨特征的原型向量：P＝{p0，p1......p
c
}；其中，p为原型向量；c为类别的数量；使用对比损失对可分辨特征向量进行聚类，用以增大类间差，采用的损失函数的公式为：为：其中，p
i
为类别i的原型向量，类别的原型向量为每个提取到的可分辨特征的特征向量的平均值；D为欧式距离函数；Δ为相似和不相似类的距离参数；f
c
为输入的第c个可分辨特征；
l
u
(f
c
)为所有类别的总损失函数；l(f
c
,p
i
)为第i...

【专利技术属性】
技术研发人员：张卫东，任相璇，贺通，覃善兴，熊明磊，章海波，胡小波，何鹭飞，左勇，
申请(专利权)人：海南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人