当前位置: 首页 > 专利查询>海南大学专利>正文

一种基于可分辨特征的半监督物体检测系统及其训练方法技术方案

技术编号:36881580 阅读:13 留言:0更新日期:2023-03-15 21:12
本发明专利技术涉及机器视觉的中的目标检测领域,具体涉及一种基于可分辨特征的半监督物体检测系统及其训练方法,系统包括:输入图像特征提取模块、可分辨特征敏感的区域建议模块、可分辨特征提取与存储模块、可分辨特征的数据增强模块和物体识别与定位模块;所述训练方法包括:步骤1:确定目标检测网络,并搭建如上所述的系统;步骤2:收集应用场景数据集,所述应用场景数据集包括有标签数据和无标签数据;步骤3:使用所述应用场景数据集对系统进行训练;步骤4:迭代前一步骤,直到训练的系统模型达到理想物体检测效果。通过本发明专利技术,提高模型对数据的利用能力,有效解决半监督学习中过分依赖有标签数据而对无标签数据利用不足的问题。标签数据而对无标签数据利用不足的问题。标签数据而对无标签数据利用不足的问题。

【技术实现步骤摘要】
一种基于可分辨特征的半监督物体检测系统及其训练方法


[0001]本专利技术涉及机器视觉的中的目标检测领域,尤其涉及一种基于可分辨特征的半监督物体检测系统及其训练方法。

技术介绍

[0002]深度学习在近些年取得了巨大的成功。然而深度学习算法对数据量的需求是巨大的,尽管在实际应用中已经拥有了大量开源的可实现的深度学习算法且可以获得较高的准确率,但是这仍依赖于使用者根据特定场景建立自己的数据集,这会花费大量的金钱和人力成本。在目标检测领域,相较图像分类等简单视觉任务仅需标注图片中物体类别,在标注目标检测数据集过程中,除了对单个目标实例的分类还需对四个边界点位置标注,单个目标的标注时间在10s左右。特别是在自动驾驶等复杂场景,目标数量更多,标注难度也十分巨大。因此,考虑到获取未标记数据比获取有标签数据容易得多,探索使用少量标记数据和大量未标记数据训练目标检测器的半监督目标检测方法成为一个重要的研究问题。
[0003]虽然半监督学习方法已经被广泛应用在图像分类任务中,但半监督目标检测仍处于研究的初始阶段。限制其发展的难题主要是相比于图像分类,目标检测输入数据中可能包含多个目标实例,这就要求模型不仅需要对每个实例分类同时还要输出每个实例具体的位置。现有的主流半监督方法主要分为两类:基于伪标签的方法和基于一致性正则化的方法。基于伪标签的方法主要是使用有标签数据首先训练一分类器使其对无标签数据输出相应的伪标签。最后使用带伪标签的无标签数据训练模型。基于一致性正则化的方法主要思想是对于无标签图像,添加噪声之后模型预测也应该保持不变,所以该方法鼓励对无标签样本添加扰动或其他数据增强手段训练模型对添加扰动前后的模型预测结果不变。然而上述两种方法虽然验证了其有效性但仍有其局限:伪标签方法无法解决因伪标签预测错误导致的错误累计问题,而一致性正则化方法过分依赖有标签数据从无标签数据中获得的有效信息太少。如何最大化利用有标签数据并尽可能多的利用无标签数据成为半监督学习的主要挑战。
[0004]人类通过少量数据就可具有分辨物体的能力,其背后的主要原因是人类善于从图片中发现和总结可分辨的特征,在学习过少量样本后,很容易通过主要特征判别图片中实例的位置及类别。例如,通过一小块区域的豹纹纹理人类就有很大把握推断这个实例类别。而神经网络擅长的是对大量输入的偏置的归纳,而缺乏总结可辨识特征的能力,这可能是导致神经网络学习效率不高的主要原因。因此,使模型具有对可分辨特征归纳总结的能力可以使模型更好的从少量有标签数据中总结有用信息,也可使模型从无标签数据中抓取可分辨特征相关的有效信息,提高检测器检测准确率。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提出一种基于可分辨特征的半监督物体检测系统及其训练方法,以解决现有技术中半监督学习过程中过分依赖有标签数据而对无标签数据利
用不足的问题。
[0006]基于上述目的,本专利技术提供了一种基于可分辨特征的半监督物体检测系统,所述系统包括:
[0007]输入图像特征提取模块:用于提取输入图像数据的特征,并将所述特征编码为高维特征;
[0008]可分辨特征敏感的区域建议模块:用于基于所述高维特征产生所述输入图像数据的可分辨特征热力图,并通过所述可分辨特征热力图辅助区域建议网络进行定位,生成目标框提案;
[0009]可分辨特征提取与存储模块:用于提取所述目标框提案中的可分辨特征,并对提取到所述可分辨特征进行对比聚类,形成各类可分辨特征集,再存储各类可分辨特征集的原型向量;
[0010]可分辨特征数据增强模块:用于遮盖对无标签的所述输入图像数据生成的目标框提案中的部分可分辨特征,迫使系统去不断探索该目标提案中新的可分辨特征;
[0011]物体识别与定位模块,用于通过所述可分辨特征及所述目标提案中的特征预测正确的物体类别与位置。
[0012]进一步的,在所述可分辨特征敏感的区域建议模块中,选择类别激活映射图作为可分辨特征的判别标准,设置类别激活映射图的阈值过滤高维特征,产生可分别特征热力图。
[0013]进一步的,在所述可分辨特征敏感的区域建议模块中,在所述区域建议网络生成目标框提案过程中,计算锚内类别激活映射图的均值作为一项加权损失函数项,使得区域建议网络生成的目标框提案内包含尽可能多的可分辨特征。
[0014]进一步的,在所述可分辨特征提取与存储模块中,通过引入一对比聚类损失使得相同类特征之间距离靠近,并使不同类特征远离,形成各类的可分辨特征集。
[0015]进一步的,定义类的可分辨特征集为提取出的各类别的可分辨特征的原型向量:P={p0,p1......p
c
};
[0016]其中,p为原型向量;c为类别的数量;
[0017]使用对比损失对可分辨特征向量进行聚类,用以增大类间差,采用的损失函数的公式为:
[0018][0019][0020]其中,p
i
为类别i的原型向量,类别的原型向量为每个提取到的可分辨特征的特征向量的平均值;
[0021]D为欧式距离函数;
[0022]Δ为相似和不相似类的距离参数;
[0023]f
c
为输入的第c个可分辨特征;
[0024]l
u
(f
c
)为所有类别的总损失函数;
[0025]l(f
c
,p
i
)为第i类目标对应的分损失函数;
[0026]D(f
c
,p
i
)为f
c
和p
i
的距离。
[0027]进一步的,在所述可分辨特征数据增强模块中,采用所述高维特征的均值遮盖对无标签的所述输入图像数据生成的目标框提案中的部分可分辨特征。
[0028]在这里,还介绍一种基于可分辨特征的半监督物体检测系统的训练方法,所述训练方法如下:
[0029]步骤1:确定目标检测网络,并搭建如上所述的系统;
[0030]步骤2:收集应用场景数据集,所述应用场景数据集包括有标签数据和无标签数据;
[0031]步骤3:使用所述应用场景数据集对系统进行训练;
[0032]步骤4:迭代前一步骤,直到训练的系统模型达到理想物体检测效果。
[0033]进一步的,所述目标检测网络采用Faster

RCNN的网络结构。
[0034]进一步的,根据步骤1中所搭建的系统模型,输入图像数据在所述系统模型中的传播顺序为系统模型的搭建顺序,所述搭建顺序如下:
[0035]步骤101:通过输入图像特征提取模块输出输入图像数据的高维特征;
[0036]步骤102:将高维特征输入可分辨特征敏感的区域建议模块,得到可分辨特征热力图和目标框提案。
[0037]步骤103:将目标框提案输入可分辨特征提取与存储模块中,得到目标框提案中的可分辨特征,并储存各类可分辨特征集的原型向量;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于可分辨特征的半监督物体检测系统,其特征在于,所述系统包括:输入图像特征提取模块:用于提取输入图像数据的特征,并将所述特征编码为高维特征;可分辨特征敏感的区域建议模块:用于基于所述高维特征产生所述输入图像数据的可分辨特征热力图,并通过所述可分辨特征热力图辅助区域建议网络进行定位,生成目标框提案;可分辨特征提取与存储模块:用于提取所述目标框提案中的可分辨特征,并对提取到所述可分辨特征进行对比聚类,形成各类可分辨特征集,再存储各类可分辨特征集的原型向量;可分辨特征数据增强模块:用于遮盖对无标签的所述输入图像数据生成的目标框提案中的部分可分辨特征,迫使系统去不断探索该目标提案中新的可分辨特征;物体识别与定位模块,用于通过所述可分辨特征及所述目标提案中的特征预测正确的物体类别与位置。2.根据权利要求1所述的一种基于可分辨特征的半监督物体检测系统,其特征在于,在所述可分辨特征敏感的区域建议模块中,选择类别激活映射图作为可分辨特征的判别标准,设置类别激活映射图的阈值过滤高维特征,产生可分别特征热力图。3.根据权利要求2所述的一种基于可分辨特征的半监督物体检测系统,其特征在于,在所述可分辨特征敏感的区域建议模块中,在所述区域建议网络生成目标框提案过程中,计算锚内类别激活映射图的均值作为一项加权损失函数项,使得区域建议网络生成的目标框提案内包含尽可能多的可分辨特征。4.根据权利要求3所述的一种基于可分辨特征的半监督物体检测系统,其特征在于,在所述可分辨特征提取与存储模块中,通过引入一对比聚类损失使得相同类特征之间距离靠近,并使不同类特征远离,形成各类的可分辨特征集。5.根据权利要求4所述的一种基于可分辨特征的半监督物体检测系统,其特征在于,定义类的可分辨特征集为提取出的各类别的可分辨特征的原型向量:P={p0,p1......p
c
};其中,p为原型向量;c为类别的数量;使用对比损失对可分辨特征向量进行聚类,用以增大类间差,采用的损失函数的公式为:为:其中,p
i
为类别i的原型向量,类别的原型向量为每个提取到的可分辨特征的特征向量的平均值;D为欧式距离函数;Δ为相似和不相似类的距离参数;f
c
为输入的第c个可分辨特征;
l
u
(f
c
)为所有类别的总损失函数;l(f
c
,p
i
)为第i...

【专利技术属性】
技术研发人员:张卫东任相璇贺通覃善兴熊明磊章海波胡小波何鹭飞左勇
申请(专利权)人:海南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1