主动学习方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:32965715 阅读:57 留言:0更新日期:2022-04-09 11:21
本申请提供一种主动学习方法、装置、电子设备及可读存储介质,该目标检测方法包括:在样本集上进行无监督学习,得到无监督特征提取网络;其中,所述样本集包括无标签样本集,所述无标签样本集包括N1个无标签样本,N1为大于1的正整数;依据所述无监督特征提取网络,确定所述样本集中各样本的无监督特征;依据所述样本集中各样本的无监督特征,在所述样本集上进行主动学习,确定出需要标注的无标签样本。该方法可以实现同样标注量下,训练得到比随机标注集性能更为优异的模型。注集性能更为优异的模型。注集性能更为优异的模型。

【技术实现步骤摘要】
主动学习方法、装置、电子设备及可读存储介质


[0001]本申请涉及机器学习
,尤其涉及一种主动学习方法、装置、电子设备及可读存储介质。

技术介绍

[0002]深度学习范畴下的有监督学习在计算机视觉领域取得了卓越的成绩,其不仅归功于越来越先进的模型结构,更倚赖于海量丰富的训练数据。在实际应用中,训练数据的标注是有成本的,如时间成本、人力成本等。为了在尽可能少的标注量上训练出性能尽可能优异的模型,主动学习技术获得了越来越多的关注。
[0003]传统主动学习需要依赖大量有标签数据(即已标注的数据),来探寻有价值的标定数据。

技术实现思路

[0004]有鉴于此,本申请提供一种主动学习方法、装置、电子设备及可读存储介质,以解决传统主动学习方案需要依赖大量有标签数据的问题。
[0005]具体地,本申请是通过如下技术方案实现的:
[0006]根据本申请实施例的第一方面,提供一种主动学习方法,包括:
[0007]在样本集上进行无监督学习,得到无监督特征提取网络;其中,所述样本集包括无标签样本集,所述无标签样本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种主动学习方法,其特征在于,包括:在样本集上进行无监督学习,得到无监督特征提取网络;其中,所述样本集包括无标签样本集,所述无标签样本集包括N1个无标签样本,N1为大于1的正整数;依据所述无监督特征提取网络,确定所述样本集中各样本的无监督特征;依据所述样本集中各样本的无监督特征,在所述样本集上进行主动学习,确定出需要标注的无标签样本。2.根据权利要求1所述的方法,其特征在于,所述依据所述样本集中各样本的无监督特征,在所述样本集上进行主动学习,确定出需要标注的无标签样本,包括:依据所述样本集中各样本的无监督特征,确定所述样本集中有标签样本与无标签样本之间的距离;依据所述有标签样本与无标签样本的之间的距离,确定出需要标注的无标签样本。3.根据权利要求2所述的方法,其特征在于,当所述样本集中包括的样本均为无标签样本时,所述依据所述样本集中各样本的无监督特征,确定所述样本集中有标签样本与无标签样本的之间的距离之前,还包括:随机选择一个所述无标签样本作为所述样本集中的第一个有标签样本,并将该有标签样本从所述无标签样本集中移入有标签样本集;所述依据所述有标签样本与无标签样本的之间的距离,确定出需要标注的无标签样本,包括:依据所述有标签样本集中各有标签样本与所述无标签样本集中各无标签样本之间的距离,确定出需要标注的无标签样本,并将所确定的需要标注的无标签样本作为有标签样本从所述无标签样本集中移入所述有标签样本集。4.根据权利要求3所述的方法,其特征在于,所述依据所述有标签样本集中各有标签样本与所述无标签样本集中各无标签样本之间的距离,确定出需要标注的无标签样本,包括:对于所述无标签样本集中的任一无标签样本,依据该无标签样本与所述有标签样本集中各有标签样本之间的距离,确定该无标签样本与有标签样本的最小距离;其中,该无标签样本与有标签样本的最小距离为该无标签样本与各有标签样本之间的距离中的最小值;依据所述无标签样本集中各无标签样本与有标签样本的最小距离,确定出各无标签样本与有标签样本的最小距离中的最大值,并将该最大值对应的无标签样本确定为需要标注的无标签样本。5.根据权利要求2所述的方法,其特征在于,所述样本集还包括有标签样本集,所述有标签样本集包括N2个有标签样本,N2为大于1的正整数;所述依据所述样本集中各样本的无监督特征,确定所述样本集中有标签样本与无标签样本之间的距离之前,还包括:依据所述样本集中的有标签样本对任务模型进行训练,得到有监督任务模型;依据所述有监督任务模型,确定所述样本集中各样本的有监督先验特征;所述依据所述样本集中各样本的无监督特征,确定所述样本集中有标签样本与无标签样本之间的距离,包括:依据所述样本集中各样本的无监督特征以及有监督先验特征,确定所述样本集中有标签样本与无标签样本之间的距离。
6.根据权利要求5所述的方法,其特征在于,所述任务模型为图像分类任务模型;所述依据所述样本集中各样本的无监督特征以及有监督先验特征,确定所述样本集中有标签样本与无标签样本之间的距离,包括:对于任一样本,将该样本的无监督特征与有监督先验特征进行拼接,得到拼接特征;依据各样本的拼接特征,确定所述样本集中有标签样本与无标签样本之间的距离。7.根据权利要求5所述的方法,其特征在于,所述任务模型为目标检测任务模型;所述依据所述有监督任务模型,确定所述样本集中各样本的有监督先验特征,包括:依据所述有监督任务模型,确定所述样本集中各无标签样本中的各目标的置信度;依据所述样本集中各无标签样本中的各目标的置信度,确定各无标签样本的第一不确定度分数;所述依据所述样本集中各样本的无监督特征以及有监督先验特征,确定所述样本集中有标签样本与无标签样本之间的距离,包括:对于任一有标签样本和任一无标签样本,确定该有标签样本的无监督特征与该无标签样本的无监督特征之间的第一距离;依据该无标签样本的第一不确定度分数,以及所述第一距离,确定该有标签样本与该无标签样本之间的距离。8.根据权利要求7所述的方法,其特征在于,所述确定该有标签样本的无监督特征与该无标签样本的无监督特征之间的第一距离之前,还包括:依据所述有监督任务模型,确定所述样本集中各样本中的各目标的位置信息;对于任一样本,依据该样本中各目标的位置信息,将该样本的无监督特征转化为感兴趣区域的分布特征;所述确定该有标签样本的无监督特征与该无标签样本的无监督特征之间的第一距离,包括:确定该有标签样本的感兴趣区域的分布特征与该无标签样本的感兴趣区域的分布特征之间的第一距离。9.根据权利要求5所述的方法,其特征在于,所述任务模型为语义分割任务模型;所述依据所述有监督任务模型,确定所述样本集中各样本的有监督先验特征,包括:对于任一样本,依据所述有监督任务模型对该样本进行T次前向预测,得到该样本各像素点的类别预测概率;其中,T≥2;依据该样本各像素点的类别预测,确定该样本的第二不确定度分数;所述依据所述样本集中各样本的无监督特征以及有监督先验特征,确定所述样本集中有标签样本与无标签样本之间的距离,包括:对于任一有标签样本和任一无标签样本,确定该有标签样本的无监督特征与该无标签样本的无监督特征之间的第二距离;依据该无标签样本的第二不确定度分数,以及所述第二距离,确定该有标签样本与该无标签样本之间的距离。10.一种主动学习装置,其特征在于,包括:第一学习单元,用于在样本集上进行无监督学习,得到无监督特征提取网络;其中,所述样本集包括无标签样本集,所述无标签样本集包括N1个无标签样本,N1为大于1的...

【专利技术属性】
技术研发人员:傅剑文
申请(专利权)人:上海高德威智能交通系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1