一种训练方法、装置、设备和存储介质制造方法及图纸

技术编号:26846499 阅读:18 留言:0更新日期:2020-12-25 13:09
本申请提供了一种训练方法、装置、设备和存储介质,其中,该方法包括:使用待训练分类器对第一候选样本集进行分类,得到所述第一候选样本集中包括的各图像的第一分类结果;根据所述第一分类结果和获取到的人工对所述第一候选样本集中包括的各图像的第二分类结果,确定所述第一候选样本集中包括的各图像的样本类型;按照预设的第一样本类型比例,从所述第一样本和所述第二样本中选择图像,以将选择出来的图像作为第一训练样本;使用第一训练样本对所述待训练分类器进行模型训练,通过上述方法有利于提高待训练分类器的分类性能,以及有利于提高待训练分类器的分类准确率。

【技术实现步骤摘要】
一种训练方法、装置、设备和存储介质
本申请涉及计算机
,具体而言,涉及一种训练方法、装置、设备和存储介质。
技术介绍
图像分类器能够对图像进行分类,图像分类器在图像领域有着重要的应用。图像分类器的分类性能的高低与训练数据息息相关,在对图像分类器进行训练时,需要使用大量的训练数据,并且在对图像分类器进行训练之前,需要对训练数据进行人工标注,而人工标注的方式使得训练效率大大降低。为了提高训练效率,目前使用半监督的方式对图像分类器进行训练,例如:在获取到训练数据后,使用人工的方式对一小部分训练数据进行标注,然后使用标注后的训练数据对图像分类器进行训练,在完成训练后,使用训练后的图像分类器对未进行标注的训练数据进行分类,然后从分类结果中再选择一部分数据作为训练数据对图像分类器继续进行训练,直至图像分类器符合要求。对于半监督的训练方式,由于图像分类器所使用的训练数据中可能包括错误的训练数据,从而使得训练后的图像分类器对不能正确识别的图像仍不能正确识别,并且还会降低图像分类器的对该类图像的分类性能,从而降低了图像分类器的分类准确率。<本文档来自技高网...

【技术保护点】
1.一种训练方法,其特征在于,包括:/n使用待训练分类器对第一候选样本集进行分类,得到所述第一候选样本集中包括的各图像的第一分类结果,其中,所述待训练分类器的分类类别数量为K,K为正整数;/n根据所述第一分类结果和获取到的人工对所述第一候选样本集中包括的各图像的第二分类结果,确定所述第一候选样本集中包括的各图像的样本类型,其中,样本类型包括第一样本和第二样本,所述第一样本为第一分类结果和第二分类结果相同的图像,所述第二样本为第一分类结果和第二分类结果不相同的图像;/n按照预设的第一样本类型比例,从所述第一样本和所述第二样本中选择图像,以将选择出来的图像作为第一训练样本;/n使用第一训练样本对所...

【技术特征摘要】
1.一种训练方法,其特征在于,包括:
使用待训练分类器对第一候选样本集进行分类,得到所述第一候选样本集中包括的各图像的第一分类结果,其中,所述待训练分类器的分类类别数量为K,K为正整数;
根据所述第一分类结果和获取到的人工对所述第一候选样本集中包括的各图像的第二分类结果,确定所述第一候选样本集中包括的各图像的样本类型,其中,样本类型包括第一样本和第二样本,所述第一样本为第一分类结果和第二分类结果相同的图像,所述第二样本为第一分类结果和第二分类结果不相同的图像;
按照预设的第一样本类型比例,从所述第一样本和所述第二样本中选择图像,以将选择出来的图像作为第一训练样本;
使用第一训练样本对所述待训练分类器进行模型训练。


2.如权利要求1所述的方法,其特征在于,在对所述待训练分类器训练完成得到第一分类器后,所述方法还包括:
使用所述第一分类器对获取到的第一待分类图像进行分类处理,以得到所述第一待分类图像的第二分类结果;
根据所述第二分类结果,判断所述第一分类器是否满足预设条件,其中,所述预设条件包括:对于每类类别,该类别的分类准确率大于或者等于第一预设阈值,和/或所述第一分类器的整体分类准确率大于或者等于第二预设阈值;
如果所述第一分类器不满足所述预设条件,使用预设图像数据集上的预训练参数对所述第一分类器的参数进行初始化,得到所述待训练分类器;
使用所述待训练分类器对第二候选样本集进行分类,得到所述第二候选样本集中包括的各图像的第三分类结果;
根据所述第三分类结果和获取到的人工对所述第二候选样本集中包括的各图像的第四分类结果,确定所述第二候选样本集中包括的各图像的样本类型,其中,样本类型包括第三样本和第四样本,所述第三样本为第三分类结果和第四分类结果相同的图像,所述第四样本第三分类结果和第四分类结果不相同的图像;
按照预设的第二样本类型比例,从所述第三样本和所述第四样本中选择图像,以将选择出来的图像作为第二训练样本;
使用第二训练样本对所述待训练分类器进行模型训练;
在对所述待训练分类器训练完成得到第二分类器后,使用所述第二分类器对获取到的第二待分类图像进行分类处理,以得到所述第二待分类图像的第五分类结果;根据所述第五分类结果,判断所述第二分类器是否满足所述预设条件;如果满足所述预设条件,则结束流程;如果不满足所述预设条件,则使用预设图像数据集上的预训练参数对所述第二分类器的参数进行初始化,得到所述待训练分类器;继续对所述待训练分类器进行训练,直至得到满足所述预设条件的分类器为止。


3.如权利要求2所述的方法,其特征在于,所述方法还包括:
使用预设聚类算法,对获取到的第一图像集合进行聚类,得到多个第一图像子集合;
从所述第一图像集合中选择预设数量的第一目标图像;
使用所述待训练分类器对所述第一目标图像进行分类,得到所述第一目标图像的第六分类结果;
根据所述第六分类结果,确定所述第一目标图像在各分类类别上的分布密度;
根据所述分布密度从高到低的顺序,从多个所述第一图像子集合中选择预设个数的第一图像子集合作为所述第一候选样本集或所述第二候选样本集。


4.如权利要求3所述的方法,其特征在于,所述根据所述第六分类结果,确定所述第一目标图像在各分类类别上的分布密度,包括:
获取人工对所述第六分类结果进行调整后的第七分类结果;
根据所述第七分类结果,确定所述第一目标图像在各分类类别上的分布密度。


5.一种训练装置,其特征在于,包括:
第一分类单元,用于使用待训练分类器对第一候选样本集进行分类,得到所述第一候选样本集中包括的各图像的第一分类结果,其中,所述待训练分类器的分类类别数量为K,K为正整数;
第一确定单元,用于根据所述第一分类结果和获取到的人工对所述第一候选样本集中包括的各图像的第二分类结果,确定所述第一候选样本集中包括的...

【专利技术属性】
技术研发人员:王学彬
申请(专利权)人:北京远鉴信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1