【技术实现步骤摘要】
训练样本的标注方法、模型训练方法、装置、设备、介质
[0001]本公开涉及人工智能
,具体为深度学习、图像处理、计算机视觉
,可应用于人脸识别等场景。
技术介绍
[0002]模型训练一般可以分为样本标注、特征抽取、模型训练三个阶段。模型训练的训练样本的数量越大、训练样本的标注信息越准确,所构建的模型的准确率越高。
[0003]对于样本标注,目前一般通过人工标注的方式。然而,人工标注大量的训练样本的操作复杂,且容易出错,导致训练样本的标注的效率和可靠性降低。现阶段,也有通过样本标注模型实现样本标注的,虽然效率有所提升,但是准确率依然较低。
技术实现思路
[0004]本公开提供了一种训练样本的标注方法、模型训练方法、装置、设备、介质。
[0005]根据本公开的第一方面,提供了一种训练样本的标注方法,包括:
[0006]获取有标签样本以及无标签样本;
[0007]将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;
[0008]将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;
[0009]根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息。
[0010]根据本公开的第二方面,提供了一种模型训练方法,包括:
[0011]获取有标签样本以及无标签样本;
[0012]将所述有标签样本输入目标任务 ...
【技术保护点】
【技术特征摘要】
1.一种训练样本的标注方法,包括:获取有标签样本以及无标签样本;将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息。2.根据权利要求1所述的训练样本的标注方法,其中,所述目标任务模型的数量为至少两个;所述将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征,包括:将所述有标签样本分别输入至少两个目标任务模型,以由各个目标任务模型对所述有标签样本进行特征提取得到初始的第一任务特征;将各个所述初始的第一任务特征的加权结果,确定为所述有标签样本的第一任务特征。3.根据权利要求2所述的训练样本的标注方法,各个初始的第一任务特征的权重系数与得到所述初始的第一任务特征的目标任务模型的准确率呈正相关。4.根据权利要求1所述的训练样本的标注方法,其中,所述目标任务模型的数量为至少两个;所述将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征,包括:将所述无标签样本分别输入至少两个目标任务模型,以由各个目标任务模型对所述无标签样本进行特征提取得到初始的第二任务特征;将各个所述初始的第二任务特征的加权结果,确定为所述无标签样本的第二任务特征。5.根据权利要求4所述的训练样本的标注方法,各个第二初始特征的权重系数与得到所述第二初始特征的目标任务模型的准确率呈正相关。6.根据权利要求1所述的训练样本的标注方法,其中,所述目标任务模型为活体识别模型;所述第一任务特征为第一活体识别特征;所述第二任务特征为第二活体识别特征;所述任务处理结果包括活体识别置信度;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息,包括:根据所述第一活体识别特征、所述第二活体识别特征和所述第二活体识别特征确定所述无标签样本的任务标注信息。7.根据权利要求1
‑
6中任一项所述的训练样本的标注方法,其中,所述根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息,包括:根据所述任务处理结果确定所述无标签样本的初始标注信息;根据所述第一任务特征和所述第二任务特征判断所述初始标注信息是否可靠;在确定所述初始标注信息可靠的情况下,将所述初始标注信息标注为所述无标签样本
的任务标注信息。8.根据权利要求7所述的训练样本的标注方法,其中,所述有标签样本的数量为至少两个;所述根据所述第一任务特征和所述第二任务特征判断所述初始标注信息是否可靠,包括:计算所述第二任务特征与各个有标签样本的第一任务特征的相似度;根据相似度最高的第一任务特征对应的有标签样本的任务标注信息,判断所述初始标注信息是否可靠。9.一种模型训练方法,包括:获取有标签样本以及无标签样本;将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息;采用所述有标签样本和确定了所述任务标注信息的无标签样本对预训练模型进行模型训练。10.根据权利要求9所述的模型训练方法,其中,所述预训练模型包括目标任务模型;所述采用所述有标签样本和确定了所述任务标注信息的无标签样本对预训练模型进行模型训练,包括:所述采用所述有标签样本和确定了所述任务标注信息的无标签样本对所述目标任务模型进行模型训练,以优化所述目标任务模型。11.一种训练样本的标注装置,包括:获取模块,用于获取有标签样本以及无标签样本;第一特征确定模块,用于将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;第二特征确定模块,用于将所述无标签样本输入所述目标任务模型...
【专利技术属性】
技术研发人员:刘聪毅,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。