训练样本的标注方法、模型训练方法、装置、设备、介质制造方法及图纸

技术编号:37261572 阅读:13 留言:0更新日期:2023-04-20 23:35
本公开提供了训练样本的标注方法、模型训练方法、装置、设备、介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于人脸识别等场景。具体实现方案为:获取有标签样本以及无标签样本;将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息。定所述无标签样本的任务标注信息。定所述无标签样本的任务标注信息。

【技术实现步骤摘要】
训练样本的标注方法、模型训练方法、装置、设备、介质


[0001]本公开涉及人工智能
,具体为深度学习、图像处理、计算机视觉
,可应用于人脸识别等场景。

技术介绍

[0002]模型训练一般可以分为样本标注、特征抽取、模型训练三个阶段。模型训练的训练样本的数量越大、训练样本的标注信息越准确,所构建的模型的准确率越高。
[0003]对于样本标注,目前一般通过人工标注的方式。然而,人工标注大量的训练样本的操作复杂,且容易出错,导致训练样本的标注的效率和可靠性降低。现阶段,也有通过样本标注模型实现样本标注的,虽然效率有所提升,但是准确率依然较低。

技术实现思路

[0004]本公开提供了一种训练样本的标注方法、模型训练方法、装置、设备、介质。
[0005]根据本公开的第一方面,提供了一种训练样本的标注方法,包括:
[0006]获取有标签样本以及无标签样本;
[0007]将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;
[0008]将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;
[0009]根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息。
[0010]根据本公开的第二方面,提供了一种模型训练方法,包括:
[0011]获取有标签样本以及无标签样本;
[0012]将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;
[0013]将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;
[0014]根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息;
[0015]采用所述有标签样本和确定了所述任务标注信息的无标签样本对预训练模型进行模型训练。
[0016]根据本公开的第三方面,提供一种训练样本的标注装置,包括:
[0017]获取模块,用于获取有标签样本以及无标签样本;
[0018]第一特征确定模块,用于将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;
[0019]第二特征确定模块,用于将所述无标签样本输入所述目标任务模型,以根据所述
目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;
[0020]标注模块,用于根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息。
[0021]根据本公开的第四方面,提供一种模型训练装置,包括:
[0022]获取模块,用于获取有标签样本以及无标签样本;
[0023]第一特征确定模块,用于将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;
[0024]第二特征确定模块,用于将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;
[0025]标注模块,用于根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息;
[0026]训练模块,用于采用所述有标签样本和确定了所述任务标注信息的无标签样本对预训练模型进行模型训练。
[0027]根据本公开的第五方面,提供一种电子设备,包括:
[0028]至少一个处理器;以及
[0029]与所述至少一个处理器通信连接的存储器;其中,
[0030]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或者第二方面提供的方法。
[0031]根据本公开的第六方面,提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面或者第二方面提供的方法。
[0032]根据本公开的第七方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面或者第二方面提供的方法。
[0033]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0034]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0035]图1为本公开一示例性实施例提供的一种训练样本的标注方法的流程图;
[0036]图2为本公开一示例性实施例提供的一种确定无标签样本的任务标注信息的流程图;
[0037]图3为本公开一示例性实施例提供的另一种训练样本的标注方法的流程图;
[0038]图4为本公开一示例性实施例提供的一种模型训练方法的流程图;
[0039]图5为本公开一示例性实施例提供的一种训练样本的标注装置的模块示意图;
[0040]图6为本公开一示例性实施例提供的一种模型训练装置的模块示意图;
[0041]图7为本公开一示例性实施例提供的一种电子设备的框图。
具体实施方式
[0042]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识
到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0043]图1为本公开一示例性实施例提供的一种训练样本的标注方法的流程图,包括:
[0044]步骤101、获取有标签样本以及无标签样本。
[0045]无标签样本为待标注的训练样本。该训练样本的待标注任务标注信息与其用途有关,若欲用该训练样本训练活体识别模型,则该训练样本的待标注任务标注信息包括活体识别结果;若欲用该训练样本训练目标检测模型,则该训练样本的待标注任务标注信息包括目标检测结果;以此类推。
[0046]有标签样本为标注有任务标注信息的训练样本。该任务标注信息也即有标签样本的标签,可以是人为标注的,也可以基于人工智能标注,本公开实施例对此不作特别限定。有标签样本的任务标注信息一般与无标签样本的待标注任务标注信息相匹配,若待标注任务标注信息包括活体识别结果,则有标签样本的任务标注信息包括活体识别结果;若待标注任务标注信息包括目标检测结果,则有标签样本的任务标注信息包括目标检测结果。
[0047]步骤102、将有标签样本输入目标任务模型,以根据目标任务模型得到有标签样本的第一任务特征。
[0048]目标任务模型为预先训练的、具有任务处理能力的模型,目标任务模型所能处理的任务与无标签样本的待标注任务标注信息相匹配,若待标注任务标注信息包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本的标注方法,包括:获取有标签样本以及无标签样本;将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息。2.根据权利要求1所述的训练样本的标注方法,其中,所述目标任务模型的数量为至少两个;所述将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征,包括:将所述有标签样本分别输入至少两个目标任务模型,以由各个目标任务模型对所述有标签样本进行特征提取得到初始的第一任务特征;将各个所述初始的第一任务特征的加权结果,确定为所述有标签样本的第一任务特征。3.根据权利要求2所述的训练样本的标注方法,各个初始的第一任务特征的权重系数与得到所述初始的第一任务特征的目标任务模型的准确率呈正相关。4.根据权利要求1所述的训练样本的标注方法,其中,所述目标任务模型的数量为至少两个;所述将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征,包括:将所述无标签样本分别输入至少两个目标任务模型,以由各个目标任务模型对所述无标签样本进行特征提取得到初始的第二任务特征;将各个所述初始的第二任务特征的加权结果,确定为所述无标签样本的第二任务特征。5.根据权利要求4所述的训练样本的标注方法,各个第二初始特征的权重系数与得到所述第二初始特征的目标任务模型的准确率呈正相关。6.根据权利要求1所述的训练样本的标注方法,其中,所述目标任务模型为活体识别模型;所述第一任务特征为第一活体识别特征;所述第二任务特征为第二活体识别特征;所述任务处理结果包括活体识别置信度;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息,包括:根据所述第一活体识别特征、所述第二活体识别特征和所述第二活体识别特征确定所述无标签样本的任务标注信息。7.根据权利要求1

6中任一项所述的训练样本的标注方法,其中,所述根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息,包括:根据所述任务处理结果确定所述无标签样本的初始标注信息;根据所述第一任务特征和所述第二任务特征判断所述初始标注信息是否可靠;在确定所述初始标注信息可靠的情况下,将所述初始标注信息标注为所述无标签样本
的任务标注信息。8.根据权利要求7所述的训练样本的标注方法,其中,所述有标签样本的数量为至少两个;所述根据所述第一任务特征和所述第二任务特征判断所述初始标注信息是否可靠,包括:计算所述第二任务特征与各个有标签样本的第一任务特征的相似度;根据相似度最高的第一任务特征对应的有标签样本的任务标注信息,判断所述初始标注信息是否可靠。9.一种模型训练方法,包括:获取有标签样本以及无标签样本;将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;将所述无标签样本输入所述目标任务模型,以根据所述目标任务模型得到所述无标签样本的第二任务特征以及任务处理结果;根据所述第一任务特征、所述第二任务特征和所述任务处理结果确定所述无标签样本的任务标注信息;采用所述有标签样本和确定了所述任务标注信息的无标签样本对预训练模型进行模型训练。10.根据权利要求9所述的模型训练方法,其中,所述预训练模型包括目标任务模型;所述采用所述有标签样本和确定了所述任务标注信息的无标签样本对预训练模型进行模型训练,包括:所述采用所述有标签样本和确定了所述任务标注信息的无标签样本对所述目标任务模型进行模型训练,以优化所述目标任务模型。11.一种训练样本的标注装置,包括:获取模块,用于获取有标签样本以及无标签样本;第一特征确定模块,用于将所述有标签样本输入目标任务模型,以根据所述目标任务模型得到所述有标签样本的第一任务特征;第二特征确定模块,用于将所述无标签样本输入所述目标任务模型...

【专利技术属性】
技术研发人员:刘聪毅
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1