【技术实现步骤摘要】
任务处理方法、地物分类方法及任务模型训练方法
[0001]本说明书实施例涉及人工智能
,特别涉及一种任务处理方法。
技术介绍
[0002]随着计算机技术的发展,以神经网络模型为基础的人工智能技术在各领域都有着广泛应用。
[0003]目前,为了实现对特定任务的处理,需要预先训练得到与特定任务具有高适应性的目标任务模型。先对初始任务模型进行预训练(Pre
‑
train),再根据特定任务对预训练的初始任务模型进行微调训练(Fine
‑
tune),进而得到目标任务模型。
[0004]然而,由于微调训练的样本任务数据数量规模较小,容易造成过拟合现象(Overfitt ing)并遗失预训练阶段的模型信息。为了解决上述问题,微调训练需要通过正则化约束来执行,避免过拟合现象的产生。与此同时,如果正则化约束对于微调训练的限制过于严苛,会使得目标任务模型与特定任务之间的适应性不足,即造成欠拟合现象(Underfitt ing)。因此,如何合理设定正则化约束,使得微调训练在避免过拟合现象产 ...
【技术保护点】
【技术特征摘要】
1.一种任务处理方法,包括:获取任务数据;将所述任务数据输入目标任务模型,得到任务结果,其中,所述目标任务模型为基于多个样本组对预训练的初始任务模型进行训练得到,训练的过程受正则化约束,所述正则化约束为利用所述初始任务模型和微调模型对各样本组中样本关系的分析结果进行对比得到,所述微调模型基于所述初始任务模型构建得到。2.根据权利要求1所述的方法,在所述将所述任务数据输入目标任务模型之前,还包括:获取样本集和预训练的初始任务模型,并基于所述初始任务模型构建微调模型,其中,所述样本集包括多个样本组;基于所述多个样本组,对所述初始任务模型和所述微调模型输出的样本特征组进行对比计算,获得正则化约束;以所述正则化约束作为约束条件,对所述微调模型进行训练。3.根据权利要求2所述的方法,所述基于所述多个样本组,对所述初始任务模型和所述微调模型输出的样本特征组进行对比计算,获得正则化约束,包括:从所述样本集中提取第一批次的多个样本组,其中,所述第一批次为所述样本集中任意数目的样本组构成的样本组批次;将所述第一批次的多个样本组分别输入所述初始任务模型和所述微调模型,得到各样本组对应的第一样本特征组和第二样本特征组;根据各所述第一样本特征组和各所述第二样本特征组,分别计算各所述第一样本特征组对应的第一样本关系分布和各所述第二样本特征组对应的第二样本关系分布;根据各所述第一样本关系分布和各所述第二样本关系分布,通过对比计算,获得正则化约束。4.根据权利要求3所述的方法,所述根据各所述第一样本特征组和各所述第二样本特征组,分别计算各所述第一样本特征组对应的第一样本关系分布和各所述第二样本特征组对应的第二样本关系分布,包括:根据各所述第一样本特征组和各所述第二样本特征组,分别计算各所述第一样本特征组对应的第一样本特征相似度以及各所述第二样本特征组对应的第二样本特征相似度;根据各所述第一样本特征相似度和各所述第二样本特征相似度,分别计算各所述第一样本特征组对应的第一样本关系分布和各所述第二样本特征组对应的第二样本关系分布。5.根据权利要求3所述的方法,所述根据各所述第一样本关系分布和各所述第二样本关系分布,通过对比计算,获得正则化约束,包括:对各所述第一样本关系分布和各所述第二样本关系分布,进行交叉熵计算,得到正则化约束。6.根据权利要求3至5任一项所述的方法,在所述得到各样本组对应的第一样本特征组和第二样本特征组之后,还包括:对各所述第二样本特征组中的样本特征进行下采样,得到更新的各所述第二样本特征组。7.根据权利要求2所述的方法,所述样本组包括样本任务数据和所述样本任务数据对
应的标签任务结果;以所述正则化约束作为约束条件,对所述微调模型进行训练,包括:获取所述微调模型输出的各样本任务数...
【专利技术属性】
技术研发人员:钱文,罗浩,钱祺,王帆,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。