【技术实现步骤摘要】
模型处理方法、装置、设备及存储介质
[0001]本申请涉及人工智能领域,尤其涉及一种模型处理方法、装置、设备及存储介质。
技术介绍
[0002]在相关性预测的相关场景中,通常可以采用训练得到的用于生成两个文本之间的相关度的模型来进行预测,在进行模型训练时,需要采用大量的有标签样本来训练,以期望训练后的模型能达到良好的效果;一般来说,有标签样本的标签通常是人工标注的,当人工标注大量样本时,标注成本过高,导致模型训练的效率低下。
技术实现思路
[0003]本申请实施例提供一种模型处理方法、装置、设备及存储介质,可提高模型的训练效率。
[0004]一方面,本申请实施例提供了一种模型处理方法,包括:根据相关性预测规则预测第一样本集中各个第一样本的标签;第一样本的标签用于指示相应第一样本中所包括的两个文本之间的相关度;根据所述第一样本集及所述第一样本集中各个第一样本的标签,训练得到相关性模型;对包括所述相关性模型和参考模型的模型集合中的各个模型进行集成处理,得到集成模型,并通过所述集成模型预测第二样本集中的第二 ...
【技术保护点】
【技术特征摘要】
1.一种模型处理方法,其特征在于,包括:根据相关性预测规则预测第一样本集中各个第一样本的标签;第一样本的标签用于指示相应第一样本中所包括的两个文本之间的相关度;根据所述第一样本集及所述第一样本集中各个第一样本的标签,训练得到相关性模型;对包括所述相关性模型和参考模型的模型集合中的各个模型进行集成处理,得到集成模型,并通过所述集成模型预测第二样本集中的第二样本的标签;第二样本的标签用于指示相应第二样本中所包括的两个文本之间的相关度;采用所述第二样本集及所述第二样本集中各个第二样本的标签,训练得到用于生成两个文本之间的相关度的目标模型;其中,所述模型集合中的一个参考模型用于预测两个文本在一个属性维度下的关联关系,通过所述集成模型预测的第二样本的标签是根据相应的两个文本在一个或者多个属性维度下的关联关系确定的。2.如权利要求1所述的方法,其特征在于,所述相关性预测规则中定义了多个参考标签以及每一个参考标签所对应的相关度描述信息,不同的参考标签对应于不同的相关度;所述根据相关性预测规则预测第一样本集中各个第一样本的标签,包括:获取相关性预测规则,并获取第一样本集;将所述相关性预测规则以及所述第一样本集中的第一样本作为生成式语言模型的输入,并获取所述生成式语言模型的输出文本;其中,所述生成式语言模型用于按照所述相关性预测规则,从所述多个参考标签中选取一个参考标签;将在所述输出文本中指示的参考标签作为相应第一样本的标签。3.如权利要求2所述的方法,其特征在于,所述获取相关性预测规则,包括:获取相关性预测规则模板;所述相关性预测规则模板包括规则字段以及范例字段,所述规则字段用于记录从所述多个参考标签中选取一个参考标签作为用于指示两个文本之间的相关度的标签时的执行标准;所述范例字段用于记录参考样本中所包括的两个文本和相应参考样本的参考标签之间的关系;参考样本的参考标签用于指示:相应参考样本中所包括的两个文本之间的相关度;获取多个参考样本以及各个参考样本的参考标签,并将所述多个参考样本以及相应的参考标签填充至所述相关性预测规则模板的范例字段中,得到所述相关性预测规则。4.如权利要求2所述的方法,其特征在于,所述将所述相关性预测规则以及所述第一样本集中的第一样本作为生成式语言模型的输入,并获取所述生成式语言模型的输出文本,包括:获取输入问题模板;所述输入问题模板包括样本字段;将所述第一样本集中的第一样本中所包括的两个文本填充至所述输入问题模板的样本字段中,得到输入问题;所述生成式语言模型用于按照所述相关性预测规则以及所述输入问题,确定填充至所述样本字段的第一样本中两个文本之间的相关度的标签;将所述相关性预测规则以及所述输入问题作为所述生成式语言模型的输入,并获取所述生成式语言模型的输出文本。5.如权利要求4所述的方法,其特征在于,所述将所述相关性预测规则以及所述输入问
题作为所述生成式语言模型的输入,并获取所述生成式语言模型的输出文本,包括:将所述相关性预测规则作为所述生成式语言模型的输入,并在得到所述生成式语言模型针对所述相关性预测规则所生成的反馈文本之后,将所述输入问题输入至所述生成式语言模型中;获取所述生成式语言模型针对所述输入问题所生成的输出文本。6.如权利要求2所述的方法,其特征在于,所述输出文本中包括标签指示信息以及预测提示信息;所述标签指示信息用于指示:所述生成式语言模型针对输入的第一样本从所述多个参考标签中所选取的参考标签;所述预测提示信息用于指示:所述生成式语言模型针对输入的第一样本从所述多个参考标签中选取相应参考标签时的选取依据。7.如权利要求1所述的方法,其特征在于,所述根据相关性预测规则预测第一样本集中各个第一样本的标签之后,所述方法还包括:输出所述第一样本集中的第一样本及相应的标签,并输出调整提示信息;所述调整提示信息用于提示对第一样本的标签进行调整;接收调整标签的第一样本以及对应的调整后的标签,并将所述第一样本集中相应第一样本的标签更新为调整后的标签。8.如权利要求1所述的方法,其特征在于,所述方法还包括:获取第三样本集,并通过所述目标模型预测得到所述第三样本集中各个第三样本的标签;基于所述第三样本集以及所述第三样本集中各个第三样本的标签,对所述目标模型进行模型蒸馏处理,得到应用模型;其中,得到的一个或多个应用模型的模型参数少于所述目标模型的模型参数。9.如权利要...
【专利技术属性】
技术研发人员:马晋,肖求根,杨帆,李昂,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。