答复生成模型的训练方法、答复语句生成方法和装置制造方法及图纸

技术编号:40074906 阅读:19 留言:0更新日期:2024-01-17 00:57
本公开提出了一种答复生成模型的训练方法、答复语句生成方法和装置,涉及自然语言处理和深度学习等人工智能领域,包括获取待训练的候选答复生成模型的第一训练样本以及第一训练样本中的样本对话上文、样本事实和参考事实标签;识别样本事实与参考事实标签是否匹配并根据识别结果确定候选答复生成模型的当前轮次的模型训练任务;获取候选答复生成模型在模型训练任务下的训练损失;根据训练损失对候选答复生成模型进行参数调整并返回获取下一样本对话上文对参数调整后的候选答复生成模型继续进行训练,直至训练结束得到目标答复生成模型。降低了模型生成的答复信息与事实信息的不一致所导致的机器错误答复的可能程度,提高了答复信息的准确率。

【技术实现步骤摘要】

本公开涉及数据处理领域,尤其涉及自然语言处理和深度学习等人工智能领域。


技术介绍

1、随着技术的发展,用户端可以通过与机器的对话得到想要查询的信息,其中,用户端可以在机器的输入端输入其需求信息,机器通过用户输入的需求信息生成对应的答复信息并返回至用户端。

2、相关技术中,可以通过模板式答复的方法生成返回给用户的答复信息,在该场景下,模板式答复虽然可以为用户提供对应的答复信息,但是模板式回复灵活度较低,用户体验感欠佳,且需要进行模板的预配置,工作量较大。

3、可选地,还可以通过答复生成模型为用户生成对应的答复信息,在该场景下,模型输出的答复语句存在可能出现与事实不一致的情况发生,用户体验感欠佳。


技术实现思路

1、本公开提出了一种答复生成模型的训练方法、答复语句生成方法和装置

2、根据本公开的第一方面,提出了一种答复生成模型的训练方法,方法包括:获取待训练的候选答复生成模型的第一训练样本,以及所述第一训练样本中的样本对话上文、样本事实和参考事实标签;识别所述样本事实与所述参本文档来自技高网...

【技术保护点】

1.一种答复生成模型的训练方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述识别所述样本事实与所述参考事实标签是否匹配,并根据识别结果确定所述候选答复生成模型的当前轮次的模型训练任务,其中,所述模型训练任务为事实答复一致性分类任务和答复生成学习任务中的至少一个,包括:

3.根据权利要求1所述的方法,其中,所述获取所述候选答复生成模型在所述模型训练任务下的训练损失,包括:

4.根据权利要求1所述的方法,其中,所述获取所述候选答复生成模型在所述模型训练任务下的训练损失,包括:

5.根据权利要求3或4所述的方法,其中,所述获取所...

【技术特征摘要】

1.一种答复生成模型的训练方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述识别所述样本事实与所述参考事实标签是否匹配,并根据识别结果确定所述候选答复生成模型的当前轮次的模型训练任务,其中,所述模型训练任务为事实答复一致性分类任务和答复生成学习任务中的至少一个,包括:

3.根据权利要求1所述的方法,其中,所述获取所述候选答复生成模型在所述模型训练任务下的训练损失,包括:

4.根据权利要求1所述的方法,其中,所述获取所述候选答复生成模型在所述模型训练任务下的训练损失,包括:

5.根据权利要求3或4所述的方法,其中,所述获取所述候选答复生成模型基于所述样本对话上文和所述样本事实生成的第一输出答复,和/或,所述获取所述候选答复生成模型基于所述样本对话上文和所述样本事实生成的第二输出答复,包括:

6.根据权利要求1所述的方法,其中,所述获取待训练的候选答复生成模型的第一训练样本,以及所述第一训练样本中的样本对话上文、样本事实和参考事实标签之前,包括:

【专利技术属性】
技术研发人员:焦振宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1