语言生成模型的训练方法、语言生成方法及电子设备技术

技术编号:38367175 阅读:27 留言:0更新日期:2023-08-05 17:33
本申请涉及人工智能技术领域,提供了一种语言生成模型的训练方法、语言生成方法及电子设备。该方法包括:获取第一训练样本集,其中所述第一训练样本集中包括多个第一待解答任务信息和每个所述第一待解答任务信息对应的至少两个答案;根据所述第一训练样本集,通过评分模型,得到所述第一待解答任务信息与所述第一待解答任务信息对应的每个答案之间的匹配分数;根据所述第一训练样本集和所述匹配分数,确定初始语言生成模型对应的梯度更新参数;通过所述梯度更新参数对所述初始语言生成模型的模型参数进行梯度更新,得到目标语言生成模型。本申请实施例提高了语音生成模型的训练效率。练效率。练效率。

【技术实现步骤摘要】
语言生成模型的训练方法、语言生成方法及电子设备


[0001]本申请涉及人工智能
,尤其涉及一种语言生成模型的训练方法、语言生成方法及电子设备。

技术介绍

[0002]随着人工智能技术的发展,对于机器学习的研究也越来越深入。其中,自然语言生成技术是人工智能领域的一个研究热点,通过语言生成模型能够生成人类可理解的语言。
[0003]而语言生成模型通常需要通过人工标注的数据训练得到,由于标注过程耗时较长,这导致模型的训练效率低。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种语言生成模型的训练方法、语言生成方法及电子设备,以解决现有技术中语言生成模型的训练效率低的问题。
[0005]本申请实施例的第一方面,提供了一种语言生成模型的训练方法,包括:获取第一训练样本集,其中所述第一训练样本集中包括多个第一待解答任务信息和每个所述第一待解答任务信息对应的至少两个答案;根据所述第一训练样本集,通过评分模型,得到所述第一待解答任务信息与所述第一待解答任务信息对应的每个答案之间的匹配分数;根据所述第一训练样本集和本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语言生成模型的训练方法,其特征在于,包括:获取第一训练样本集,其中所述第一训练样本集中包括多个第一待解答任务信息和每个所述第一待解答任务信息对应的至少两个答案;根据所述第一训练样本集,通过评分模型,得到所述第一待解答任务信息与所述第一待解答任务信息对应的每个答案之间的匹配分数;根据所述第一训练样本集和所述匹配分数,确定初始语言生成模型对应的梯度更新参数;通过所述梯度更新参数对所述初始语言生成模型的模型参数进行梯度更新,得到目标语言生成模型。2.根据权利要求1所述的语言生成模型的训练方法,其特征在于,所述通过所述梯度更新参数对所述初始语言生成模型的模型参数进行梯度更新,得到目标语言生成模型之前,还包括:根据预先设置的语言内容和/或语言风格,确定第二训练样本集,其中所述第二训练样本集中包括多个第二待解答任务信息和所述第二待解答任务信息对应的目标答案;根据所述第二训练样本集对第一预设神经网络进行训练,得到初始语言生成模型。3.根据权利要求1所述的语言生成模型的训练方法,其特征在于,所述根据所述第一训练样本集,通过评分模型,得到所述第一待解答任务信息与所述第一待解答任务信息对应的每个答案之间的匹配分数之前,还包括:通过第三训练样本集对第二预设神经网络模型进行训练,得到所述评分模型;其中,所述第三训练样本集包括多个训练样本和所述训练样本对应的标签,所述训练样本包括第三待解答任务信息以及每个所述第三待解答任务信息对应的至少两个答案,所述标签包括每个所述第三待解答任务信息与其所对应的每个答案之间的匹配分数。4.根据权利要求1所述的语言生成模型的训练方法,其特征在于,所述根据所述第一训练样本集和所述匹配分数,确定初始语言生成模型对应的梯度更新参数,包括:根据所述第一训练样本集和所述匹配分数,通过下述公式,确定所述梯度更新参数:;其中,表示所述梯度更新参数,N表示所述第一待解答任务信息的个数,表示第一待解答任务信息与其所对应答案之间的匹配分数,表示所述初始语言生成模型,表示输入为的情况下经过所述后输出为答案的映射。5.根据权利...

【专利技术属性】
技术研发人员:暴宇健汪骞
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1