问题解答模型的训练方法及装置、问题解答方法及装置制造方法及图纸

技术编号:36897903 阅读:41 留言:0更新日期:2023-03-18 09:18
本说明书提供问题解答模型的训练方法及装置、问题解答方法及装置,其中问题解答模型的训练方法包括:根据第一训练样本集和语义结构标签,对初始解答模型进行训练,得到参考问题解答模型;将第二训练样本集包括的各个第二训练样本输入参考问题解答模型,获得各个第二训练样本对应的预测语义结构;根据预测语义结构,从各个第二训练样本中筛选出目标训练样本添加至第一训练样本集中,得到更新的第一训练样本集,并返回执行根据第一训练样本集,对初始解答模型进行训练,得到参考问题解答模型的操作步骤,直至达到第一训练停止条件,获得训练完成的问题解答模型,通过少量携带语义结构标签的训练样本,即可得到正确率较高的问题解答模型。答模型。答模型。

【技术实现步骤摘要】
问题解答模型的训练方法及装置、问题解答方法及装置


[0001]本说明书涉及计算机
,特别涉及一种问题解答模型的训练方法。本说明书同时涉及一种问题解答模型的训练装置,一种问题解答方法,一种问题解答装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着计算机和人工智能技术的不断发展,越来越多的工作和学习任务可以自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术自动解析某些问题的答案,从而大大节省人力资源。
[0003]现有技术中,在需要解答某个问题时,可以将需要解答的问题输入端到端模型中,该端到端模型可以输出问题的最终计算公式,从而自动得到该问题的答案。然而,通过端到端模型,只能直接获得问题的最终计算公式,无法获得问题的详细解答步骤,设备的问题解答过程的可视化较差,导致问题答案的可解释性较差,极大影响了用户体验,因而亟需一种可以提高设备的问题解答过程可视化的问题解答方法。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种问题解答模型的训练方法。本说明书同时涉及一种问题解答模型的训练装置,一种问题解答方法,一种问题解答装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种问题解答模型的训练方法,包括:
[0006]获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括的各个第一训练样本携带语义结构标签;
[0007]根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型;
[0008]将所述第二训练样本集包括的各个第二训练样本输入所述参考问题解答模型,获得所述各个第二训练样本对应的预测语义结构;
[0009]根据所述预测语义结构,从所述各个第二训练样本中筛选出目标训练样本添加至所述第一训练样本集中,得到更新的第一训练样本集,并返回执行根据所述第一训练样本集,对初始解答模型进行训练,得到参考问题解答模型的操作步骤,直至达到训练停止条件,获得训练完成的问题解答模型。
[0010]根据本说明书实施例的第二方面,提供了一种问题解答方法,包括:
[0011]将获取到的待解答问题输入算式识别模型,获得所述待解答问题的解答算式;
[0012]将所述解答算式和所述待解答问题输入问题解答模型,获得所述解答算式中各个算式因子的语义结构,其中,所述问题解答模型为通过上述第一方面所述的问题解答模型的训练方法训练得到;
[0013]根据所述各个算式因子的语义结构,生成算式语义树,并根据所述算式语义树,确
定所述待解答问题的解答步骤。
[0014]根据本说明书实施例的第三方面,提供了一种问题解答模型的训练装置,包括:
[0015]获取模块,被配置为获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括的各个第一训练样本携带语义结构标签;
[0016]第一训练模块,被配置为根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型;
[0017]第一获得模块,被配置为将所述第二训练样本集包括的各个第二训练样本输入所述参考问题解答模型,获得所述各个第二训练样本对应的预测语义结构;
[0018]添加模块,被配置为根据所述预测语义结构,从所述各个第二训练样本中筛选出目标训练样本添加至所述第一训练样本集中,得到更新的第一训练样本集,并返回执行所述第一训练模块,直至达到第一训练停止条件,获得训练完成的问题解答模型。
[0019]根据本说明书实施例的第四方面,提供了一种问题解答装置,包括:
[0020]第二获得模块,被配置为将获取到的待解答问题输入算式识别模型,获得所述待解答问题的解答算式;
[0021]第三获得模块,被配置为将所述解答算式和所述待解答问题输入问题解答模型,获得所述解答算式中各个算式因子的语义结构,其中,所述问题解答模型为通过上述第一方面所述的问题解答模型的训练方法训练得到;
[0022]确定模块,被配置为根据所述各个算式因子的语义结构,生成算式语义树,并根据所述算式语义树,确定所述待解答问题的解答步骤。
[0023]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0024]存储器和处理器;
[0025]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现问题解答模型的训练方法或者问题解答方法的步骤。
[0026]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现问题解答模型的训练方法或者问题解答方法的步骤。
[0027]本说明书提供的问题解答模型的训练方法,可以获取第一训练样本集和第二训练样本集,第一训练样本集中包括的各个第一训练样本携带语义结构标签;然后根据第一训练样本集和语义结构标签,对初始解答模型进行训练,得到参考问题解答模型;之后,将第二训练样本集包括的各个第二训练样本输入参考问题解答模型,获得各个第二训练样本对应的预测语义结构;根据预测语义结构,从各个第二训练样本中筛选出目标训练样本添加至第一训练样本集中,得到更新的第一训练样本集,并返回执行根据第一训练样本集,对初始解答模型进行训练,得到参考问题解答模型的操作步骤,直至达到训练停止条件,获得训练完成的问题解答模型。
[0028]这种情况下,可以先通过少量携带语义结构标签的训练样本,对初始解答模型进行训练,然后通过初步训练得到的参考问题解答模型预测不带标签的训练样本的语义结构,并从预测得到的各个预测语义结构中筛选出预测较为正确的预测语义结构,作为新的携带语义结构标签的训练样本,继续进行训练。如此,可以仅通过一小部分带有语义结构标签的训练样本对初始解答模型进行训练,然后基于训练得到的参考问题解答模型,一轮一
轮的添加带语义结构标签的样本数据,使得训练问题解答模型可以使用的带标签的训练样本越来越多,从而获得准确率较高的问题解答模型,通过少量携带语义结构标签的训练样本,即可得到正确率较高的问题解答模型。
[0029]本说明书提供的问题解答方法,可以将获取到的待解答问题输入算式识别模型,获得待解答问题的解答算式;然后将解答算式和待解答问题输入问题解答模型,获得解答算式中各个算式因子的语义结构,其中,问题解答模型为通过上述问题解答模型的训练方法训练得到;之后,可以根据各个算式因子的语义结构,生成算式语义树,并根据算式语义树,确定待解答问题的解答步骤。这种情况下,可以通过预先训练得到的问题解答模型,确定待解答问题的解答算式中每个算式因子的语义结构,构造得到一个算式语义树,该算式语义树可以表示解答算式对应的各个解答步骤,从而可以根据构造得到的算式语义树,确定出待解答问题的详细解答步骤,使得设备的问题解答过程更详细、更可视,提高了通过设备进行问题解答的可视化,进而提高了自动获得的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题解答模型的训练方法,其特征在于,所述方法包括:获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括的各个第一训练样本携带语义结构标签;根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型;将所述第二训练样本集包括的各个第二训练样本输入所述参考问题解答模型,获得所述各个第二训练样本对应的预测语义结构;根据所述预测语义结构,从所述各个第二训练样本中筛选出目标训练样本添加至所述第一训练样本集中,得到更新的第一训练样本集,并返回执行根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型的操作步骤,直至达到第一训练停止条件,获得训练完成的问题解答模型。2.根据权利要求1所述的问题解答模型的训练方法,其特征在于,所述根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型,包括:获取所述第一训练样本集中的第一训练样本,将所述第一训练样本输入所述初始解答模型,获得所述初始解答模型输出的所述第一训练样本对应的预测语义结构;根据所述第一训练样本对应的预测语义结构和语义结构标签,计算所述初始解答模型的损失值;根据所述损失值,调整所述初始解答模型的参数,并返回执行获取所述第一训练样本集中的第一训练样本的操作步骤,直至达到第二训练停止条件,得到所述参考问题解答模型。3.根据权利要求2所述的问题解答模型的训练方法,其特征在于,所述初始解答模型包括编码器、至少一个分类器和屏蔽掩码层;所述将所述第一训练样本输入所述初始解答模型,获得所述初始解答模型输出的所述第一训练样本对应的预测语义结构,包括:将所述第一训练样本输入所述初始解答模型的编码器中,获得所述第一训练样本的隐状态向量;将所述隐状态向量输入所述初始解答模型的至少一个分类器中,获得所述至少一个分类器输出的预测标签和概率;将所述至少一个分类器输出的预测标签和概率输入所述初始解答模型的屏蔽掩码层,获得所述第一训练样本的预测语义结构。4.根据权利要求3所述的问题解答模型的训练方法,其特征在于,所述至少一个分类器为主语分类器、谓词分类器和单位分类器;所述将所述隐状态向量输入所述初始解答模型的至少一个分类器中,获得所述至少一个分类器输出的预测标签和概率,包括:将所述隐状态向量输入所述初始解答模型的主语分类器中,通过所述主语分类器中存储的主语列表,获得所述第一训练样本包括的各个元素对应的预测主语和概率;将所述隐状态向量输入所述初始解答模型的谓词分类器中,通过所述谓词分类器中存储的谓词列表,获得所述第一训练样本包括的各个元素对应的预测谓词和概率;将所述隐状态向量输入所述初始解答模型的单位分类器中,通过所述单位分类器中存
储的单位列表,获得所述第一训练样本包括的各个元素对应的预测单位和概率。5.根据权利要求1

4任意一项所述的问题解答模型的训练方法,其特征在于,所述获取第一训练样本集,包括:获取至少一个第一样本问题以及对应的第一样本算式;将所述第一样本算式的形式由中缀表达式转换为前缀表达式;将所述前缀表达式的第一样本算式拼接在对应的第一样本问题之后,并通过预设间隔符进行分隔,得到第一训练样本;各个第一训练样本组成所述第一训练样本集。6.根据权利要求1

4任意一项所述的问题解答模型的训练方法,其特征在于,所述根据所述预测语义结构,从所述各个第二训练样本中筛选出目标训练样本添加至所述第一训练样本集中,包括:根据所述各个第二训练样本的预测语义结构,生成所述各个第二训练样本对应的预测算式语义树;根据预设算式知识库和验证模型,对各个第二训练样本对应的预测算式语义树进行验证;将通过验证的预测算式语义树对应的第二训练样本作为所述目标训练样本,对应的预测语义结构作为所述目标训练样本的语义结构标签;将所述携带语义结构标签的目标训练样本添加至所述第一训练样本集中。7.根据权利要求6所述的问题解答模型的训练方法,其特征在于,所述根据预设算式知识库和验证模型,对各个第二训练样本对应的预测算式语义树进行验证,包括:根据所述预设算式知识库,对各个第二训练样本对应的预测算式语义树进行知识验证;确定通过知识验证的参考预测算式语义树,并确定所述参考预测算式语义树中的根节点谓词;将所述参考预测算式语义树对应的第二训练样本的样本问题和所述根节点谓词输入所述验证模型,获得所述验证模型输出...

【专利技术属性】
技术研发人员:魏琢钰吴通通张天宇王伟泽王乐刘洋王亮赵薇柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1