【技术实现步骤摘要】
问题解答模型的训练方法及装置、问题解答方法及装置
[0001]本说明书涉及计算机
,特别涉及一种问题解答模型的训练方法。本说明书同时涉及一种问题解答模型的训练装置,一种问题解答方法,一种问题解答装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
[0002]随着计算机和人工智能技术的不断发展,越来越多的工作和学习任务可以自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术自动解析某些问题的答案,从而大大节省人力资源。
[0003]现有技术中,在需要解答某个问题时,可以将需要解答的问题输入端到端模型中,该端到端模型可以输出问题的最终计算公式,从而自动得到该问题的答案。然而,通过端到端模型,只能直接获得问题的最终计算公式,无法获得问题的详细解答步骤,设备的问题解答过程的可视化较差,导致问题答案的可解释性较差,极大影响了用户体验,因而亟需一种可以提高设备的问题解答过程可视化的问题解答方法。
技术实现思路
[0004]有鉴于此,本说明书实施例提供了一种问题解答模型的训练方法。本说明书同时涉及一种问题解答模型的训练装置,一种问题解答方法,一种问题解答装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种问题解答模型的训练方法,包括:
[0006]获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括的各个第一训练样本携带语义结构标签;
[0007]根据 ...
【技术保护点】
【技术特征摘要】
1.一种问题解答模型的训练方法,其特征在于,所述方法包括:获取第一训练样本集和第二训练样本集,所述第一训练样本集中包括的各个第一训练样本携带语义结构标签;根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型;将所述第二训练样本集包括的各个第二训练样本输入所述参考问题解答模型,获得所述各个第二训练样本对应的预测语义结构;根据所述预测语义结构,从所述各个第二训练样本中筛选出目标训练样本添加至所述第一训练样本集中,得到更新的第一训练样本集,并返回执行根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型的操作步骤,直至达到第一训练停止条件,获得训练完成的问题解答模型。2.根据权利要求1所述的问题解答模型的训练方法,其特征在于,所述根据所述第一训练样本集和所述语义结构标签,对初始解答模型进行训练,得到参考问题解答模型,包括:获取所述第一训练样本集中的第一训练样本,将所述第一训练样本输入所述初始解答模型,获得所述初始解答模型输出的所述第一训练样本对应的预测语义结构;根据所述第一训练样本对应的预测语义结构和语义结构标签,计算所述初始解答模型的损失值;根据所述损失值,调整所述初始解答模型的参数,并返回执行获取所述第一训练样本集中的第一训练样本的操作步骤,直至达到第二训练停止条件,得到所述参考问题解答模型。3.根据权利要求2所述的问题解答模型的训练方法,其特征在于,所述初始解答模型包括编码器、至少一个分类器和屏蔽掩码层;所述将所述第一训练样本输入所述初始解答模型,获得所述初始解答模型输出的所述第一训练样本对应的预测语义结构,包括:将所述第一训练样本输入所述初始解答模型的编码器中,获得所述第一训练样本的隐状态向量;将所述隐状态向量输入所述初始解答模型的至少一个分类器中,获得所述至少一个分类器输出的预测标签和概率;将所述至少一个分类器输出的预测标签和概率输入所述初始解答模型的屏蔽掩码层,获得所述第一训练样本的预测语义结构。4.根据权利要求3所述的问题解答模型的训练方法,其特征在于,所述至少一个分类器为主语分类器、谓词分类器和单位分类器;所述将所述隐状态向量输入所述初始解答模型的至少一个分类器中,获得所述至少一个分类器输出的预测标签和概率,包括:将所述隐状态向量输入所述初始解答模型的主语分类器中,通过所述主语分类器中存储的主语列表,获得所述第一训练样本包括的各个元素对应的预测主语和概率;将所述隐状态向量输入所述初始解答模型的谓词分类器中,通过所述谓词分类器中存储的谓词列表,获得所述第一训练样本包括的各个元素对应的预测谓词和概率;将所述隐状态向量输入所述初始解答模型的单位分类器中,通过所述单位分类器中存
储的单位列表,获得所述第一训练样本包括的各个元素对应的预测单位和概率。5.根据权利要求1
‑
4任意一项所述的问题解答模型的训练方法,其特征在于,所述获取第一训练样本集,包括:获取至少一个第一样本问题以及对应的第一样本算式;将所述第一样本算式的形式由中缀表达式转换为前缀表达式;将所述前缀表达式的第一样本算式拼接在对应的第一样本问题之后,并通过预设间隔符进行分隔,得到第一训练样本;各个第一训练样本组成所述第一训练样本集。6.根据权利要求1
‑
4任意一项所述的问题解答模型的训练方法,其特征在于,所述根据所述预测语义结构,从所述各个第二训练样本中筛选出目标训练样本添加至所述第一训练样本集中,包括:根据所述各个第二训练样本的预测语义结构,生成所述各个第二训练样本对应的预测算式语义树;根据预设算式知识库和验证模型,对各个第二训练样本对应的预测算式语义树进行验证;将通过验证的预测算式语义树对应的第二训练样本作为所述目标训练样本,对应的预测语义结构作为所述目标训练样本的语义结构标签;将所述携带语义结构标签的目标训练样本添加至所述第一训练样本集中。7.根据权利要求6所述的问题解答模型的训练方法,其特征在于,所述根据预设算式知识库和验证模型,对各个第二训练样本对应的预测算式语义树进行验证,包括:根据所述预设算式知识库,对各个第二训练样本对应的预测算式语义树进行知识验证;确定通过知识验证的参考预测算式语义树,并确定所述参考预测算式语义树中的根节点谓词;将所述参考预测算式语义树对应的第二训练样本的样本问题和所述根节点谓词输入所述验证模型,获得所述验证模型输出...
【专利技术属性】
技术研发人员:魏琢钰,吴通通,张天宇,王伟泽,王乐,刘洋,王亮,赵薇,柳景明,
申请(专利权)人:北京猿力未来科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。