问题的解答方法及其装置制造方法及图纸

技术编号:36643455 阅读:8 留言:0更新日期:2023-02-18 13:01
本申请涉及自然语言处理领域,公开了一种问题的解答方法及其装置。通过将数学应用题输入到目标解题模型中进行预测,其中,目标解题模型中包括公式分类网络和公式生成网络,获取公式分类网络输出的第一解答公式及其对应的第一答案,获取公式生成网络输出的第二解答公式及其对应的第二答案,根据第一预测结果和第二预测结果,确定数学应用题的目标答案和目标解答公式。本申请在解题过程中融合了分类模型与生成模型的解题结果,以从中确定出更加准确的解答答案,通过解题模型中包括多任务解题模型,提高了模型的解题精度。提高了模型的解题精度。提高了模型的解题精度。

【技术实现步骤摘要】
问题的解答方法及其装置


[0001]本申请涉及自然语言处理领域,尤其涉及一种问题的解答方法及其装置。

技术介绍

[0002]相关技术中,自动解题方法一般基于分类或者序列到序列(Sequence to Sequence,seq2seq)方法。分类模型需要提前定义模板库,模板库限制了模型的预测空间,且模板库存在不能求解的题目,限定了模型能够覆盖的预测上限。seq2seq方法通常基于循环神经网络(Recurrent Neural Network,RNN)编码,其不能很好理解数学问题的文本,从而解题的正确率较低,与此同时,RNN是一种递归计算的结构,不能实现并行化计算,计算效率低。

技术实现思路

[0003]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]为此,本申请的一个目的在于提出一种问题的解答方法。
[0005]本申请的第二个目的在于提出一种问题的解答装置。
[0006]本申请的第三个目的在于提出一种电子设备。
[0007]本申请的第四个目的在于提出一种非瞬时计算机可读存储介质。
[0008]本申请的第五个目的在于提出一种计算机程序产品。
[0009]为达上述目的,本申请第一方面实施方式提出了一种问题的解答方法,包括:获取待解答的数学应用题,并将所述数学应用题输入到目标解题模型中进行预测,其中,所述目标解题模型中包括公式分类网络和公式生成网络;获取所述公式分类网络输出的第一预测结果,其中,所述第一预测结果包括所述第一解答公式及其对应的第一答案;获取所述公式生成网络输出的第二预测结果,其中,所述第二预测结果包括第二解答公式及其对应的第二答案;根据所述第一预测结果和所述第二预测结果,确定所述数学应用题的目标答案和目标解答公式。
[0010]本申请在解题过程中融合了分类模型与生成模型的解题结果,以从中确定出更加准确的解答答案,通过解题模型中包括多任务解题模型,提高了模型的解题精度。
[0011]根据本申请的一个实施方式,所述根据所述第一预测结果和所述第二预测结果,确定所述数学应用题的目标答案和目标解答公式,包括:对所述第一答案和所述第二答案进行统计,获取出现次数最多的答案,作为所述目标答案;从所述第一解答公式和所述第二解答公式中,获取解答出所述目标答案的候选解答公式;获取所述候选解答公式对应的网络预测概率,并确定所述网络预测概率最大的候选解答公式作为所述目标解答公式。
[0012]根据本申请的一个实施方式,所述根据所述第一预测结果和所述第二预测结果,确定所述数学应用题的目标答案和目标解答公式,还包括:响应于所述第一答案和所述第二答案不存在重复,根据所述第一解答公式和/或所述第二解答公式的所述网络预测概率,选取出所述目标解答公式;将所述目标解答公式对应的答案作为所述目标答案。
[0013]根据本申请的一个实施方式,所述根据所述第一解答公式和/或所述第二解答公式的所述网络预测概率,选取出所述目标解答公式,包括:从所述第一解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式;或者,从所述第二解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式;或者,从所述第一解答公式和所述第二解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式。
[0014]根据本申请的一个实施方式,所述公式分类网络和所述公式生成网络共用同一Bert解码器,所述将所述数学应用题输入到目标解题模型中进行预测,包括:将所述数学应用题输入到所述Bert编码器进行编码,以获取所述数学应用题对应的编码向量表示;将所述编码向量表示中的句子向量表示输入到所述公式分类网络的输出层,以预测所述第一预测结果;将所述编码向量表示输入所述公式生成网络的Bert编码器中,以预测所述第二预测结果。
[0015]根据本申请的一个实施方式,所述将所述数学应用题输入到目标解题模型中进行预测之前,还包括:对所述数学应用题中添加文本起始符和文本结束符。
[0016]根据本申请的一个实施方式,所述将所述数学应用题输入到目标解题模型中进行预测之前,还包括:从所述数学应用题中提取文本中的数字,并将所述数字映射成目标符号表示。
[0017]根据本申请的一个实施方式,所述公式分类网络和所述公式生成网络共用同一Bert解码器,所述将所述数学应用题输入到目标解题模型中进行预测,还包括:采用如下方式对解题模型进行训练,以生成所述目标解题模型:获取样本数学应用题;基于所述样本数学应用题,分别对解题模型中的公式分类网络和公式生成网络进行训练,以获取所述公式分类网络的第一损失函数和所述公式生成网络的第二损失函数;根据所述第一损失函数和所述第二损失函数,获取目标损失函数;基于所述目标损失函数对所述解题模型的模型参数进行调整,继续使用下一个样本数学应用题对调整模型参数的所述解题模型训练直至训练结束,生成目标解题模型。
[0018]为达上述目的,本申请第二方面实施例提出了一种问题的解答装置,包括:数学应用题获取模块,用于获取待解答的数学应用题,并将所述数学应用题输入到目标解题模型中进行预测,其中,所述目标解题模型中包括公式分类网络和公式生成网络;第一预测结果获取模块,用于获取所述公式分类网络输出的第一预测结果,其中,所述第一预测结果包括所述第一解答公式及其对应的第一答案;第二预测结果获取模块,用于获取所述公式生成网络输出的第二预测结果,其中,所述第二预测结果包括第二解答公式及其对应的第二答案;目标解答获取模块,用于根据所述第一预测结果和所述第二预测结果,确定所述数学应用题的目标答案和目标解答公式。
[0019]根据本申请的一个实施方式,所述目标解答获取模块,还用于:对所述第一答案和所述第二答案进行统计,获取出现次数最多的答案,作为所述目标答案;从所述第一解答公式和所述第二解答公式中,获取解答出所述目标答案的候选解答公式;获取所述候选解答公式对应的网络预测概率,并确定所述网络预测概率最大的候选解答公式作为所述目标解答公式。
[0020]根据本申请的一个实施方式,所述目标解答获取模块,还用于:响应于所述第一答案和所述第二答案不存在重复,根据所述第一解答公式和/或所述第二解答公式的所述网
络预测概率,选取出所述目标解答公式;将所述目标解答公式对应的答案作为所述目标答案。
[0021]根据本申请的一个实施方式,所述目标解答获取模块,还用于:从所述第一解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式;或者,从所述第二解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式;或者,从所述第一解答公式和所述第二解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式。
[0022]根据本申请的一个实施方式,所述数学应用题获取模块,还用于:将所述数学应用题输入到所述Bert编码器进行编码,以获取所述数学应用题对应的编码向量表示;将所述编码向量表示输入到所述公式分类网络的输出层,以预测所述第一预测结果;将所述编码向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题的解答方法,其特征在于,包括:获取待解答的数学应用题,并将所述数学应用题输入到目标解题模型中进行预测,其中,所述目标解题模型中包括公式分类网络和公式生成网络;获取所述公式分类网络输出的第一预测结果,其中,所述第一预测结果包括所述第一解答公式及其对应的第一答案;获取所述公式生成网络输出的第二预测结果,其中,所述第二预测结果包括第二解答公式及其对应的第二答案;根据所述第一预测结果和所述第二预测结果,确定所述数学应用题的目标答案和目标解答公式。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一预测结果和所述第二预测结果,确定所述数学应用题的目标答案和目标解答公式,包括:对所述第一答案和所述第二答案进行统计,获取出现次数最多的答案,作为所述目标答案;从所述第一解答公式和所述第二解答公式中,获取解答出所述目标答案的候选解答公式;获取所述候选解答公式对应的网络预测概率,并确定所述网络预测概率最大的候选解答公式作为所述目标解答公式。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述第一答案和所述第二答案不存在重复,根据所述第一解答公式和/或所述第二解答公式的所述网络预测概率,选取出所述目标解答公式;将所述目标解答公式对应的答案作为所述目标答案。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一解答公式和/或所述第二解答公式的所述网络预测概率,选取出所述目标解答公式,包括:从所述第一解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式;或者,从所述第二解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式;或者,从所述第一解答公式和所述第二解答公式中选取所述网络预测概率最大的解答公式作为所述目标解答公式。5.根据权利要求1所述的方法,其特征在于,所述公式分类网络和所述公式生成网络共用同一Bert解码器,所述将所述数学应用题输入到目标解题模型中进行预测,包括:将所述数学应用题输入到所述Bert编码器进行编码,以获取所述数学应用题对应的编码向量表示;将所述编码向量表示中的句子向量表示输入到所述公式分类网络的输出层,以预测所述第一预测结果;将所述编码向量表示输入所述公式生成网络的Bert编码器中,以预测所述第二预测结果。6.根据权利要求1

5任一项所述的方法,其特征在于,所述将所述数学应用题输入到目标解题模型中进行预测之前,还包括:
对所述数学应用题中添加文本起始符和文本结束符。7.根据权利要求6所述的方法,其特征在于,所述将所述数学应用题输入到目标解题模型中进行预测之前,还包括:从所述数学应用题中提取文本中的数字,并将所述数字映射成目标符号表示。8.根据权利要求5所述的方法,其特征在于,还包括:采用如下方式对解题模型进行训练,以生成所述目标解题模型:获取样本数学应用题;基于所述样本数学应用题,分别对解题模型中的公式分类网络和公式生成网络进行训练,以获取所述公式分类网络的第一损失函数和所述公式生成网络的第二损失函数;根据所述第一损失函数和所述第二损失函数,获取目标损失函数;基于所述目标损失函数对所述解题模型的模型参数进行调整,继续使用下一个样本数学应用题对调整模型参数的所述解题模型训练直至训练结束,生成目标解题模型。9.一种问题的解答装置,其特征在于,包括:数学应用题获取模块,用于获取待解答的数学应用题,并将所述数学应用题输入到目标解题模型中进行预测,其中,所述目标解题模型中包括公式分类网络和公式生成网络;第一预测...

【专利技术属性】
技术研发人员:刘洋王亮赵薇魏琢玉王乐张天宇柳景明王伟泽
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1