数学应用题知识构建与解答方法、系统、设备及存储介质技术方案

技术编号：36933262 阅读：57 留言：0更新日期：2023-03-22 18:55

本发明专利技术公开了一种数学应用题知识构建与解答方法、系统、设备及存储介质，它们是一一对应的方案，本发明专利技术提供的方案中建立了“问题

全部详细技术资料下载

【技术实现步骤摘要】
数学应用题知识构建与解答方法、系统、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种数学应用题知识构建与解答方法、系统、设备及存储介质。

技术介绍

[0002]数学应用题（Math Word Problems，MWP）自动求解是探究如何实现通用型人工智能的一个重要任务，其目标是使机器阅读一段自然语言描述的数学问题并推理获得相应的答案。这一过程要求机器从数据中学习数学知识、理解数理逻辑、并像人类一样进行答案推理。因此，数学应用题自动求解能力被视为机器智能水平的一个重要标志，一直是人工智能领域的一个基础但十分重要的研究方向。
[0003]目前，关于数学应用题自动求解主要有以下方法：（1）基于规则的自动求解方法。
[0004]基于规则的自动求解方法依赖于人工构建的规则或模式，通过匹配问题文本中的子句与预定义的问题模板，将问题映射为特定的命题形式，再利用人工定义的规则逐步生成推理结果。
[0005]（2）基于统计的自动求解方法。
[0006]基于统计的自动求解方法利用传统的机器学习模型如支持向量机、对数线性模型等，从问题文本中识别出实体、数量和操作符，再将其代入预定义的表达式模板中，通过简单的逻辑推理得出答案。
[0007]（3）基于语义解析的自动求解方法。
[0008]基于语义解析的自动求解方法将问题文本映射为结构化的语义表示（如语义解析树），通过一定的逻辑规则将语义信息转化为数学表达式。
[0009]（4）基于深度学习的自动求解方法。
>[0010]基于深度学习的自动求解方法根据对问题信息的不同利用、推理方式的不同定义，设计了不同的神经网络架构用于自动求解中。如在序列到序列（Sequence
‑
to
‑
sequence，Seq2Seq）框架中，循环神经网络利用问题文本信息与已生成的表达式推理下一步的符号。序列到树（Sequence
‑
to
‑
tree，Seq2Tree）框架则基于人类的问题分解逻辑机制，利用目标导向的树结构解码器逐步分解推理目标。图到树（Graph
‑
to
‑
tree，Graph2Tree）框架利用图编码器捕捉数值与问题文本的描述关系、数值之间的大小关系，实现对问题更准确的理解并获得更合理的推理结果。
[0011]上述自动求解方法关注如何提高机器对问题文本的理解能力，或是提高机器利用问题本身包含的信息进行逻辑推理的能力。然而，这些方法与类人水平的人工智能仍具有一定距离，这是因为它们忽略了在求解数学应用题时对知识的学习构建与应用推理过程。因此，有必要研究新的技术方案，使机器在阅读自然语言描述的数学问题并推理获得相应的答案的过程中不断的强化理解和掌握能力，以提升推理结果的准确性。

技术实现思路

[0012]本专利技术的目的是提供一种数学应用题知识构建与解答方法、系统、设备及存储介质，构建“问题
‑
知识
‑
表达式”的学习
‑
推理范式，依次建模“通过求解问题学习知识”的知识构建过程与“应用知识求解问题”的知识推理过程，两者相互耦合、相互促进，使机器能够不断的强化理解和掌握能力，从而提升推理结果的准确性。
[0013]本专利技术的目的是通过以下技术方案实现的：一种数学应用题知识构建与解答方法，包括：构建包含知识编码器与知识解码器的神经网络框架，数学应用题输入至所述神经网络框架后，分别进入所述知识编码器与知识解码器；所述知识编码器用于知识构建，根据数学应用题中的文本计算知识的概率分布，并从中采样出知识；所述知识解码器用于知识应用，知识应用过程包含两个阶段，第一个阶段，结合所述知识对数学应用题中的文本的语义信息进行挖掘，获得数学应用题的文本表征序列以及初始推理目标；第二阶段，通过所述数学应用题的文本表征序列、初始推理目标以及知识逐步预测符号，获得预测的求解表达式，通过预测的求解表达式获得解题结果。
[0014]一种数学应用题知识构建与解答系统，包括：神经网络框架构建单元，用于构建包含知识编码器与知识解码器的神经网络框架，数学应用题输入至所述神经网络框架后，分别进入所述知识编码器与知识解码器；知识构建单元，由所述知识编码器实现，根据数学应用题中的文本计算知识的概率分布，并从中采样出知识；知识应用单元，由知识解码器实现知识应用，知识应用过程包含两个阶段，第一个阶段，结合所述知识对数学应用题中的文本的语义信息进行挖掘，获得数学应用题的文本表征序列以及初始推理目标；第二阶段，通过所述数学应用题的文本表征序列、初始推理目标以及知识逐步预测符号，获得预测的求解表达式，通过预测的求解表达式获得解题结果。
[0015]一种处理设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序；其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现前述的方法。
[0016]一种可读存储介质，存储有计算机程序，当计算机程序被处理器执行时实现前述的方法。
[0017]由上述本专利技术提供的技术方案可以看出，本专利技术建立了“问题
‑
知识
‑
表达式”的学习
‑
推理范式，它可以融合多种类型知识与机器学习任务，进而模拟人类从复杂场景中学习共性知识的过程，为探究强人工智能提供了一定的基础；同时，本专利技术提高了问题求解的准确性与知识学习结果的可解释性，构建的数学知识可以作为众多机器学习任务的先验信息改善任务表现，也可进一步辅助教育平台搭建知识图谱，并基于此提供更好的个性化教育服务。
附图说明
[0018]为了更清楚地说明本专利技术实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本专利技术的一些实施例，对于本
领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。
[0019]图1为本专利技术实施例提供的一种数学应用题知识构建与解答方法的示意图；图2为本专利技术实施例提供的一种数学应用题知识构建与解答系统的示意图；图3为本专利技术实施例提供的一种处理设备的示意图。
具体实施方式
[0020]下面结合本专利技术实施例中的附图，对本专利技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本专利技术一部分实施例，而不是全部的实施例。基于本专利技术的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本专利技术的保护范围。
[0021]首先对本文中可能使用的术语进行如下说明：术语“包括”、“包含”、“含有”、“具有”或其它类似语义的描述，应被解释为非排它性的包括。例如：包括某技术特征要素（如原料、组分、成分、载体、剂型、材料、尺寸、零件、部件、机构、装置、步骤、工序、方法、反应条件、加工条件、参数、算法、信号、数据、产品或制品等），应被解释为不仅包括明确列出的某技术特征要素，还可以包括本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数学应用题知识构建与解答方法，其特征在于，包括：构建包含知识编码器与知识解码器的神经网络框架，数学应用题输入至所述神经网络框架后，分别进入所述知识编码器与知识解码器；所述知识编码器用于知识构建，根据数学应用题中的文本计算知识的概率分布，并从中采样出知识；所述知识解码器用于知识应用，知识应用过程包含两个阶段，第一个阶段，结合所述知识对数学应用题中的文本的语义信息进行挖掘，获得数学应用题的文本表征序列以及初始推理目标；第二阶段，通过所述数学应用题的文本表征序列、初始推理目标以及知识逐步预测符号，获得预测的求解表达式，通过预测的求解表达式获得解题结果。2.根据权利要求1所述的一种数学应用题知识构建与解答方法，其特征在于，所述神经网络框架需要预先进行训练，训练阶段使用的数学应用题包含文本与给定求解表达式，利用预测的求解表达式与数学应用题中给定求解表达式的差异，以及计算出的知识的概率分布与给定的知识的先验分布的差异构建训练目标函数，使用训练目标函数优化所述神经网络框架；其中，所述训练目标函数表示为：；其中，L表示训练目标函数，E表示期望；表示知识编码器利用数学应用题中的文本X计算的知识Z的概率分布，表示知识解码器利用数学应用题中的文本X与知识Z，预测给定求解表达式Y的概率；表示知识Z在服从知识编码器计算的概率分布时，知识解码器利用知识Z预测数学应用题与给定求解表达式的对数概率的期望值；P(Z)表示给定的知识的先验分布，KL表示相对熵，表示通过相对熵衡量与P(Z)的差异。3.根据权利要求1或2所述的一种数学应用题知识构建与解答方法，其特征在于，所述根据数学应用题中的文本计算知识的概率分布，并从中采样出知识包括：设定知识包括：词语与词语之间的关系，以及词语与运算符之间的关系；对于词语i和词语j，使用表示它们之间的关系；对于词语i和运算符c，使用表示它们之间的关系；所述数学应用题中的文本为对应的向量，词语i与词语j对应的向量分别对应表示为w
i
与w
j
，运算符c对应的向量表示为o
c
；训练阶段采用如下方式计算词语与词语之间的关系，以及词语与运算符之间的关系：；；其中，是sigmoid函数，f1与f2表示两个关系预测网络，为从耿贝尔(0,1)
分布中采出的独立同分布样本，为控制近似程度的温度超参数；训练完毕后，采用如下方式编码词语与词语之间的关系的伯努利分布，以及词语与运算符之间的关系的伯努利分布：；；其中，表示词语i和词语j之间的关系的伯努利分布，表示词语i和运算符c的关系的伯努利分布，X表示数学应用题数据中的文本，Bernoulli表示伯努利分布；再从伯努利分布、中采样与。4.根据权利要求1所述的一种数学应用题知识构建与解答方法，其特征在于，所述结合所述知识对数学应用题中的文本的语义信息进行挖掘，获得数学应用题的文本表征序列以及初始推理目标包括：所述数学应用题中的文本为所有词语对应的向量形成的向量序列，向量序列表示为，其中，n表示词语数目，w
i
为词语i对应的向量，i=1,2,
…
,n；通过所述知识解码器中的解题编码器对数学应用题中的文本的语义信息进行挖掘，表示为：；其中，f3表示文本挖掘网络，H...

【专利技术属性】
技术研发人员：黄振亚，刘嘉聿，陈恩红，刘淇，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人