【技术实现步骤摘要】
一种基于语义对齐的树结构数学应用题求解方法及系统
本专利技术涉及数学应用题的自动化求解
,具体涉及一种基于语义对齐的树结构数学应用题求解方法及系统。
技术介绍
数学应用题自动求解的任务目标是通过理解问题的文本描述,推理出表达式并计算出正确答案,这要求求解器具有强大的自然语言理解和推理能力。一个典型的数学应用题是一个简短的故事,用文字叙述有关事实,反映某种数量关系,并提出含有一个或多个未知数的问题。为了解决这个问题,需要从文本中识别出相关的运算数和运算符,并且需要确定这些数量的计算顺序。传统的应用题求解器依赖于手工特征提取和模板标注,这需要大量的人力和专业知识。深度学习为应用题自动化求解提供了新的方法。有的方法直接训练一个序列到序列的模型来学习问题到方程的映射关系;有的方法基于循环神经网络利用模板来构建数学表达式树。现有的基于编码器和解码器的端到端深度学习模型,简单地将数学应用题求解问题当成了序列理解和标注问题来求解,没有挖掘和利用题目中的语义关系来帮助运算表达式的构建。除此之外,现有的技术只能求解含有一个未知数的应用题,不能解决含有多个未知数的非线性问题,距离能在实际应用中求解多种复杂题型的通用应用题求解器还有很大差距。
技术实现思路
因此,本专利技术提供的一种基于语义对齐的树结构数学应用题求解方法及系统,克服现有的技术只能求解含有一个未知数的应用题,不能解决含有多个未知数的非线性问题的缺陷。第一方面,本专利技术实施例提供基于语义对齐的树结构数学应用题求解方法,包括:获取待求 ...
【技术保护点】
1.一种基于语义对齐的树结构数学应用题求解方法,其特征在于,包括:/n获取待求解的应用题题目文本;/n将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;/n将所述上下文特征表示利用第二神经网络构建根节点向量;/n利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;/n利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;/n利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;/n采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。/n
【技术特征摘要】
1.一种基于语义对齐的树结构数学应用题求解方法,其特征在于,包括:
获取待求解的应用题题目文本;
将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示;
将所述上下文特征表示利用第二神经网络构建根节点向量;
利用第三神经网络对根节点向量进行节点类别,根据节点类别采用先序遍历的方式构建表达式树结构;
利用第四神经网络分别对表达式树结构的子树特征和应用题题目文本的特征表示进行非线性变换,将两者转换到相同的语义空间;
利用预设约束项对表达式树结构的子树特征与应用题题目文本的特征表示进行语义对齐处理;
采用中序遍历的方式,将语义对齐处理后的表达式树结构解析成完整的数学表达式作为待求解的方程。
2.根据权利要求1所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,所述第二神经网络、第三神经网络以及第四神经网络均为可实现非线性变换的神经网络。
3.根据权利要求2所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,将所述待求解的应用题题目文本通过第一神经网络转化为语义编码后的上下文特征表示的步骤,包括:
将待求解的应用题题目文本输入中的每个词标记通过查找单词表的方式被转换为词嵌入;
将词嵌入向量被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量;
将两个隐状态向量相加,得到应用题题目文本的语义编码后的上下文特征表示。
4.根据权利要求3所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,将词嵌入向量被从头到尾和从末到头两种方式输入到循环神经网络中,对应产生两个隐状态向量的步骤,包括:
将词嵌入向量被从头到尾和从末到头两种方式输入到双向门控循环单元中,对应产生两个隐状态向量和隐状态向量的生成过程通过以下公式表示:
其中,GRU(.,.)表示两层双向门控循环单元的函数。
5.根据权利要求2所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,将所述上下文特征表示利用第二神经网络构建根节点向量的步骤,包括:
将所述上下文特征表示通过两层带门控机制的前馈神经网络构建根节点向量,根节点向量通过以下公式表示:
n0=σ(Wqg0)⊙tanh(wtg0)
其中,n0表示根节点向量,σ表示sigmoid激活函数,tanh表示双曲正弦激活函数,Wq和Wt分别表示两层神经网络的网络参数,g0表示编码后的上下文特征表示。
6.根据权利要求1所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,所述节点类别包括:应用题题目文本中已经给出的变量的数值、数学操作数的集合、未在题目文本中出现,但已经成为常识的常量的数值以及应用题题目文本中需要计算的未知数。
7.根据权利要求6所述的基于语义对齐的树结构数学应用题求解方法,其特征在于,根据节点类别采用先序遍历的方式构建表达式树结构的步骤,包括:
当节点被识别为数学操作数时,当前节点向量需要被用来推导左右...
【专利技术属性】
技术研发人员:龚科,周启贤,
申请(专利权)人:暗物智能科技广州有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。