一种融合公式信息的数学题求解方法及系统技术方案

技术编号:26378621 阅读:30 留言:0更新日期:2020-11-19 23:47
本申请公开了一种融合公式信息的数学题求解方法及系统,该方法利用以图为表示方法的公式结构来建模数学题目中公式特有的结构信息,并依据该公式依赖图,利用预先训练的公式图神经网络,获取公式依赖图中各个节点的表征向量,同时基于公式依赖图,将图中的文字映射为文字向量。然后利用双GRU以及融合字形网络结构FGN,将节点的表征向量和文字向量嵌入语义向量,在该过程中可使用嵌套序列模型捕获题目整体的文本语义和公式语义两方面的隐式表征,通过融入公式自身元素之间及多个公式之间的结构依赖关系,从而表示数学简答题的信息;最后基于所述语义向量,生成所述待处理数学题的答案序列,实现对包含公式信息的数学题的求解。

【技术实现步骤摘要】
一种融合公式信息的数学题求解方法及系统
本申请设计计算机应用
,更具体地说,设计一种融合公式信息的数学题求解方法及系统。
技术介绍
在智能教育中,构建具有人类智能的数学题目解答器是一项具有挑战性的任务。由于数学题目往往由复杂的自然语言和公式组成,因此求解数学题不仅要求算法具有对自然语言的语义理解能力,还要具备深层次数学公式的推理能力。现有的方法主要针对数学应用题,即由自然语言本文和简单数字描述的一类基础数学题目,这些方法旨在将用自然语言描述的应用题目文本转化为可以计算求解的表达式。然而,这些工作只专注于探索如何让计算机理解应用题文本的语义,但无法解答更普遍的含有公式的数学简答题。由于数学简答题通常包含大量的公式,因此现有方法不能准确解答答案。
技术实现思路
为解决上述技术问题,本申请提供了一种融合公式信息的数学题求解方法及系统,以实现解决包含公式信息的数学题的目的。为实现上述技术目的,本申请实施例提供了如下技术方案:一种融合公式信息的数学题求解方法,包括:获取待处理数学题,所述待本文档来自技高网...

【技术保护点】
1.一种融合公式信息的数学题求解方法,其特征在于,包括:/n获取待处理数学题,所述待处理数学题至少包括由文字和公式描述的题目;/n对所述待处理数学题中的公式进行提取,并依据提取的公式建立公式依赖图,所述公式依赖图用于表征节点的关联关系,所述节点的属性类型包括所述公式中的变量、数字和运算符中的任意一种,所述节点的文本信息包括描述该节点的文本信息;/n基于所述公式依赖图,利用公式图神经网络,将所述节点的文本信息和属性类型进行融合学习,以获得所述节点的表征向量,所述表征向量包括结构向量和文字向量,所述结构向量表征所述公式依赖图的结构,所述文字向量表征所述公式依赖图的文字;/n利用嵌套的序列模型以及所...

【技术特征摘要】
1.一种融合公式信息的数学题求解方法,其特征在于,包括:
获取待处理数学题,所述待处理数学题至少包括由文字和公式描述的题目;
对所述待处理数学题中的公式进行提取,并依据提取的公式建立公式依赖图,所述公式依赖图用于表征节点的关联关系,所述节点的属性类型包括所述公式中的变量、数字和运算符中的任意一种,所述节点的文本信息包括描述该节点的文本信息;
基于所述公式依赖图,利用公式图神经网络,将所述节点的文本信息和属性类型进行融合学习,以获得所述节点的表征向量,所述表征向量包括结构向量和文字向量,所述结构向量表征所述公式依赖图的结构,所述文字向量表征所述公式依赖图的文字;
利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构,将所述节点的结构向量和所述文字向量嵌入语义向量,所述嵌套的序列模型包括第一门控循环单元和第二门控循环单元;
基于所述语义向量,生成所述待处理数学题的答案序列。


2.根据权利要求1所述的方法,其特征在于,所述对所述待处理数学题中的公式进行提取,并依据提取的公式建立公式依赖图包括:
提取所述待处理数学题包含的公式;
将提取的所述公式转换为TEX代码格式,并将TEX代码格式的公式替换所述待处理数学题中的公式;
将每个所述TEX代码格式的公式中的变量、数字和运算符对象作为一个节点,并根据所述节点与其他节点的关联关系,构建所述公式依赖图;
所述关联关系包括兄弟关系、父亲关系、孩子关系、旁亲关系和自环关系中的任意一种,所述兄弟关系表示两个节点处于同一层级且相互关联,所述父亲关系表示所述节点处于另一节点的高层层级且相互关联,所述孩子关系表示所述节点处于另一节点的低层层级且相互关联,所述旁亲关系表示所述公式中相同变量之间的关联关系,所述自环关系表示所述节点指向节点本身。


3.根据权利要求1所述的方法,其特征在于,所述基于所述公式依赖图,利用公式图神经网络,将所述节点的文本信息和属性类型进行融合学习,以获得所述节点的表征向量包括:
将所述公式依赖图表示为G={V,E,R};其中,V和R分别表示点集和关系集,E表示所述公式依赖图中边的集合;(vi,vj,r)∈E表示一条从节点vi到节点vj的具有关系r∈R的边;
基于G={V,E,R},所述公式图神经网络利用K个图卷积层学习所述节点的表征向量。


4.根据权利要求3所述的方法,其特征在于,所述基于G={V,E,R},所述公式图神经网络利用K个图卷积层学习每个节点vi的表征向量包括:
所述公式图神经网络将第k+1层的每个节点vi的向量表示为






其中,d表示预设的向量维度,R表示实数集,Ni表示所有指向节点vi的入向邻居节点,AGGR(x)表示聚合器,用于聚合节点vi的所有入向邻居节点的信息,ACT(x)表示全连接层,所述全连接层的激活函数为线性整流函数ReLU(·),表示向量连接操作,用于将节点vi的邻居向量和节点vi在第k层的向量连接。


5.根据权利要求4所述的方法,其特征在于,所述聚合器包括:基本聚合器和注意力聚合器;
所述基本聚合器表示为:其中,表示待训练的参数,用于线性转换邻居节点传递的消息;
所述注意力聚合器表示为:其中,

用于捕获节点vi的邻居vj本身传递的信息,αji表示权重计算函数,用于不同关系的边的权重βji,γ∈[0,1]表示平衡因子;

其中,和wk∈Rb是待训练参数,σ(·)是非线性激活函数LeakyReLU,使用softmax函数对权值归一化处理;

其中,表示与节点vi存在关系r的相邻节点,MaxPool(.)表示最大池化函数。


6.根据权利要求1所述的方法,其特征在于,所述利用嵌套的序列模型以及所述公式图神经网络中的融合字形结构,将所述节点的结构向量和所述文字向量嵌入语义向量包括:
利用三种向量对所述文字向量进行初始化,并对初始化后...

【专利技术属性】
技术研发人员:陈恩红黄振亚刘淇阴钰王皓高维博吴金泽
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1