一种基于深度增强学习的代数应用题自动求解器制造技术

技术编号:16587372 阅读:41 留言:0更新日期:2017-11-18 14:56
本发明专利技术属于人工智能技术领域,公开了一种基于深度增强学习的代数应用题自动求解器,所述基于深度增强学习的代数应用题自动求解器采用数字策略来识别相关数字作为表达式树的最底层,通过确定数字节点的运算符节点,以自底向上的方式构建表达式树;提取三个相关数字(13,4,9)作为表达式树的最底层。本发明专利技术的方法比当前最先进的方法更有效、更准确。和对比算法相比,本发明专利技术的框架在提高准确率的同时仅仅需要低于它们10倍的运行时间来求解一道应用题。更重要的是,在最具挑战性的基准数据集上,将准确率从45.2%提高到了63.7%,验证了DQN框架的通用性。

An automatic solver for algebraic application problems based on depth reinforcement learning

The invention belongs to the technical field of artificial intelligence, discloses a depth enhancement application problem solver learning algebra automatically based on the depth of the bottom reinforced automatic algebra solver using digital learning strategies to identify relevant figures as an expression tree based on the determined operator node through digital node, to construct the expression tree a bottom-up way; the extraction of three numbers (13,4,9) of the bottom as an expression tree. The method of the invention is more effective and accurate than the most advanced method at present. Compared with the contrast algorithm, the proposed framework only needs 10 times running time to solve an application problem while improving the accuracy. More importantly, on the most challenging benchmark datasets, the accuracy rate is increased from 45.2% to 63.7%, verifying the versatility of the DQN framework.

【技术实现步骤摘要】
一种基于深度增强学习的代数应用题自动求解器
本专利技术属于人工智能
,尤其涉及一种基于深度增强学习的代数应用题自动求解器。
技术介绍
自动求解应用数学题(MWP)的研究历史可追溯到20世纪60年代,并且最近几年仍然继续吸引着研究者的关注。MWP首先将人类可读懂的句子映射成机器可理解的逻辑形式,然后进行推理。该过程不能简单地通过模式匹配或端对端分类技术解决,因此,设计具有语义理解和推理能力的应用数学题自动求解器已成为通向通用人工智能之路中不可缺少的一步。ARIS提出于“MohammadJavadHosseini,HannanehHajishirzi,OrenEtzioni,andNateKushman.Learningtosolvearithmeticwordproblemswithverbcategorization.InEMNLP,pages523–533,2014.”,作为早期的尝试,使用综合分析来识别相关的变量和数值,并采用SVM来进行操作符的分类。ARIS的缺点是只能支持加法和减法两种运算,不能支持更多更复杂的运算,如乘除法。基于标签的方法,提出于“Chao-ChunL本文档来自技高网...
一种基于深度增强学习的代数应用题自动求解器

【技术保护点】
一种基于深度增强学习的代数应用题自动求解器,其特征在于,所述基于深度增强学习的代数应用题自动求解器采用数字策略来识别相关数字作为表达式树的最底层,通过确定数字节点的运算符节点,以自底向上的方式构建表达式树;提取三个相关数字(13,4,9)作为表达式树的最底层;使用被选中的数字对所构成的特征的实值向量来表示状态,其相关联的动作将为这两个数字确定一个运算符;通过环境反馈的正的或者负的回报来迭代地选择数字对和它们之间的操作符;对于DQN,构造一个两层前馈神经网络来计算预期的Q值;DQN的参数通过代价函数的梯度下降来学习更新,以减少DQN预测的Q值和目标最优Q值之间的差异。

【技术特征摘要】
1.一种基于深度增强学习的代数应用题自动求解器,其特征在于,所述基于深度增强学习的代数应用题自动求解器采用数字策略来识别相关数字作为表达式树的最底层,通过确定数字节点的运算符节点,以自底向上的方式构建表达式树;提取三个相关数字(13,4,9)作为表达式树的最底层;使用被选中的数字对所构成的特征的实值向量来表示状态,其相关联的动作将为这两个数字确定一个运算符;通过环境反馈的正的或者负的回报来迭代地选择数字对和它们之间的操作符;对于DQN,构造一个两层前馈神经网络来计算预期的Q值;DQN的参数通过代价函数的梯度下降来学习更新,以减少DQN预测的Q值和目标最优Q值之间的差异。2.如权利要求1所述的基于深度增强学习的代数应用题自动求解器,其特征在于,所述基于深度增强学习的代数应用题自动求解器的状态被表示为了具有固定维度的实值向量,实值向量通过相互结合函数,被送入到神经网络通过计算来近似Q值函数;首先连接被选中的数字对的特征,特征转换成固定的实值向量来表示状态,随后把状态向量作为一个两层的前馈神经网络的输入,通过网络的计算来近似Q值函数;提取单个数字,数字对和问句这三部分的特征用于状态的构建。3.如权利要求1所述的基于深度增强学习的代数应用题自动求解器,其特征在于,所述基于深度增强学习的代数应用题自动求解器的动作在每一步中,代理选择动作来使两个数字获得回报的期望最大化,并决定这个两个数字的最小公共元祖运算符,运算符:反向减法和反向除法。4.如权利要求1所述的基于深度增强学习的代数应用题自动求解器,其特征在于,所述基于深度增强学习的代数应用题自动求解器的回报函数代理在训练期间对每个动作的选择都会收到从环境中返回的正的或者负的回报;损失函数利用回报来计算目标最优Q值,其与预测Q值的差异,并加这种差异用于调整DQN的参数;所选择的运算符对于其两个相关数字来说是...

【专利技术属性】
技术研发人员:张东祥王磊邵杰申恒涛
申请(专利权)人:成都考拉悠然科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1