数学问题求解模型的训练方法和装置、推理方法和装置制造方法及图纸

技术编号:12126536 阅读:120 留言:0更新日期:2015-09-25 15:03
本发明专利技术实施例公开了一种数学问题求解模型的训练方法和装置、推理方法和装置。所述训练方法包括:确定针对训练文本的简化的公式模板库;提取所述训练文本的特征向量;以及通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。本发明专利技术实施例提供的数学问题求解模型的训练方法和装置、推理方法和装置缩小了模型的搜索空间,降低了运算量。

【技术实现步骤摘要】

本专利技术实施例涉及自然语言处理
,尤其涉及一种数学问题求解模型的训 练方法和装置、推理方法和装置。
技术介绍
对自然语言描述的数学问题的自动求解是教育产业的应用热点。目前,在这个方 向上已经陆续有成型的产品推出。但是,已经推出的产品普遍存在着对文本的理解能力不 强,应用效果不好的缺陷。 Kushman等人针对现有技术的上述缺陷,提出了一种专门用于理解数学问题的描 述文本,并求取数学问题的解的模型。参见图1,通过对输入文本的理解,可以将输入文本描 述的数学问题对应至一个公式模板,然后,通过将所述输入文本中已知量、未知量以及名词 对齐至所述公式模板中的各个槽位(slot),可以将公式模板实例化为一个具体的公式。然 后,通过对公式的求解就可以得到所述数学问题的解。 如果将上述选取模板、实例化及求解的全过程称为一次推导,则可以定义一次推 导y相对于问题X的条件概率是: 其中,巾(X,y)表示问题X与推导y之间的特征函数,0表示权重参数。 将式(1)取对数,并对不同的推导y进行求和,即得到最大似然估计的目标函数: 假定对于问题X的特征向量是确定的,那么,运用最大似然估计的理念,使得上述 式(2)的取值为最大的权重向量0对应的模型即是求解文本描述的数学问题的最优的模 型。 这种方案虽然提供了文本描述的数学问题的一种理论上可行的方法。但是,求解 上述模型的时候,备选求解公式模板及对齐方式的数目太多,造成需要搜索的搜索空间太 大,算法复杂度太高。并且,这种解决方案还存在着局部收敛的问题。
技术实现思路
针对上述技术问题,本专利技术实施例提供了一种数学问题自动求解模型的训练方法 和装置、推理方法和装置,以缩小搜索空间,降低运算量。 第一方面,本专利技术实施例提供了一种数学问题求解模型的训练方法,所述方法包 括: 确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学 问题的公式模板; 提取所述训练文本的特征向量; 通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定 所述数学问题求解模型的权重向量。 第二方面,本专利技术实施例提供了一种数学问题求解模型的训练装置,所述装置包 括: 模板库确定模块,用于确定针对训练文本的简化的公式模板库,所述公式模板库 包含用于解决所述数学问题的公式模板; 特征向量提取模块,用于提取所述训练文本的特征向量; 模型确定模块,用于通过求解由最大化正确解与错误解之间的边际而规约得到的 二次规划问题,确定所述数学问题求解模型的权重向量。 第三方面,本专利技术实施例提供了一种数学问题求解模型的推理方法,所述方法包 括: 利用所述数学问题求解模型提取用于描述数学问题的输入文本的特征向量,其 中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板,并根据二次规划 方法构建的求解模型; 利用所述数学问题求解模型,根据所述特征向量获取所述数学问题的最优解。 第四方面,本专利技术实施例还提供了一种数学问题求解模型的推理装置,所述装置 包括: 特征提取模块,用于利用所述数学问题求解模型提取用于描述数学问题的输入文 本的特征向量,其中,所述数学问题求解模型是根据用于解决数学问题的简化的公式模板, 并根据二次规划方法构建的求解模型; 求解模块,用于利用所述数学问题求解模型,根据所述特征向量获取所述数学问 题的最优解。 本专利技术实施例提供的数学问题自动求解模型的训练方法和装置通过确定针对训 练文本的简化的公式模板库,提取所述训练文本的特征向量,以及通过求解由最大化正确 解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向 量,从而有效地缩小了解决模型训练时的搜索空间,降低了运算量。【附图说明】 图1是现有技术提供的数学问题自动求解过程的示意图; 图2是本专利技术第一实施例提供的数学问题求解模型的训练方法的流程图; 图3是本专利技术第一实施例提供的简化的公式模板及简化前的公式模板的比较示 意图; 图4是简化前的公式模板产生的阳性样本与假阳性样本的比较示意图; 图5是本专利技术第二实施例提供的数学问题求解模型的训练方法中特征向量提取 操作的流程图; 图6是本专利技术第二实施例提供的特征向量提取的效果示意图; 图7是本专利技术第三实施例提供的数学问题求解模型的训练方法中特征向量提取 操作的流程图; 图8是本专利技术第四实施例提供的数学问题求解模型的推理方法的流程图; 图9是本专利技术第五实施例提供的实现数学问题自动求解过程的流程示意图; 图10是本专利技术第五实施例提供的生成的数学问题的解答过程的示意图; 图11是本专利技术第六实施例提供的数学问题求解模型的训练装置的结构图; 图12是本专利技术第七实施例提供的数学问题求解模型的推理装置的结构图。【具体实施方式】 下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。 第一实施例 本实施例提供了数学问题求解模型的训练方法的一种技术方案。 参见图2,所述数学问题求解模型的训练方法包括: S21,确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述 数学问题的经过简化的公式模板。 在本专利技术中,对Kushman等人提出的公式模板进行了简化。简化以后的公式模板 被称为简化的公式模板,所有简化的公式模板的集合被称为简化的公式模板库。 参见图3,在本专利技术中,简化的公式模板不再像Kushman等人提出的公式模板那 样,不仅包含未知量的系数,还包括未知量本身。公式模板中的未知量的系数对应于训练文 本中的数字,而未知量本身对应于训练文本中的名词。不再包含未知量本身,意味着在参数 对齐时,仅需要将文本中数字与所述简化的公式模板中的系数槽位进行对齐,而不再需要 将文本中的名词代表的未知量与所述简化的公式模板中的槽位进行对齐。因为如果在公式 模板中考虑未知量本身的不同,样本空间中样本的数量会呈指数增长,所以,不再考虑未知 量以后,每个公式模板对应的样本数量会大大减小。 另外,参见图4,Kushman等人提出的公式模板容易产生假阳性样本。这是因为,当 公式模板的系数正确填充后,公式未知数的对齐并不影响计算结果。因此,错误的未知数的 对齐也可能产生正确的结果。这些假阳性样本将影响训练结果。需要说明的是,为了凸显 未知量对齐所产生的假阳性样本,图4中并未示出对文本中不同系数的对齐方案。 在Kushman等人提出的方法中,对未知量的分析有助于将文本中的数字最优的对 齐至所述公式模板中的系数槽位上。在本实施例提供的方法中,由于公式模板中不再考虑 未知量本身,转而通过针对训练文本中的数字与疑问句之间关系设计合适的特征向量而完 成数字对系数槽位的最优对齐。 参见图4,由于简化的公式模板不再考虑未知量本身,当前第1页1 2 3 4 本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN104933158.html" title="数学问题求解模型的训练方法和装置、推理方法和装置原文来自X技术">数学问题求解模型的训练方法和装置、推理方法和装置</a>

【技术保护点】
一种数学问题求解模型的训练方法,其特征在于,包括:确定针对训练文本的简化的公式模板库,所述公式模板库包含用于解决所述数学问题的经过简化的公式模板;提取所述训练文本的特征向量;通过求解由最大化正确解与错误解之间的边际而规约得到的二次规划问题,确定所述数学问题求解模型的权重向量。

【技术特征摘要】

【专利技术属性】
技术研发人员:周力普戴帅湘周晓
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1