基于实体组合的数学自然语言处理实现方法、系统技术方案

技术编号:16216413 阅读:86 留言:0更新日期:2017-09-15 22:36
本发明专利技术公开了基于实体组合的数学自然语言处理实现方法、系统,方法包括:建立一数学实体抽取模型,用以提取构成所述数学实体的基本数学元素,将所述基本数学元素封装成数学实体,并对所述数学实体进行排列组合,对所述排列组合中的所有组合类型遍历一次数学关系表,根据所述数学关系表判断是否可以组合成关系,得到正确识别关系的一候选关系集合,完成处理。本发明专利技术的方法能够从数学问题文本挖掘数学实体并组合理解成数学关系,从而实现数学题目文本的理解。

Method and system for realizing mathematical Natural Language Processing based on entity combination

The invention discloses a method for realizing method, including mathematical combinations based on Natural Language Processing system: establish a mathematical entity extraction model, basic mathematical elements to extract form the mathematical entities, the basic mathematical elements are packed into mathematical entities and the mathematical entities, permutation and combination, the combination of in all types of a traversal mathematical relation table, according to the mathematical relation table to determine whether can be combined into a relationship, get a correct recognition of the relationship between the set of candidate relations, complete processing. The method of the invention can extract mathematical entities from mathematical problems, text, and combine them into mathematical relations so as to achieve the understanding of mathematical subject texts.

【技术实现步骤摘要】
基于实体组合的数学自然语言处理实现方法、系统
本专利技术涉及自然语言处理,特别涉及基于实体组合的数学自然语言处理实现方法、系统,处理过程基于初等数学题目的自然语言描述中理解关系,并将处理结果作为实现数学知识推理和问题解答的关键操作流程。
技术介绍
自然语言处理(NLP)按照语言能力、语言应用的模型,并通过建立计算机框架来实现对应的语言模型,并不断地完善语言模型。自然语言处理包括中文自动分词,词性标注,句法分析,自然语言生成,文本分类,信息检索,信息抽取,文字校对,自动摘要等等。自然语言处理,现在实际的技术困难还是语义的复杂性,包含因果关系和逻辑推理的上下文等。现在解决这些问题的思路主要还是深度学习(DeepLearning)。深度学习拓展了神经网络的层次,而且大数据的积累和并行计算的增强则给这种方法奠定了基础,因此基于大数据、并行计算的深度学习将会给自然语言处理带来长足的进步。到目前为止,日常生活领域的自然语言理解应用已经存在并且应用广泛,如自动翻译和手机语音助手都涉及到自然语言理解。现有技术中的一些技术方案比如有采用句法结构解析,其通过计算机对自然语言语句的句子成分进行自动划分以辅本文档来自技高网...
基于实体组合的数学自然语言处理实现方法、系统

【技术保护点】
基于实体组合的数学自然语言处理实现方法,其特征在于,包括如下步骤:建立一数学实体抽取模型,用以提取构成所述数学实体的基本数学元素,将所述基本数学元素封装成数学实体,并对所述数学实体进行排列组合,对所述排列组合中的所有组合类型遍历一次数学关系表,根据所述数学关系表判断是否可以组合成关系,得到正确识别关系的一候选关系集合,完成处理。

【技术特征摘要】
1.基于实体组合的数学自然语言处理实现方法,其特征在于,包括如下步骤:建立一数学实体抽取模型,用以提取构成所述数学实体的基本数学元素,将所述基本数学元素封装成数学实体,并对所述数学实体进行排列组合,对所述排列组合中的所有组合类型遍历一次数学关系表,根据所述数学关系表判断是否可以组合成关系,得到正确识别关系的一候选关系集合,完成处理。2.根据权利要求1所述的数学自然语言处理实现方法,其特征在于,还包括:利用剪枝策略将正确的识别关系保留/提取。3.根据权利要求1所述的数学自然语言处理实现方法,其特征在于,提取基本数学元素的方法具体为:3-1)接收去除LaTeX格式后的数学文本数据;3-2)判断在所述文本数据中是否存在缺省名称的基本数学元素,若存在,则引入随机变量作为所述基础数学元素的缺省命名,同时在增加上下文指代后完成预处理;3-3)对上述预处理后的数学文本数据打上标签,确定基本数学元素。4.根据权利要求3所述的数学自然语言处理实现方法,其特征在于,打上标签的操作基于一打标签模型,所述打标签模型按照CRF方法结合大规模语料训练结果得到。5.根据权利要求1所述的数学自然语言处理实现方法,其特征在于,对所述数学实体进行排列组合的方法具体为:对于n个实体排列组合方式为:从n个实体中分别任选1个,然后全排列;任选两个,然后全排列;…;任选n个,然后全排列,得到所有的排列组合方式个数为:其中,...

【专利技术属性】
技术研发人员:王庆先
申请(专利权)人:成都准星云学科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1