The invention discloses a name recognition method for elementary mathematics field, first to identify the mathematical text information, and pretreatment, the word are arranged in columns; extraction has been pretreatment of text segmentation, mark the location in the words of the current text; in the words of the label position the text, part of speech tagging of the word segmentation; get POS tagging results after the judgment results are correct, if correct, is marked success; if not, then re entered the step S1, and the text information re training annotation. The invention also discloses a naming recognition system for elementary mathematics field, which comprises a text preprocessing module, a word segmentation tagging module, a POS tagging module and a result judging module. The invention can effectively extract the mathematical information in the text, and has the advantages of accurate identification and high efficiency.
【技术实现步骤摘要】
一种面向初等数学领域的命名识别方法及其系统
本专利技术涉及自然语言处理领域,具体涉及一种面向初等数学领域的命名识别方法及其系统。
技术介绍
随着人工智能的发展和推理技术的深化,自动推理技术得到了有效的应用,同时相关的理论、技术、方法也得到了很大的发展,自动推理在数学方面的应用也更加的广泛深入。在利用自动推理推理数学方面的问题时,往往有许多的信息不能有效的识别或者识别效率很低。初等数学的命名识别是一个自动解题系统中的重要一环,它涉及到前端的自然语言处理,一段数学文本信息,提取出文本中的数学方面的信息是最重要的一环,当前自然语言对于初等数学方面的理解并不准确,因此需要一种有效的系统能够准确地识别初等数学里面的各种数学信息,以及隐含的更深一层次的信息。
技术实现思路
基于此,针对上述问题,有必要提出一种面向初等数学领域的命名识别方法及其系统,本专利技术可以有效的提取文本中关于数学方面的信息,识别准确、效率高。本专利技术提供一种面向初等数学领域的命名识别方法,其技术方案是:一种面向初等数学领域的命名识别方法,包括如下步骤:S1、确定一个待识别的数学文本信息,并进行预处理,将其逐字按列排列;S2、提取步骤S1中已经进行过分词预处理的文字,标注当前文字在词中的位置;S3、标注完成当前文字在词中的位置后,对当前的分词进行词性标注;S4、得到词性标注的结果后,判断标注结果是否正确,如果正确,则标注成功;如果不正确,则重新进入步骤S1,并对其文本信息进行重新训练标注。针对一段数学文本信息,对其进行分词、标注、将文本中的数学信息提取出来,得到实体之间的关系;如此,才能进行接下来的 ...
【技术保护点】
一种面向初等数学领域的命名识别方法,其特征在于,包括如下步骤:S1、确定一个待识别的数学文本信息,并进行预处理,将其逐字按列排列;S2、提取步骤S1中已经进行过分词预处理的文字,标注当前文字在词中的位置;S3、标注完成当前文字在词中的位置后,对当前的分词进行词性标注;S4、得到词性标注的结果后,判断标注结果是否正确,如果正确,则标注成功;如果不正确,则重新进入步骤S1,并对其文本信息进行重新训练标注。
【技术特征摘要】
1.一种面向初等数学领域的命名识别方法,其特征在于,包括如下步骤:S1、确定一个待识别的数学文本信息,并进行预处理,将其逐字按列排列;S2、提取步骤S1中已经进行过分词预处理的文字,标注当前文字在词中的位置;S3、标注完成当前文字在词中的位置后,对当前的分词进行词性标注;S4、得到词性标注的结果后,判断标注结果是否正确,如果正确,则标注成功;如果不正确,则重新进入步骤S1,并对其文本信息进行重新训练标注。2.根据权利要求1所述面向初等数学领域的命名识别方法,其特征在于,所述步骤S2具体包括以下步骤:提取文字后,对每个文字进行位置标注,如果该文字在词的词首,则标注为B;如果该文字在词的中间,则标注为M;如果该文字在词的末尾,则标注为E;如果该文字独立成词,则标注为S。3.根据权利要求1或2所述面向初等数学领域的命名识别方法,其特征在于,在步骤S2中采用4-tag标注法标注当前文字在词中的位置。4.根据权利要求1或2所述面向初等数学领域的命名识别方法,其特征在于,所述步骤S3具体包括以下步骤:判断待识别的数学文本信息中每个词的语法范畴,确定其词性并加以标注,如果该词是动词,则标注为v;如果该词是名词,则标注为n;如果该词是连接词,则标注为nd;如果该词是字母,则标注为ws;如果该词是符号,则标注为wp。5.一种面向初等数学领域的命名识别系统,其特征在于,包括文本预...
【专利技术属性】
技术研发人员:林辉,
申请(专利权)人:成都准星云学科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。