一种实用有效的命名实体识别的计算方法技术

技术编号:22055712 阅读:78 留言:0更新日期:2019-09-07 15:24
本发明专利技术公开了一种实用有效的命名实体识别的计算方法,其具体步骤如下:第一步,向命名实体识别系统内输入一段文字,句子的数目计为m;第二步,命名实体识别系统按顺序对单个的句子进行识别与判断;第三步,使用基于词表的方法进行识别得到结果标记为K1;第四步,使用基于规则的方法进行识别得到结果标记为K2;第五步,使用基于模型的方法进行识别得到结果标记为K3;第六步,进行第三步、第四步、第五步的识别,从而获得a个结果K1、b个结果K2、c个结果K3;第七步,将上述获得的a个结果K1、b个结果K2、c个结果K3进行融合,得到最后的识别结果K。本发明专利技术灵活使用三个方法,并通过逻辑来解决他们的冲突,从而达到较高的命名实体识别的准确率。

A Practical and Effective Method for Named Entity Recognition

【技术实现步骤摘要】
一种实用有效的命名实体识别的计算方法
本专利技术涉及自然语言理解
,具体为一种实用有效的命名实体识别的计算方法。
技术介绍
命名实体识别(NamedEntityRecognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。名实体识别是信息提取、问答系统、句法分析、机器翻译、面向SemanticWeb的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。其过程通常包括两部分:(1)实体边界识别;(2)确定实体类别(人名、地名、机构名或其他)。英语中的命名实体具有比较明显的形式标志(即实体中的每个词的第一个字母要大写),所以实体边界识别相对容易,任务的重点是确定实体的类别。和英语相比,汉语命名实体识别任务更加复杂,而且相对于实体类别标注子任务,实体边界的识别更加困难。然而对于汉语,(1)汉语文本没有类似英文文本中空格之类的显式标示词的本文档来自技高网...

【技术保护点】
1.一种实用有效的命名实体识别的计算方法,其特征在于,其具体步骤如下:第一步,向命名实体识别系统内输入一段文字,该文字包含多段句子,命名实体识别系统首先根据文字段落的符号,将文字切分成多个连续的单一句子,句子的数目计为m;第二步,命名实体识别系统按顺序对单个的句子进行识别与判断;第三步,使用基于词表的方法进行识别得到结果标记为K1;第四步,使用基于规则的方法进行识别得到结果标记为K2;第五步,使用基于模型的方法进行识别得到结果标记为K3;第六步,一个句子识别完成后,循环对下一个句子进行第三步、第四步、第五步的识别,从而获得a个结果K1、b个结果K2、c个结果K3;第七步,将上述获得的a个结果K...

【技术特征摘要】
1.一种实用有效的命名实体识别的计算方法,其特征在于,其具体步骤如下:第一步,向命名实体识别系统内输入一段文字,该文字包含多段句子,命名实体识别系统首先根据文字段落的符号,将文字切分成多个连续的单一句子,句子的数目计为m;第二步,命名实体识别系统按顺序对单个的句子进行识别与判断;第三步,使用基于词表的方法进行识别得到结果标记为K1;第四步,使用基于规则的方法进行识别得到结果标记为K2;第五步,使用基于模型的方法进行识别得到结果标记为K3;第六步,一个句子识别完成后,循环对下一个句子进行第三步、第四步、第五步的识别,从而获得a个结果K1、b个结果K2、c个结果K3;第七步,将上述获得的a个结果K1、b个结果K2、c个结果K3进行...

【专利技术属性】
技术研发人员:简仁贤刘小杰
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1