【技术实现步骤摘要】
一种实用有效的命名实体识别的计算方法
本专利技术涉及自然语言理解
,具体为一种实用有效的命名实体识别的计算方法。
技术介绍
命名实体识别(NamedEntityRecognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。名实体识别是信息提取、问答系统、句法分析、机器翻译、面向SemanticWeb的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。其过程通常包括两部分:(1)实体边界识别;(2)确定实体类别(人名、地名、机构名或其他)。英语中的命名实体具有比较明显的形式标志(即实体中的每个词的第一个字母要大写),所以实体边界识别相对容易,任务的重点是确定实体的类别。和英语相比,汉语命名实体识别任务更加复杂,而且相对于实体类别标注子任务,实体边界的识别更加困难。然而对于汉语,(1)汉语文本没有类似英文文本中空 ...
【技术保护点】
1.一种实用有效的命名实体识别的计算方法,其特征在于,其具体步骤如下:第一步,向命名实体识别系统内输入一段文字,该文字包含多段句子,命名实体识别系统首先根据文字段落的符号,将文字切分成多个连续的单一句子,句子的数目计为m;第二步,命名实体识别系统按顺序对单个的句子进行识别与判断;第三步,使用基于词表的方法进行识别得到结果标记为K1;第四步,使用基于规则的方法进行识别得到结果标记为K2;第五步,使用基于模型的方法进行识别得到结果标记为K3;第六步,一个句子识别完成后,循环对下一个句子进行第三步、第四步、第五步的识别,从而获得a个结果K1、b个结果K2、c个结果K3;第七步,将 ...
【技术特征摘要】
1.一种实用有效的命名实体识别的计算方法,其特征在于,其具体步骤如下:第一步,向命名实体识别系统内输入一段文字,该文字包含多段句子,命名实体识别系统首先根据文字段落的符号,将文字切分成多个连续的单一句子,句子的数目计为m;第二步,命名实体识别系统按顺序对单个的句子进行识别与判断;第三步,使用基于词表的方法进行识别得到结果标记为K1;第四步,使用基于规则的方法进行识别得到结果标记为K2;第五步,使用基于模型的方法进行识别得到结果标记为K3;第六步,一个句子识别完成后,循环对下一个句子进行第三步、第四步、第五步的识别,从而获得a个结果K1、b个结果K2、c个结果K3;第七步,将上述获得的a个结果K1、b个结果K2、c个结果K3进行...
【专利技术属性】
技术研发人员:简仁贤,刘小杰,
申请(专利权)人:竹间智能科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。