命名实体的识别方法技术

技术编号:11380057 阅读:106 留言:0更新日期:2015-05-01 00:58
本发明专利技术提供了命名实体的识别方法,涉及语言识别领域。本发明专利技术实施例提供的命名实体的识别方法,采用复合识别的方式,其通过先对每个语句进行分词处理,再在分词的结果基础上(得出待识别词语单位),确认每个待识别词语单位的词性、语言结构和待识别词语单元在不同种类参考命名词典中的出现情况,并且进一步根据参考命名词典中不同待识别词语单元的出现情况(主要是待识别词语单元在哪种参考命名词典中出现了)和词性、语言结构来精确的确认命名实体识别结果,由于为每个待识别词语单位匹配了相对应的参考命名词典,由此,可以根据参考命名词典对待识别词语单位进行更为精确的命名实体识别。

【技术实现步骤摘要】

【技术保护点】
命名实体的识别方法,其特征在于,包括:对预先获取的待分词语句进行分词,以确定一个或多个待识别词语单位;确认指定的待识别词语单位的词性、语言结构和记载有待识别词语单位的参考命名词典;根据所述待识别词语单位的词性、语言结构和所述待识别词语单元在不同种类参考命名词典中的出现情况,确定每个待识别词语单位的命名实体识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙孝雄
申请(专利权)人:北京云知声信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1