一种基于外部知识的命名实体识别方法、系统及电子设备技术方案

技术编号:23344344 阅读:60 留言:0更新日期:2020-02-15 04:12
本发明专利技术提供一种基于外部知识的命名实体识别方法、系统及电子设备,本方法通过获取至少一文本,初步识别出多个字组成的多个初始命名实体,并基于所述多个初始命名实体结合外部知识数据库获得每两个初始命名实体之间的初始关系向量,基于所述初始关系向量及多个所述初始命名实体,获得真实命名实体,通过引入来自于外界知识数据库的信息帮助命名实体的识别,使得初始命名实体在初步识别后,通过结合外部知识进行进一步判断,以在多个初始命名实体中筛选获得真实命名实体,提高了命名实体识别的准确率。

A named entity recognition method, system and electronic equipment based on external knowledge

【技术实现步骤摘要】
一种基于外部知识的命名实体识别方法、系统及电子设备
本专利技术涉及命名实体识别领域,特别涉及一种基于外部知识的命名实体识别方法、系统及电子设备。
技术介绍
命名实体(namedentity,简写NE),即含义为某个现实中存在的实体对象、由一个词或若干次组成的词组;例如“北京市海淀区”就是一个命名实体,其意义为现实中的一个实体地点。命名实体识别(namedentityrecognition,简写NER),即输入一个文本,要求检测该文本中含有所有命名实体,并且对检测到的命名实体进行分类。一般而言,命名实体可以被分为人名、地名、组织名等,在特殊领域如医学、金融文本中,命名实体可以有不一样的分类方法,例如蛋白质名、DNA名;公司名、职务名等。但是在现有的命名实体识别方法中,忽略了外部知识的影响,会造成错误识别的结果,识别准确率较低。
技术实现思路
为了克服目前现有的基于外部知识的命名实体识别方法识别准确率较低的问题,本专利技术提供基于外部知识的命名实体识别方法、系统及电子设备。本专利技术为解决上述本文档来自技高网...

【技术保护点】
1.一种基于外部知识的命名实体识别方法,其特征在于:包括如下步骤:/n步骤S1:获取至少一文本,所述文本内含有顺序排列的至少一字,并识别文本内多个字获得的多个初始命名实体;/n步骤S2:获取至少一外部知识数据库,将每两个所述初始命名实体输入至所述外部知识数据库,获得该两个初始命名实体对应的初始关系向量;及/n步骤S3:基于所述初始关系向量及多个所述初始命名实体,获得最终的真实命名实体,并识别所述真实命名实体对应的命名实体类别。/n

【技术特征摘要】
1.一种基于外部知识的命名实体识别方法,其特征在于:包括如下步骤:
步骤S1:获取至少一文本,所述文本内含有顺序排列的至少一字,并识别文本内多个字获得的多个初始命名实体;
步骤S2:获取至少一外部知识数据库,将每两个所述初始命名实体输入至所述外部知识数据库,获得该两个初始命名实体对应的初始关系向量;及
步骤S3:基于所述初始关系向量及多个所述初始命名实体,获得最终的真实命名实体,并识别所述真实命名实体对应的命名实体类别。


2.如权利要求1中所述基于外部知识的命名实体识别方法,其特征在于:上述步骤S3具体包括如下步骤:
步骤S31:基于所述初始关系向量,获得每两个所述初始命名实体之间的暂时权重;
步骤S32:基于多个暂时权重,获得每两个所述初始命名实体之间相对于所有初始命名实体的最终权重;及
步骤S33:基于所述最终权重,获得每一所述初始命名实体对应的相对于所有初始命名实体的外部知识向量,基于所述外部知识向量,获得最终的真实命名实体,并识别所述真实命名实体对应的命名实体类别。


3.如权利要求2中所述基于外部知识的命名实体识别方法,其特征在于:上述步骤S33具体包括如下步骤:
步骤S331:基于所述最终权重,获得每一所述初始命名实体对应的相对于所有初始命名实体的外部知识向量;
步骤S332:基于所述初始命名实体对应的词向量以及对应的外部知识向量,判断所述初始命名实体是否为真实命名实体,若是,则进入步骤S333,若否,则进入步骤S334;
步骤S333:获得最终的真实命名实体,并识别所述真实命名实体对应的命名实体类别;及
步骤S334:删除当前初始命名实体,并选取下一初始命名实体后回到步骤S332。


4.如权利要求1中所述基于外部知识的命名实体识别方法,其特征在于:上述步骤S1具体包括如下步骤:
步骤S11:获取至少一文本,所述文本内含有顺序排列的至少一字;及
步骤S12:依次预测每一字的预测标签,根据预测标签以依次将对应的多个字组合成对应的初始命名实体。


5.如权利要求1中所述基于外部知识的命名实体识别...

【专利技术属性】
技术研发人员:宋思睿宋彦
申请(专利权)人:创新工场广州人工智能研究有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1