一种实体命名识别方法及装置制造方法及图纸

技术编号:24331648 阅读:32 留言:0更新日期:2020-05-29 19:53
本申请实施例提供一种实体命名识别方法及装置,所述方法包括:输入待识别语句和基础命名实体集;根据识别规则和所述基础命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集。本申请实施例可以提供一套完善的处理嵌套命名实体识别的方法,在较少甚者没有标记数据上在可接受的准确率上,进行实体识别,因省略标记工作,可以更快速完成实体命名识别。

An entity name recognition method and device

【技术实现步骤摘要】
一种实体命名识别方法及装置
本申请涉及自然语言识别领域,具体设计一种实体命名识别方法及装置。
技术介绍
进入21世纪以后,高科技迅猛发展,尤其是互联网发展更是日新月异,导致数据信息的急剧膨胀,各行各业的子系统中存储了海量的结构化和非结构化数据。如何更好的分析利用这些数据决定了企业未来的发展。对于结构化数据当前已经有各种完善的大数据处理工具进行统计分析以及处理。然而对于非结构化数据的探索才刚刚开始。如何使用自然语言处理对非结构化数据的进行信息抽取正越来越引起人们的关注,但是通用领域的实体识别无法对嵌套命名实体进行划分。
技术实现思路
本申请实施例的目的在于提供一种实体命名识别方法及装置,通过该实体命名识别方法和装置可以准确的解决各个现场业务的特殊名称识别的需求。第一方面,本申请实施例提供了一种实体命名识别方法,所述方法包括:输入待识别语句和基础命名实体集;根据识别规则和所述基础命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集。通过该实体命名识别方法和装置可以准确的解决各个现场业务的特殊名称识别的需本文档来自技高网...

【技术保护点】
1.一种实体命名识别方法,其特征在于,所述方法包括:/n输入待识别语句和基础命名实体集;/n根据识别规则和所述基础命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集。/n

【技术特征摘要】
1.一种实体命名识别方法,其特征在于,所述方法包括:
输入待识别语句和基础命名实体集;
根据识别规则和所述基础命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集。


2.如权利要求1所述的实体命名识别方法,其特征在于,所述基础命名实体集是通过对所述待识别语句进行切词处理并执行通用领域的实体名词识别得到的。


3.如权利要求1所述的实体命名识别方法,其特征在于,所述根据所述识别规则和所述基础命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集,包括:
基于所述识别规则对所述待识别语句进行至少一次识别,获得至少一个实体识别集;
统计所述至少一个实体识别集中包含的实体的数量,并判断所述实体名词数量是否随着识别次数的增加而增加;
当所述实体识别集中的实体名词数量不再随着所述识别次数的增加而增加时,结束识别过程获得所述目标命名实体集。


4.如权利要求1或2所述的实体命名识别方法,其特征在于,所述根据识别规则和所述基础命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集,包括:
根据同义词或者标准正则表达式识别所述待识别语句的实体,增加所述基础命名实体集中实体的数量,得到第一层命名实体集;
根据所述识别规则和所述第一层命名实体集对所述待识别语句进行至少一次识别,得到目标命名实体集。


5.如权利要求4所述的实体命名识别方法,其特征在于,所述根据同义词或者标准正则表达式识别所述待识别语句的实体,增加所述基础命名实体集中实体的数量,得到第一层命名实体集,包括:
将所述基础命名实体集中所包含的实体转化为内部流转对象;
根据多模匹配算法对所述待识别语句进行同义词匹配,获得同义词实体识别集;
根据所述正则表达式对所述待识别语句进行匹配,获得正则实体识别集;
对所述内部流转对象、所述同义词实体识别集以及所述正则实体识别集进行去重处理,得到所述第一层实体识别集。


6.如权利要求4所述的实体命名识别方法,其特征在于,当所述基于所述识别规则对所述待识别语句进行至少一次识别的步骤为基于所述识别规则对所述待识别语句进行多次识别时,则每一次识别过程包括:
过滤所述识别规则,获取目标规则;
根据所述目标规则识别所述待识别语句,获得本次识别对应的实体识别集。


7.如权利要求6所述的实体命名识别方法,其特征在于,
所述过滤所述识别规则,获取目标规则,包括:
根据所述第一...

【专利技术属性】
技术研发人员:蔡文滨喻守益孟嘉
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1