【技术实现步骤摘要】
实体识别方法、装置、电子设备及计算机可读存储介质
[0001]本申请涉及文本处理
,具体而言,本申请涉及一种实体识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]命名实体识别是自然语言处理(Natural Language Processing,NLP)任务的基础研究领域,有广泛的应用场景,涵盖了关键词提取、信息检索、信息抽取、事件分析、机器翻译、智能对话等多种应用。命名实体识别一般包括对人名、地名、组织机构名等名词实体的识别,在特定领域内,会定义对应的命名实体。但是,现有的命名实体识别方法针对特定场景下的实体识别准确率较低。
技术实现思路
[0003]本申请提供了一种实体识别方法、装置、电子设备及计算机可读存储介质,可以提高实体识别准确率。所述技术方案包括:
[0004]第一方面,本申请实施例提供了一种实体识别方法,该方法包括:获取待处理语句;对所述待处理语句进行分析得到所述待处理语句包含的依存关系,并根据所述依存关系确定待识别的目标实体类型在所述待处理语句中的候选位置,获 ...
【技术保护点】
【技术特征摘要】
1.一种实体识别方法,其特征在于,所述方法包括:获取待处理语句;对所述待处理语句进行分析得到所述待处理语句包含的依存关系,并根据所述依存关系确定待识别的目标实体类型在所述待处理语句中的候选位置,获取所述候选位置对应的候选实体;若所述候选位置对应的候选实体的词性与预设词性匹配,将所述候选实体确定为所述目标实体类型对应的目标实体。2.根据权利要求1所述的方法,其特征在于,所述对所述待处理语句进行分析得到所述待处理语句包含的依存关系,并根据所述依存关系确定待识别的目标实体类型在所述待处理语句中的候选位置,获取所述候选位置对应的候选实体,包括:构建所述待处理语句的状态机;对所述待处理语句进行分析得到所述待处理语句包含的依存关系;根据所述依存关系确定所述状态机的起始位置及终止位置,并将所述起始位置与所述终止位置之间的位置作为待识别的目标实体类型在所述待处理语句中的候选位置,获取所述候选位置对应的候选实体。3.根据权利要求2所述的方法,其特征在于,所述根据所述依存关系确定所述状态机的起始位置及终止位置,并将所述起始位置与所述终止位置之间的位置作为待识别的目标实体类型在所述待处理语句中的候选位置,获取所述候选位置对应的候选实体,包括从所述依存关系中确定目标依存关系;基于所述目标依存关系确定所述状态机的起始位置及终止位置;将所述起始位置与所述终止位置之间的位置作为待识别的目标实体类型在所述待处理语句中的候选位置,获取所述候选位置对应的候选实体;若所述候选位置对应的候选实体的词性与预设词性不匹配,重复执行所述从所述依存关系中确定目标依存关系、所述基于所述目标依存关系确定所述状态机的起始位置及终止位置以及所述将所述起始位置与所述终止位置之间的位置作为待识别的目标实体类型在所述待处理语句中的候选位置,获取所述候选位置对应的候选实体的步骤,直至所述候选位置对应的候选实体的词性与预设词性匹配。4.根据权利要求3所述的方法,其特征在于,所述从所述依存关系中确定目...
【专利技术属性】
技术研发人员:韦强申,经琴,宋勇,
申请(专利权)人:亚信科技中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。