实体识别方法及装置制造方法及图纸

技术编号:40317694 阅读:26 留言:0更新日期:2024-02-07 21:00
本公开涉及自然语言处理技术领域,具体提供了一种实体识别方法及装置。一种实体识别方法,包括对待识别文本进行实体识别得到待识别文本包括的实体,基于实体在待识别文本中的上下文对实体进行边界扩展得到至少两个扩展实体,基于数据库包括的词组的凝聚度确定每个扩展实体的凝聚度,根据每个扩展实体的凝聚度确定目标实体。本公开实施方式中,通过对实体结果的边界修正,从而得到更加准确的实体识别结果,而且,降低数据标注的人工开销,提高实体识别精度。

【技术实现步骤摘要】

本公开涉及自然语言处理,具体涉及一种实体识别方法及装置


技术介绍

1、命名实体识别(ner,named entity recognition)是自然语言处理中的一个基础任务,旨在从文本中识别出具有特定意义的实体,例如人名、地名、组织机构名、时间、日期等实体。

2、随着深度学习技术的发展,基于神经网络的ner方法成为主流,但是,相关技术中实体识别网络对实体边界识别的精度较低,尤其在无大量标注数据的实体识别场景中会出现实体识别不准确的问题。


技术实现思路

1、为提高实体识别精度,本公开实施方式提供了一种实体识别方法、装置、电子设备及存储介质。

2、第一方面,本公开实施方式提供了一种实体识别方法,包括:

3、对待识别文本进行实体识别,得到所述待识别文本包括的实体;

4、基于所述实体在所述待识别文本中的上下文,对所述实体进行边界扩展,得到所述实体对应的至少两个扩展实体;

5、基于数据库包括的词组的凝聚度,确定每个所述扩展实体的凝聚度,所述词组的凝聚度表示所本文档来自技高网...

【技术保护点】

1.一种实体识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述实体在所述待识别文本中的上下文,对所述实体进行边界扩展,得到所述实体对应的至少两个扩展实体,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据边界范围的边界值从所述实体的上下文中确定待扩展文本,包括:

4.根据权利要求1所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,基于数据库包括的词组的凝聚度,确定所述扩展实体的凝聚度,包括:

7.根据权利要求1所述...

【技术特征摘要】

1.一种实体识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述实体在所述待识别文本中的上下文,对所述实体进行边界扩展,得到所述实体对应的至少两个扩展实体,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据边界范围的边界值从所述实体的上下文中确定待扩展文本,包括:

4.根据权利要求1所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6....

【专利技术属性】
技术研发人员:夏志超王鑫肖冰陆全蒋宁吴海英
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1