基于多头双仿射模型与注意力机制的嵌套命名实体识别方法技术

技术编号:42383051 阅读:20 留言:0更新日期:2024-08-16 16:11
本发明专利技术涉及一种基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,属于计算机技术中的自然语言处理领域。本发明专利技术针对文本信息中的嵌套命名实体,经过BERT模块获取词向量、BiLSTM模块获取文本编码、多头双仿射模块提取实体信息并构造Span矩阵和CNN嵌套实体信息识别模块提取嵌套的实体。本发明专利技术提供的基于多头双仿射模型与注意力机制的嵌套命名实体识别方法相比于传统基于分层、基于规则和基于区域等方法,在通用命名实体和特定域命名实体都能够实现更精确的嵌套命名实体识别。本发明专利技术能够显著提高对文本信息中嵌套命名实体的识别效率和精度。

【技术实现步骤摘要】

本专利技术涉及一种基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,属于计算机技术中的自然语言处理领域。


技术介绍

1、命名实体识别(named entity recognition,ner):

2、这是自然语言处理(nlp)中的一个任务,旨在从文本中识别和分类命名实体,如人名、地名、组织机构名等。ner是信息抽取的一部分,有助于理解文本中的实体信息。

3、本专利技术的
技术介绍
有以下几种:

4、嵌套命名实体(nested named entity):

5、有时,文本中的命名实体不仅仅是简单的实体,而可能包含其他实体的嵌套,如"欢迎来到北京工商大学"这句话中的"北京工商大学"是一个实体,而"北京"是这个实体的一个嵌套实体。嵌套命名实体识别任务是识别和分析这种复杂的实体结构。

6、基于分层的方法:

7、基于分层的方法是嵌套ner的直观解决方案,根据嵌套名称标识中结构的层次性质,这些模型通常包含多个层(或级别),每一层都用于标识一组命名实体,这些实体可以是特定级别的实体,也可以是具有特定本文档来自技高网...

【技术保护点】

1.基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述基于多头双仿射模型与注意力机制的嵌套命名实体识别方法包括:

2.根据权利要求1所述的基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述步骤1包括以下步骤:

3.根据权利要求1所述的基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述步骤2包括以下步骤:

4.根据权利要求1所述的基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述步骤3包括以下步骤:

5.根据权利要求1所述的基于多头双仿射模型与注意力机制的嵌套命名...

【技术特征摘要】

1.基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述基于多头双仿射模型与注意力机制的嵌套命名实体识别方法包括:

2.根据权利要求1所述的基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述步骤1包括以下步骤:

3.根据权利要求1所述的基于多头双仿射模型与注意力机制的嵌套命名实体识别方法,其特征在于,所述步骤2包括以下步骤...

【专利技术属性】
技术研发人员:黎巎潘禹含
申请(专利权)人:北京工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1