【技术实现步骤摘要】
基于网格标记和语义分割的统一中文命名实体识别方法
[0001]本专利技术涉及基于网格标记和语义分割的统一中文命名实体识别方法,属于中文命名实体识别
技术介绍
[0002]作为中文信息抽取的重要子任务,也是许多中文自然语言处理任务的前置和底层基础任务,中文命名实体识别(Chinese Named Entity Recognition,CNER)得到了广泛的研究。近年来,研究人员或通过新的标记架构或引入更多的汉字和词汇特征,使得CNER模型性能得到了显著提升,CNER任务的发展进入了一个相对成熟的阶段。命名实体识别(Named Entity Recognition,NER)三类子任务包括扁平实体识别(flatNER)、重叠实体识别(OverlappedNER)和不连续实体识别(discontinuousNER),在很多现实应用场景中,往往包含所有类型的子任务,然而,先前的相关工作大多数都是针对特定的一类CNER任务设计特定的模型,这些特定于某种子任务的模型和方法阻碍了CNER任务的发展,也不利于在现实场景中的应用,统一的CNER方法亟待解决。
[0003]最近,研究者们开始探索统一解决三类NER任务的方法。Su等人基于全局归一化的思想设计了Global Pointer模型,实现了嵌套实体和非嵌套实体的统一识别。Wang等人提出了W2NER模型,将NER任务转化为词对关系分类问题(对于CNER更准确的应该称为字符关系分类),基于网格标记方案(Grid Tagging Scheme,GTS)建模组成实体词的 ...
【技术保护点】
【技术特征摘要】
1.基于网格标记和语义分割的统一中文命名实体识别方法,其特征在于:所述方法包括:Step1、输入句子经过BERT和Bi
‑
LSTM组成的编码器模块后获得含有上下文信息的中文字符表示;Step2、通过Biaffine注意力模块和CLN获得蕴含实体边界信息和字符对间关系信息的特征矩阵,融合位置信息后获得最终的三维字符对网格表示;Step3、得到最终的三维字符对网格表示后,将其视为多通道的图像,通过U型分割模块以获得图像风格的特征矩阵中的局部和全局特征;Step4、通过最小化负对数似然损失来训练模型;Step5、经过MLP分类器和Biaffine分类器共同组成的协预测器层推理字符对间的关系,最后解码得到所有可能的实体。2.根据权利要求1所述的基于网格标记和语义分割的统一中文命名实体识别方法,其特征在于:所述Step1中,对于给定的输入句子X={x1,x2,...x
N
},将输入到预训练语言模型BERT中获得每个中文字符的上下文表示,通过Bi
‑
LSTM增强字符的上下文编码,经过编码后输入句子表示为:其中,x
i
表示句子中的第i个中文字符,d
h
表示字符表征的嵌入维度,N表示句子的长度。3.根据权利要求1所述的基于网格标记和语义分割的统一中文命名实体识别方法,其特征在于:所述Step2具体包括如下:Step2.1、首先基于CLN机制来生成相邻字符对间的关系信息Step2.2、基于Biaffine注意力机制建模实体边界信息d
h
表示字符表征的嵌入维度,N表示句子的长度;Step2.3、将以上两个步骤中的相邻字符对间的关系信息V
(pair)
和实体边界信息V
(span)
融合获得字符信息表示Step2.4、融合字符对之间的相对距离信息嵌入和区分网格中上下三角区域的区域信息嵌入获得最终的三维字符对网格表示G,其中,d
d
和d
t
分别表示相对距离信息和区域信息的嵌入维度。4.根据权利要求3所述的基于网格标记和语义分割的统一中文命名实体识别方法,其特征在于:所述Step2.2的具体步骤如下:Step2.2.1、首先通过Biaffine注意力机制捕捉输入序列中字符之间的交互关系,得到一个span分数其中,S
ij
表示字符对(x
i
,x
j
)的span分数的计算公式如下:)的span分数的计算公式如下:)的span分数的计算公式如下:其中,...
【专利技术属性】
技术研发人员:相艳,赵学东,郭军军,线岩团,
申请(专利权)人:昆明理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。