一种基于原型网络的嵌套命名实体识别方法和装置制造方法及图纸

技术编号:42106964 阅读:21 留言:0更新日期:2024-07-25 00:30
本发明专利技术提供了一种基于原型网络的嵌套命名实体识别方法和装置,属于自然语言处理技术领域。本发明专利技术方法采用原型网络作为识别结构;构建训练样本时,根据训练文本序列中每个字符在已知实体中的位置和实体类型,构成标签;一个字符可能对应多个标签,形成理想标签组,组成训练样本,对原型网络进行训练;进行识别时,将待识别文本序列输入原型网络,生成每个字符对应的标签组;待识别文本所有字符的标签组组成标签序列,最后对标签序列进行标签解析,识别出实体。使用本发明专利技术能够能够有效支撑多类别嵌套实体的识别。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,具体涉及一种基于原型网络的嵌套命名实体识别方法和装置


技术介绍

1、命名实体识别(ner,named entity recognition),也称为实体识别、实体分块和实体提取,是信息提取的一个子任务,目的是识别文本中的命名实体并将其归纳到预先定义的实体类型中,如人员、组织、位置、时间表达式、数量、货币值、百分比等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等众多自然语言处理(nlp,natural languageprocessing)任务的重要基础。

2、传统的命名实体识别技术仅支持非嵌套、少类别命名实体的识别,无法支持实际应用过程中类型多、长度长且存在嵌套关系的实体识别,越来越多的学者开始投入到嵌套命名实体识别技术研究。嵌套命名实体识别技术是命名实体识别技术的一种,旨在面向实际应用需求实现多类型、嵌套命名实体的识别。当前嵌套命名实体识别方法主要分为:基于序列标注的方法、基于span的方法、基于超图的方法等,但当前方法在识别精度和类别数量上仍有一定的局限性。

3、如takashi等(tak本文档来自技高网...

【技术保护点】

1.一种基于原型网络的嵌套命名实体识别方法,其特征在于,包括:

2.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤2中,所述构建标签为:

3.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤3中,所述对原型网络进行优化为:原型参数映射网络计算所述全连接网络输出的所有隐含特征hi与所有原型的距离,通过损失函数计算原型网络的损失函数值,根据损失函数值优化原型网络;

4.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤5所述标签解析方式为:

5.如权利要求1所述的基于原型网络的嵌...

【技术特征摘要】

1.一种基于原型网络的嵌套命名实体识别方法,其特征在于,包括:

2.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤2中,所述构建标签为:

3.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤3中,所述对原型网络进行优化为:原型参数映射网络计算所述全连接网络输出的所有隐含特征hi与所有原型的距离,通过损失函数计算原型网络的损失函数值,根据损失函数值优化原型网络;

4.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤5所述标签解析方式为:

5.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,所述全连接网络由bi-lstm网络和全连接层组成。

6...

【专利技术属性】
技术研发人员:张可刘忠麟顾平莉杨晨殷敏陆琴
申请(专利权)人:中国电子科技集团公司第十五研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1