【技术实现步骤摘要】
本专利技术涉及自然语言处理,具体涉及一种基于原型网络的嵌套命名实体识别方法和装置。
技术介绍
1、命名实体识别(ner,named entity recognition),也称为实体识别、实体分块和实体提取,是信息提取的一个子任务,目的是识别文本中的命名实体并将其归纳到预先定义的实体类型中,如人员、组织、位置、时间表达式、数量、货币值、百分比等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等众多自然语言处理(nlp,natural languageprocessing)任务的重要基础。
2、传统的命名实体识别技术仅支持非嵌套、少类别命名实体的识别,无法支持实际应用过程中类型多、长度长且存在嵌套关系的实体识别,越来越多的学者开始投入到嵌套命名实体识别技术研究。嵌套命名实体识别技术是命名实体识别技术的一种,旨在面向实际应用需求实现多类型、嵌套命名实体的识别。当前嵌套命名实体识别方法主要分为:基于序列标注的方法、基于span的方法、基于超图的方法等,但当前方法在识别精度和类别数量上仍有一定的局限性。
3、如ta
...【技术保护点】
1.一种基于原型网络的嵌套命名实体识别方法,其特征在于,包括:
2.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤2中,所述构建标签为:
3.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤3中,所述对原型网络进行优化为:原型参数映射网络计算所述全连接网络输出的所有隐含特征hi与所有原型的距离,通过损失函数计算原型网络的损失函数值,根据损失函数值优化原型网络;
4.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤5所述标签解析方式为:
5.如权利要求1所
...【技术特征摘要】
1.一种基于原型网络的嵌套命名实体识别方法,其特征在于,包括:
2.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤2中,所述构建标签为:
3.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤3中,所述对原型网络进行优化为:原型参数映射网络计算所述全连接网络输出的所有隐含特征hi与所有原型的距离,通过损失函数计算原型网络的损失函数值,根据损失函数值优化原型网络;
4.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,步骤5所述标签解析方式为:
5.如权利要求1所述的基于原型网络的嵌套命名实体识别方法,其特征在于,所述全连接网络由bi-lstm网络和全连接层组成。
6...
【专利技术属性】
技术研发人员:张可,刘忠麟,顾平莉,杨晨,殷敏,陆琴,
申请(专利权)人:中国电子科技集团公司第十五研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。