当前位置: 首页 > 专利查询>东北大学专利>正文

一种可用于小样本场景的命名实体识别方法技术

技术编号:41534257 阅读:21 留言:0更新日期:2024-06-03 23:11
本发明专利技术公开一种可用于小样本场景的命名实体识别方法,涉及自然语言处理中的命名实体识别技术领域。本发明专利技术中包括一种新的编码二维坐标表的方法,在二维坐标表中对每个坐标对应的Span段同时对其是否为某一实体的任一边界和是否为某一实体的左右边界进行标注,每个训练样例可以产生更多有效的训练对,可以有效缓解训练样例信息利用不充分问题,此编码还可以通过解码输出的标注结果方式处理命名实体嵌套及不连续问题,此外,使用了一种单双边界交叉注意力模块,有助于模型识别效果,为了缓解小样本样例不足、训练困难的问题,本发明专利技术进一步利用不同任务中对应的不同命名实体类型作为提示词,增加训练的信息,降低任务的难度。

【技术实现步骤摘要】

本专利技术涉及自然语言处理中的命名实体识别,尤其涉及一种可用于小样本场景的命名实体识别方法


技术介绍

1、命名实体识别(named entity recognition,简称ner)问题是一类经典的自然语言处理任务,该任务要求抽取出句子中含有提前定义好的类型的实体,对于同样的输入句子,会因为需求实体类型不同而输出不同,是一类语境性很强的任务。在传统的ner任务中,使用大量的标注进行训练的端到端的dnn(deep-learningneural network,深度神经网络,简称dnn)直接由句子输出实体span(文段跨度)及类型的方法已经可以取得很好的效果并广泛的应用在各类场景中。然而,大量的标注数据需要大量的人力成本,并且在某些特殊领域中,可供标注的数据量本身就不多,这个时候传统的dnn方法因为标注数据量的不足很难处理此类问题,小样本的ner任务因此诞生了。

2、论文《decomposed meta-learning for few-shot named entity recognition》(发表于acl(findings)2022:158本文档来自技高网...

【技术保护点】

1.一种可用于小样本场景的命名实体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤1中所述标注数据集中包括若干个带标注的文本数据,所述标注包括文本数据中命名实体的所在范围的数字对和命名实体类型;所述文本数据的类型为字符串类型。

3.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤1具体包括:

4.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤2具体包括:

5.根据权利要求1所述的一种可用于小样本场景的命名实体识别方...

【技术特征摘要】

1.一种可用于小样本场景的命名实体识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤1中所述标注数据集中包括若干个带标注的文本数据,所述标注包括文本数据中命名实体的所在范围的数字对和命名实体类型;所述文本数据的类型为字符串类型。

3.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤1具体包括:

4.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤2具体包括:

5.根据权利要求1所述的一种可用于小样本场景的命名实体识别方法,其特征在于,步骤3中所述小样本命名实体识别模型包括第一阶段文本分类神经网络和...

【专利技术属性】
技术研发人员:任飞亮蒋勇常宇莹
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1