当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于知识蒸馏与变分自编码器的命名实体识别方法技术

技术编号:42193285 阅读:21 留言:0更新日期:2024-07-30 18:42
本发明专利技术公开了一种基于知识蒸馏与变分自编码器的命名实体识别方法,属于人工智能的自然语言处理技术领域,包括以下步骤:构建有偏数据集对BERT‑large模型进行训练,获得有偏模型,作为教师模型;构建含跨域实体的数据集,结合变分自编码器对BERT‑large模型进行训练,获得学生模型;获取教师模型的输出特征,并从学生模型的变分自编码器的映射空间中解耦出鲁棒性特征和非鲁棒性特征;基于知识蒸馏将非鲁棒性特征与教师模型的输出特征进行拟合,进一步解耦出学生模型中更加鲁棒的特征,基于解耦出的鲁棒性特征进行命名实体识别。本发明专利技术实现了对命名实体识别任务中捷径学习的有效缓解,提升了命名实体识别任务的准确性。

【技术实现步骤摘要】

本专利技术属于人工智能的自然语言处理,尤其涉及一种基于知识蒸馏与变分自编码器的命名实体识别方法


技术介绍

1、命名实体识别(ner)是自然语言处理中的一项基础任务,旨在从文本中识别出具有特定意义的实体,如人名、地点名、组织名等。尽管在标准数据集上已有多种ner方法取得了令人印象深刻的性能,但在实际的数据上,这些方法可能会受到各种挑战的影响。

2、表面相关又称为捷径学习。其原因是当前训练模型的标准方法是在包含各种类型的人为因素和偏见的数据集上训练。这表明,模型学会依赖数据集的人为因素和偏见,并捕捉某些类标签的伪相关特征作为预测的捷径。命名实体识别作为一项自然语言理解任务也不例外,其模型中普遍存在依赖表面相关特征对实体类型做出判断。具体表现为ner模型过于依赖领域内的实体模式而非上下文推理,特别是名称规律性偏见以及上下文覆盖。当前缓解命名实体识别学习表面相关的非鲁棒性特征的方法有两个方面,一是从数据集入手,例如构建更加健壮的数据集;二是对抗学习,例如将可学习的噪声向量添加到命名实体单词中。然而,模型依旧是受到数据集的很大影响,依旧会学习到非鲁棒性本文档来自技高网...

【技术保护点】

1.一种基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

3.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

4.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

5.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

6.根据权利要求5所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

7.根据权利要求1所...

【技术特征摘要】

1.一种基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

3.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

4.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,

...

【专利技术属性】
技术研发人员:徐昊王小药宋瑞石立达
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1