【技术实现步骤摘要】
本专利技术属于人工智能的自然语言处理,尤其涉及一种基于知识蒸馏与变分自编码器的命名实体识别方法。
技术介绍
1、命名实体识别(ner)是自然语言处理中的一项基础任务,旨在从文本中识别出具有特定意义的实体,如人名、地点名、组织名等。尽管在标准数据集上已有多种ner方法取得了令人印象深刻的性能,但在实际的数据上,这些方法可能会受到各种挑战的影响。
2、表面相关又称为捷径学习。其原因是当前训练模型的标准方法是在包含各种类型的人为因素和偏见的数据集上训练。这表明,模型学会依赖数据集的人为因素和偏见,并捕捉某些类标签的伪相关特征作为预测的捷径。命名实体识别作为一项自然语言理解任务也不例外,其模型中普遍存在依赖表面相关特征对实体类型做出判断。具体表现为ner模型过于依赖领域内的实体模式而非上下文推理,特别是名称规律性偏见以及上下文覆盖。当前缓解命名实体识别学习表面相关的非鲁棒性特征的方法有两个方面,一是从数据集入手,例如构建更加健壮的数据集;二是对抗学习,例如将可学习的噪声向量添加到命名实体单词中。然而,模型依旧是受到数据集的很大影响,
...【技术保护点】
1.一种基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
3.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
4.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
5.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
6.根据权利要求5所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
...
【技术特征摘要】
1.一种基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
3.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
4.根据权利要求1所述的基于知识蒸馏与变分自编码器的命名实体识别方法,其特征在于,
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。