一种基于轻量化预训练模型的实体识别方法和装置制造方法及图纸

技术编号:40967758 阅读:42 留言:0更新日期:2024-04-18 20:48
本申请提供一种基于轻量化预训练模型的实体识别方法和装置,包括:获取待识别文本;基于搜索引擎检索所述待识别文本的第一文本集;基于所述轻量化预训练模型生成分别与所述待识别文本和所述第一文本集对应的多个特征图谱,一个特征图谱与一个文本对应,所述多个特征图谱的表征方式相同;所述轻量化预训练模型融合所述多个特征图谱,生成所述待识别文本的实体识别结果;其中,所述轻量化预训练模型采用继承生成式预训练BERT的模型结构,并基于所述待识别文本的同领域样本调整模型的参数和权重的训练方式。本申请提供的基于轻量化预训练模型的实体识别方法和装置,可以实现在标注数据十分有限的情况下的命名实体识别任务。

【技术实现步骤摘要】

本申请涉及实体识别,尤其涉及一种基于轻量化预训练模型的实体识别方法和装置


技术介绍

1、由于深度神经网络模型具备自动特征学习、上下文建模、大规模数据训练、端到端学习以及可扩展性和灵活性等优势,深度神经网络模型被广泛应用于命名实体识别任务。深度神经网络模型的强大性能离不开海量训练数据集的支持。由于标注数据需要耗费大量的人力和时间成本, 所以大规模的标注数据集往往难以获取。现有的实体识别方法中,无论是基于深度学习的主流命名实体识别方法,还是基于统计学习的传统命名实体识别方法, 使用少量标注数据集训练深度神经网络模型都会造成模型过拟合, 进而导致命名实体识别效果不佳。因此,如何在标注数据十分有限的情况下保证模型的识别效果,成为了一个重要的挑战。

2、现有的方法为了解决标注数据十分有限的问题,第一种通过使用数据增强的方法从扩充数据集规模的角度,将小样本命名实体识别任务转化成一般命名实体识别任务,使用同义词替换、机器翻译以及添加微弱噪声等方法对已有的小样本数据集进行改动以产生新数据, 从而达到扩充训练集的目的; 另一种通过一些轻量级的模型结构来实现命名本文档来自技高网...

【技术保护点】

1.一种基于轻量化预训练模型的实体识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述轻量化预训练模型生成分别与所述待识别文本和所述第一文本集对应的多个特征图谱,包括:

3.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型融合所述多个特征图谱,生成所述待识别文本的实体识别结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型包括BERT模型、轻量级NER模块和合作学习模块;

5.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型的训练过程包括

6....

【技术特征摘要】

1.一种基于轻量化预训练模型的实体识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述轻量化预训练模型生成分别与所述待识别文本和所述第一文本集对应的多个特征图谱,包括:

3.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型融合所述多个特征图谱,生成所述待识别文本的实体识别结果,包括:

4.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型包括bert模型、轻量级ner模块和合作学习模块;

5.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型的训练过程包括:

6.根...

【专利技术属性】
技术研发人员:穆彤晖李壮举
申请(专利权)人:北京建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1