【技术实现步骤摘要】
本申请涉及实体识别,尤其涉及一种基于轻量化预训练模型的实体识别方法和装置。
技术介绍
1、由于深度神经网络模型具备自动特征学习、上下文建模、大规模数据训练、端到端学习以及可扩展性和灵活性等优势,深度神经网络模型被广泛应用于命名实体识别任务。深度神经网络模型的强大性能离不开海量训练数据集的支持。由于标注数据需要耗费大量的人力和时间成本, 所以大规模的标注数据集往往难以获取。现有的实体识别方法中,无论是基于深度学习的主流命名实体识别方法,还是基于统计学习的传统命名实体识别方法, 使用少量标注数据集训练深度神经网络模型都会造成模型过拟合, 进而导致命名实体识别效果不佳。因此,如何在标注数据十分有限的情况下保证模型的识别效果,成为了一个重要的挑战。
2、现有的方法为了解决标注数据十分有限的问题,第一种通过使用数据增强的方法从扩充数据集规模的角度,将小样本命名实体识别任务转化成一般命名实体识别任务,使用同义词替换、机器翻译以及添加微弱噪声等方法对已有的小样本数据集进行改动以产生新数据, 从而达到扩充训练集的目的; 另一种通过一些轻量级
...【技术保护点】
1.一种基于轻量化预训练模型的实体识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述轻量化预训练模型生成分别与所述待识别文本和所述第一文本集对应的多个特征图谱,包括:
3.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型融合所述多个特征图谱,生成所述待识别文本的实体识别结果,包括:
4.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型包括BERT模型、轻量级NER模块和合作学习模块;
5.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型的训练过程包括
6....
【技术特征摘要】
1.一种基于轻量化预训练模型的实体识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述轻量化预训练模型生成分别与所述待识别文本和所述第一文本集对应的多个特征图谱,包括:
3.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型融合所述多个特征图谱,生成所述待识别文本的实体识别结果,包括:
4.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型包括bert模型、轻量级ner模块和合作学习模块;
5.根据权利要求1所述的方法,其特征在于,所述轻量化预训练模型的训练过程包括:
6.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。