基于多任务负采样的跨领域实体链接方法、装置及介质制造方法及图纸

技术编号：38685869 阅读：9 留言：0更新日期：2023-09-02 22:58

发明专利技术公开了基于多任务负采样的跨领域实体链接方法、装置及介质，该跨领域实体链接方法分为辅助任务阶段、建立多任务学习模型阶段和训练多任务学习模型参数阶段，辅助任务阶段选择实体类型预测作为辅助任务，并生成多任务学习阶段辅助任务所需的标签；多任务学习模型的主体框架分为锚定点采样模块、底层全局共享模块和高层局部共享模块。本发明专利技术利用多任务学习和负采样方式，将在训练领域所获得的鉴别实体的能力迁移到不同的测试领域上，从而得到跨领域实体链接的最佳泛化性能。领域实体链接的最佳泛化性能。领域实体链接的最佳泛化性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于多任务负采样的跨领域实体链接方法、装置及介质

[0001]本专利技术涉及自然语言处理和知识图谱中实体链接领域，尤其涉及基于多任务学习和负采样策略的跨领域实体链接方法、装置及介质。

技术介绍

[0002]实体链接旨在将模糊的实体提及链接到已经构建好的知识库中的相关实体，这种将粗略描述的实体提及对齐到知识库中精确描述的实体本身的能力是许多自然语言处理任务，如知识问答、信息抽取、文本分析等重要基础。为了使这种能力更加贴近真实场景中数据多源异构的特点，更有挑战性地跨领域实体链接任务被提出，它在多个训练领域利用实体提及对进行训练，鉴别真实实体，并在多个完全不同的测试领域测试实体链接的领域泛化性能和鉴别实体的能力。
[0003]目前，现有的跨领域实体链接方法注重多任务学习互补能力和负采样带来的鉴别真实实体的能力，但它们面临着诸多挑战：1）多任务学习互补表示中，往往存在多任务融合交互不足的问题；2）负采样方法针对鉴别真实实体的能力进行了改良，但同时引入了许多无关数据，从而带来了巨大的计算开销。因此，现有技术难以取得令人满意的效果。
[0004]针对现有技术中存在的上述问题，本专利技术结合多任务学习和负采样方法的特点，设计了一种基于多任务学习和锚定点采样方法的跨领域实体链接框架，并在广泛使用的跨领域实体链接数据集上进行了大量实验，在客观评价指标上取得了更好的效果，超过以前的最优模型。

技术实现思路

[0005]本专利技术是为了解决上述现有技术存在的不足之处，提出一种基于多任务负采样的跨领域实体链接...

【技术保护点】

【技术特征摘要】
1.一种基于多任务负采样的跨领域实体链接方法，其特征是，该跨领域实体链接方法分为辅助任务阶段、建立多任务学习模型阶段和训练多任务学习模型参数阶段，所述辅助任务阶段选择实体类型预测作为辅助任务，并生成多任务学习阶段辅助任务所需的标签；所述多任务学习模型的主体框架分为锚定点采样模块、底层全局共享模块和高层局部共享模块，锚定点采样模块对训练数据进行锚定点采样，随机选择实体类型相同的实体提及对，并将实体类型与该实体提及对进行绑定，得到锚定点集合后以锚定点集合为单位作为训练数据，送入底层全局共享模块进行训练；所述底层全局共享模块利用文本编码器获取实体和实体提及的文本表征，并将获得的文本表征进行聚合，以分别获得实体和实体提及在底层融合交互的全局特征；高层局部共享模块利用底层全局共享模块输出的实体和实体提及的文本表征，生成更细粒度且深层次、用于不同程度任务交互共享的文本表征；所述训练多任务学习模型参数阶段采用辅助任务的训练数据训练类型预测模型，生成多任务的标签，并利用训练配对完成的实体和实体提及训练多任务学习模型中的参数。2.根据权利要求1所述的基于多任务负采样的跨领域实体链接方法，其特征是，具体包括以下步骤：S1、在辅助任务阶段中，对输入的实体类型预测的文本数据进行预处理，将实体提及和实体上下文拼接后作为辅助任务训练的输入，训练实体类型预测模型，训练后将实体链接的数据输入，生成对应的实体类型作为后续多任务学习中实体类型预测任务的标签；S2、在建立多任务学习模型阶段中，以实体链接为主任务和实体类型预测任务作为辅助任务进行多任务学习，依次分为以下步骤：（1）锚定点采样模块在训练数据进行多任务学习前，选取一个先验条件作为标准，将相同条件下的实体划分为一类，然后对于原本的训练数据中实体提及对，根据选取的先验条件随机地选择对应集合中的实体提及对作为负样本对，并且将负样本对与原实体提及对进行静态绑定，得到最终的数据形式作为底层全局共享模块的输入；（2）底层全局共享模块将给定的一个实体和实体提及对利用预训练模型中的多层文本编码器对文本描述进行多粒度、多层次编码，通过注意力机制分别得到融合不同任务的文本全局特征，文本全局特征再融合多个任务对于全局共享和任务特有信息的偏好，同时作为高层局部共享模块的输入；（3）高层局部共享模块利用多个细粒度信息提取器对实体和实体提及的底层特征进行深层次提取，获得不同程度共享和特有的多任务融合交互特征，然后利用任务特性将底层全局共享模块输出的文本全局特征送入每个任务的门控网络，从而获取不同任务对不同程度共享和私有的偏好，实现底层与高层次的深度融合交互，最后将偏好与对应的细粒度信息提取器所获得的表征进行聚合，获得高层的细粒度任务共享交互表征；S3、在训练多任务学习模型参数阶段中，多任务学习模型的训练利用交叉熵损失训练实体链接任务、二分类交叉熵损失训练实体类型预测任务，并使用随机梯度下降算法以更新模型参数。3.根据权利要求2所述的基于多任务负采样的跨领域实体链接方法，其特征是，所述步骤S1中，将一个实体提及和相应的上下文信息拼接后送入预训练的编码器，编码器选择预训练模型BERT和软提示，经过分类器后再与标签计算损失，得到训练完成的类型生成模型，将实体链接数据中的实体送入，得到所有实体的类型标签。
4.根据权利要求3所述的基于多任务负采样的跨领域实体链接方法...

【专利技术属性】
技术研发人员：徐童，陈恩红，陈超，吴世伟，许德容，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人