融合关系过滤和多任务学习的全局指针网络实体关系抽取方法技术

技术编号:42461328 阅读:45 留言:0更新日期:2024-08-21 12:49
本发明专利技术公开了融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,涉及自然语言处理领域,包括:将原始文本映射到预训练语言模块的输入序列,在输入序列的开头和结尾分别进行标记,对原始文本中的句子进行特征提取获得输出词向量;基于词向量构建全局指针网络,对全局指针网络进行训练,全局指针网络用于进行实体抽取;基于词向量获得关系过滤解码模块,训练关系过滤解码模块,关系过滤解码模块用于对关系进行筛选过滤;基于全局指针网络和关系过滤解码模块构建实体与关系抽取模块,基于实体与关系抽取模块对待处理文本进行处理,实体与关系抽取结果,本发明专利技术能够解决重叠三元组问题以及嵌套实体问题,并且模型更具有全局观,实现了训练与预测目标的一致性,增强了模型的性能,减少了实体关系抽取中的冗余关系判断,针对多任务学习,本发明专利技术设计了自适应损失函数权重调整,提升模型的性能。

【技术实现步骤摘要】

本专利技术涉及自然语言处理领域,具体地,涉及融合关系过滤和多任务学习的全局指针网络实体关系抽取方法


技术介绍

1、随着互联网的快速发展和普及,信息交流方式发生了翻天覆地的变化。如何以更加智能、快速的方式获取互联网上的资源成为研究热点。针对头实体、关系和尾实体组成的三元组的准确提取,是知识图谱的构建的关键一步。实体关系抽取作为信息抽取领域的子任务,受到了国内外研究人员的广泛关注。目前基于深度学习的实体关系抽取方法主要分为流水线方法和联合抽取方法两种方式,流水线方式将实体关系抽取分为命名实体识别和关系抽取两个子任务,但其存在错误累积、忽略两个任务相关性和信息冗余等许多问题。为了解决上述问题,研究人员提出了许多实体关系同时抽取的联合抽取模型。但由于句子的复杂关系,在同一个句子中存在多个三元组共享同一个主体、客体或关系的三元组重叠现象,并且还存在一个实体内包含另一个实体的嵌套实体的现象。

2、目前,已经有许多工作针对重叠三元组和嵌套实体问题进行研究。yu等人提出的分解式策略etl-span和wei等人提出的级联二元标记框架casrel采用新颖的标注策本文档来自技高网...

【技术保护点】

1.融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,步骤4具体包括:

3.根据权利要求2所述的融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,五元组为(sh,st,r,oh,ot),五元组的打分函数为:

4.根据权利要求2所述的融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,所述步骤4还包括为实体与关系抽取模块构建损失函数,实体与关系抽取模块的损失函数为:

>5.根据权利要求1...

【技术特征摘要】

1.融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,所述方法包括:

2.根据权利要求1所述的融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,步骤4具体包括:

3.根据权利要求2所述的融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,五元组为(sh,st,r,oh,ot),五元组的打分函数为:

4.根据权利要求2所述的融合关系过滤和多任务学习的全局指针网络实体关系抽取方法,其特征在于,所述步骤4还包括为实体与关系抽取模块构建损失函数...

【专利技术属性】
技术研发人员:刘斌陶嘉琳何磊唐聃陈万源陈敏
申请(专利权)人:成都信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1