当前位置: 首页 > 专利查询>贵州大学专利>正文

基于语义及关联建模进行实体及提及增强的关系抽取方法技术

技术编号:42585596 阅读:24 留言:0更新日期:2024-09-03 18:02
本发明专利技术公开了基于语义及关联建模进行实体及提及增强的关系抽取方法,属于自然语言处理技术领域,包括:步骤1、利用预训练语言模型捕获文档的深层次及整体语义特征,对文档的全局语义进行抽取;步骤2、对已获取的全局语义特征进行细化;步骤3、利用动态关系感知增强机制,对构建文档图中的节点进行处理,获得丰富语义层次的结构特征;步骤4、将结构特征融入实体、提及中,生成四类对象;步骤5、将四类对象分别输入到多尺度特征增强模块中进行整合处理,生成实体对及提及对;步骤6、将步骤5生成的实体对及提及对分别输入实体对及提及对增强模块进行深度特征提取与增强;步骤7、采用前馈神经网络计算每一个实体对所属的关系类型的概率。

【技术实现步骤摘要】

本专利技术属于自然语言处理,尤其是涉及基于语义及关联建模进行实体及提及增强的关系抽取方法


技术介绍

1、关系抽取的目的是检测文本中实体之间的关系实例,从而实现自然语言文本的信息结构化。先前的研究主要集中在句子级别的关系抽取任务上,旨在通过分析单个句子的语法结构,将关系实例分配给句子内的实体。然而,在实际的大规模文本资源中,实体之间的关系往往超出了单个句子的边界,延伸至多个相邻或非相邻的句子、段落,甚至整个文档。受传统方法处理长距离依赖和跨文档关系的限制,有必要将关系抽取任务从句子层面扩展到文档层面。

2、在当前的研究中,文档的上下文信息和结构信息被证明可以促进文档级关系抽取的推理。为了从文档中提取文档结构信息,目前的方法通常基于实体之间的关系、语法结构和文档内的语义信息对依赖关系进行建模。它们利用多层图神经网络逐步提取和集成提及层的特征细节和实体层的显著特征。有些工作也使用图结构从文档中提取文档结构信息。他们建议将全局图分成多个层次。采用组合多个子图的方法进行特征提取,进而执行文档级关系抽取任务。因此,利用图神经网络在图结构内聚合特征已成为实本文档来自技高网...

【技术保护点】

1.基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤1中利用预训练语言模型捕获文档的深层次及整体语义特征,对文档的全局语义进行抽取的具体过程如下:

3.根据权利要求2所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤3中利用动态关系感知增强机制,对构建文档图中的节点进行处理,获得丰富语义层次的结构特征的具体过程如下:

4.根据权利要求3所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步...

【技术特征摘要】

1.基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤1中利用预训练语言模型捕获文档的深层次及整体语义特征,对文档的全局语义进行抽取的具体过程如下:

3.根据权利要求2所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤3中利用动态关系感知增强机制,对构建文档图中的节点进行处理,获得丰富语义层次的结构特征的具体过程如下:

4.根据权利要求3所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤4中附带文档上下文特征的实体的计算表达式如下:

5.根据权利要求4所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在...

【专利技术属性】
技术研发人员:陈攀峰陈国军王崎肖源源余佩嘉吴雪刘阳
申请(专利权)人:贵州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1