【技术实现步骤摘要】
本专利技术属于自然语言处理,尤其是涉及基于语义及关联建模进行实体及提及增强的关系抽取方法。
技术介绍
1、关系抽取的目的是检测文本中实体之间的关系实例,从而实现自然语言文本的信息结构化。先前的研究主要集中在句子级别的关系抽取任务上,旨在通过分析单个句子的语法结构,将关系实例分配给句子内的实体。然而,在实际的大规模文本资源中,实体之间的关系往往超出了单个句子的边界,延伸至多个相邻或非相邻的句子、段落,甚至整个文档。受传统方法处理长距离依赖和跨文档关系的限制,有必要将关系抽取任务从句子层面扩展到文档层面。
2、在当前的研究中,文档的上下文信息和结构信息被证明可以促进文档级关系抽取的推理。为了从文档中提取文档结构信息,目前的方法通常基于实体之间的关系、语法结构和文档内的语义信息对依赖关系进行建模。它们利用多层图神经网络逐步提取和集成提及层的特征细节和实体层的显著特征。有些工作也使用图结构从文档中提取文档结构信息。他们建议将全局图分成多个层次。采用组合多个子图的方法进行特征提取,进而执行文档级关系抽取任务。因此,利用图神经网络在图结
...【技术保护点】
1.基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤1中利用预训练语言模型捕获文档的深层次及整体语义特征,对文档的全局语义进行抽取的具体过程如下:
3.根据权利要求2所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤3中利用动态关系感知增强机制,对构建文档图中的节点进行处理,获得丰富语义层次的结构特征的具体过程如下:
4.根据权利要求3所述的基于语义及关联建模进行实体及提及增强的关系抽取
...【技术特征摘要】
1.基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤1中利用预训练语言模型捕获文档的深层次及整体语义特征,对文档的全局语义进行抽取的具体过程如下:
3.根据权利要求2所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤3中利用动态关系感知增强机制,对构建文档图中的节点进行处理,获得丰富语义层次的结构特征的具体过程如下:
4.根据权利要求3所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在于,步骤4中附带文档上下文特征的实体的计算表达式如下:
5.根据权利要求4所述的基于语义及关联建模进行实体及提及增强的关系抽取方法,其特征在...
【专利技术属性】
技术研发人员:陈攀峰,陈国军,王崎,肖源源,余佩嘉,吴雪,刘阳,
申请(专利权)人:贵州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。