一种基于话题增强的图神经网络事件综述文本生成方法技术

技术编号:42885657 阅读:22 留言:0更新日期:2024-09-30 15:07
本发明专利技术涉及一种基于话题增强的图神经网络事件综述文本生成方法,属于计算机自然语言理解技术领域。首先,利用大语言预训练模型从目标事件文本与引用事件文本中抽取关键话题。然后,利用关键话题筛选机制对事件文本表征进行过滤。围绕关键话题构建层次图结构,让目标事件文本与引用事件文本进行深度交互,获取丰富语义的结点表征。最后,用关键话题增强的解码器实现综述文本的生成。本方法引入关键话题这一概念,将关键话题作为索引来构建层次结构图来将目标事件文本与引用事件文本连接起来,可以帮助挖掘多篇事件文本之间的丰富的语义逻辑关系。本方法能够提高抽取关键词的质量,提升综述文本内容的层次性。

【技术实现步骤摘要】

本专利技术涉及一种基于话题增强的图神经网络事件综述文本生成方法,属于计算机自然语言理解。


技术介绍

1、了解一个事件的来龙去脉,需要针对与该事件相关的历史信息进行深入的分析,来帮助厘清事件的前因后果。事件综述文本自动生成,可以看作科学论文综述自动生成的变体,需要在当前领域内搜集与目标事件文本相关的其他引用事件文本信息,并基于相关文本内容进行综合分析,最后整合并厘清识别出的核心信息,形成综述文本部分。综述文本的书写,需要针对相关文本在其公共讨论话题点上进行比较与分析,因此,需要着重捕捉给定相关文本之间可能存在的复杂关系。但是,现有的综述文本生成方法,并未实现对给定文本信息的精细建模。

2、目前,有研究人员提出了一些综述文本自动生成的方法。例如,在抽取式综述生成方面,hoang等人首先手工构建目标文本与被引用文本的主题层级树,在此基础上来从所有给定的文本中抽取相关的句子作为输出。但是,其所依赖的主题层级树需要依靠人工提前进行构建,耗时耗力,无法在大规模数据集上进行复用。此外,还有一些生成式综述生成方法,如ge等人引入外部引用网络图并使用gat进行编本文档来自技高网...

【技术保护点】

1.一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于:

2.如权利要求1所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,步骤1中,给定关键词抽取任务的具体描述以及目标事件文本与引用事件文本信息,从大语言预训练模型中抽取关键词,作为这些事件文本共同讨论的关键话题。

3.如权利要求1所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,步骤2中,首先获取每个单词的词嵌入;

4.如权利要求3所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,利用BERT模型来获取每个单词的词嵌入。

5...

【技术特征摘要】

1.一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于:

2.如权利要求1所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,步骤1中,给定关键词抽取任务的具体描述以及目标事件文本与引用事件文本信息,从大语言预训练模型中抽取关键词,作为这些事件文本共同讨论的关键话题。

3.如权利要求1所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,步骤2中,首先获取每个单词的词嵌入;

4.如权利要求3所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,利用bert模型来获取每个单词的词嵌入。

5.如权利要求3所述的一种基于话题增强的图神经网络事件综述文本生成方法,其特征在于,采用均值池化的方式来获得每篇...

【专利技术属性】
技术研发人员:施重阳余路遥
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1