基于规划选择和图结构感知的知识图谱生成文本的方法技术

技术编号:40536743 阅读:20 留言:0更新日期:2024-03-01 13:58
本发明专利技术公开了一种基于规划选择和图结构感知的知识图谱生成文本的方法,属于自然语言生成领域,包括:构建初始样本集;以规划选择器和基准模型二者输出的BLEU趋于一致为目标,利用初始样本集训练规划选择器;对于初始样本集中各知识图谱,利用规划选择器从其对应的多个三元组线性化序列中,选择BLEU值最高的一个作为其最优线性化序列,对初始样本集中部分最优线性化序列进行替换以构建困难负样本;结合正样本、简单负样本、困难负样本、目标文本和最优线性化序列,训练编码器‑解码器模型;目标知识图谱对应的多个三元组线性化序列依次经规划选择器和编码器‑解码器模型后,输出其对应的文本。提高知识图谱生成文本内容的准确性和完整性。

【技术实现步骤摘要】

本专利技术属于自然语言生成领域,更具体地,涉及一种基于规划选择和图结构感知的知识图谱生成文本的方法


技术介绍

1、文本生成任务是自然语言处理领域一个非常重要的任务。随着生成任务的发展,传统的文本生成只依靠输入的文本信息完成内容生成,容易缺乏更丰富的上下文知识信息,因此生成的文本往往单一乏味,缺少有意思的内容。为了提高生成内容的丰富性,包含丰富先验知识信息的知识图谱经常作为文本输入的内容补充。知识图谱三元组结构非常适合计算机完成信息存储、检索和推理,但是却非常不方便人们直观地理解存储的信息。因此,知识图谱转化为文本的生成任务被提出,其目的是生成流利的自然语言文本对知识图谱内容进行精准描述,确保生成文本内容的精准、完整和无错。

2、由于预训练语言模型(如bert、bart、t5和gpt等)在越来越多的自然语言处理场景(如语言理解和文本生成领域)取得了卓越效果,因此,目前也通常利用微调预训练语言模型的方式解决知识图谱生成文本问题。但是,微调预训练语言模型面临如下问题:(1)预训练语言模型以文本序列的结构作为输入,而知识图谱的图结构缺乏三元组的序列信本文档来自技高网...

【技术保护点】

1.一种基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,包括模型训练阶段S1-S4和文本生成阶段S5:

2.如权利要求1所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,规划选择器通过在预训练语言模型后外接全连接网络后得到,所述S2具体包括:

3.如权利要求2所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,选择器损失函数为:

4.如权利要求1所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,所述S3具体包括:

5.如权利要求1所述的基于规划选择和图结构感知的知识图谱生成文...

【技术特征摘要】

1.一种基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,包括模型训练阶段s1-s4和文本生成阶段s5:

2.如权利要求1所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,规划选择器通过在预训练语言模型后外接全连接网络后得到,所述s2具体包括:

3.如权利要求2所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,选择器损失函数为:

4.如权利要求1所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,所述s3具体包括:

5.如权利要求1所述的基于规划选择和图结构感知的知识图谱生成文本的方法,其特征在于,编码器-解码器模型中执行以下处理:

6.如权利要求...

【专利技术属性】
技术研发人员:赵峰邹鸿志闫成王隆
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1