文本生成方法、装置、设备及介质制造方法及图纸

技术编号:33469481 阅读:9 留言:0更新日期:2022-05-19 00:47
本申请涉及人工智能技术领域,具体公开了一种文本生成方法、装置、设备及介质,所述文本生成方法通过获取主题词汇,并获取预先构建的知识图谱;计算主题词汇以及图谱节点之间的匹配度,以根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图;根据知识子图,得到关键词集合以及关键词集合中每个关键词针对知识子图的路径特征;将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本。以通过知识图谱以及主题词汇进行词汇扩充,以得到足够数量的关键词,进而将关键词输入文本生成模型,以得到内容更加丰富的目标文本,实现了根据极少的词汇信息即可自动生成内容丰富的文本信息。的文本信息。的文本信息。

【技术实现步骤摘要】
文本生成方法、装置、设备及介质


[0001]本申请涉及人工智能
,具体而言,涉及一种文本生成方法、装置、设备及介质。

技术介绍

[0002]近年来,随着互联网技术的不断发展,文本生成已广泛运用于各行各业,包括新闻的自动生成、商品介绍的自动生成等。但是在文本生成任务中,由于生成任务的输入数据信息较少,使得生成的文本的信息内容不足,生成效果较差。
[0003]因此,如何生成内容丰富的文本,是本领域技术人员需要关注的重点。

技术实现思路

[0004]为解决上述技术问题,本申请的实施例提供了一种文本生成方法、装置、设备及介质,以生成内容丰富的文本。
[0005]第一方面,本申请提供一种文本生成方法,包括:获取主题词汇,并获取预先构建的知识图谱;其中,知识图谱包括多个图谱节点;计算主题词汇以及图谱节点之间的匹配度,以根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图;根据知识子图,得到关键词集合以及关键词集合中每个关键词针对知识子图的路径特征;将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本。
[0006]根据本专利技术优选实施例,根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图,包括:将匹配度大于匹配度阈值的图谱节点作为目标节点,得到目标节点集合;根据知识图谱获取与目标节点相邻的图谱节点,将相邻的图谱节点添加至目标节点集合,直至目标节点集合中目标节点的数量达到预设节点数量;根据目标节点集合中的目标节点以及目标节点之间的关系,得到知识子图。
[0007]根据本专利技术优选实施例,根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图,包括:将匹配度大于匹配度阈值的图谱节点作为起始节点,根据起始节点向知识图谱中的其它图谱节点进行随机游走;将随机游走中遍历的图谱节点作为目标节点,直至目标节点的数量达到预设节点数量,得到目标节点集合;根据目标节点集合中的目标节点以及目标节点之间的关系,得到知识子图。
[0008]根据本专利技术优选实施例,文本生成模型是基于自注意力机制的编码解码模型训练得到的,将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本,包括:对关键词集合中的关键词进行编码处理,得到关键词对应的词向量;对关键词对应的词向量以及关键词针对知识子图的路径特征进行融合,得到每个关键词对应的特征向量;通过自注意力机制对特征向量进行处理,得到目标文本。
[0009]根据本专利技术优选实施例,通过自注意力机制对特征向量进行处理,得到目标文本,
包括:根据每个关键词对应的特征向量和当前时间步的输出隐向量,确定每个关键词在当前时间步对应的注意力权值;根据每个关键词在当前时间步对应的注意力权值、当前时间步的输出隐向量和当前时间步的输入向量,确定当前时间步对应的文本词汇;遍历所有时间步,根据每个时间步输出的文本词汇得到目标文本。
[0010]根据本专利技术优选实施例,获取预先构建的知识图谱,包括:对主题词汇进行分类,得到主题词汇对应的分类结果;获取与分类结果匹配的知识图谱。
[0011]根据本专利技术优选实施例,方法还包括:获取目标文本中每个字符的字向量以及文本向量;其中,字向量用于表示字符的标识信息,文本向量用于表示字符在目标文本中的语义信息;对每个字符的字向量以及文本向量进行融合,得到每个字符对应的融合向量;将每个字符对应的融合向量输入预先训练的文本评价网络,通过文本评价网络对每个字符对应的融合向量进行处理,得到目标文本对应的文本质量评价信息。
[0012]第二方面,本申请提供一种文本生成装置,包括:获取模块,用于获取主题词汇,并获取预先构建的知识图谱;其中,知识图谱包括多个图谱节点;知识子图计算模块,用于计算主题词汇以及图谱节点之间的匹配度,以根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图;关键词及特征获取模块,用于根据知识子图,得到关键词集合以及关键词集合中每个关键词针对知识子图的路径特征;文本生成模块,用于将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本。
[0013]第三方面,本申请提供一种计算机设备,计算机设备包括存储器和处理器;存储器,用于存储计算机程序;处理器,用于执行的计算机程序并在执行的计算机程序时实现上述文本生成方法的步骤。
[0014]第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时使处理器实现上述文本生成方法的步骤。
[0015]本申请实施例公开的文本生成方法、装置、设备及介质,通过获取主题词汇,并获取预先构建的知识图谱;其中,知识图谱包括多个图谱节点;计算主题词汇以及图谱节点之间的匹配度,以根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图;根据知识子图,得到关键词集合以及关键词集合中每个关键词针对知识子图的路径特征;将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本。以通过知识图谱以及主题词汇进行词汇扩充,以得到足够数量的关键词,进而将关键词输入文本生成模型,以得到内容更加丰富的目标文本,实现了根据极少的词汇信息即可自动生成内容丰富的文本信息。
附图说明
[0016]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0017]图1是本申请实施例提供的文本生成方法的应用环境示意图;
[0018]图2是本申请实施例提供的文本生成方法的流程图;
[0019]图3是本申请实施例提供的知识图谱的示意图;
[0020]图4是本申请另一实施例提供的知识图谱的示意图;
[0021]图5是本申请实施例提供的文本生成方法的数据流程示意图;
[0022]图6是本申请实施例提供的文本生成装置的示意性框图;
[0023]图7是本申请实施例提供的计算机设备的示意性框图。
具体实施方式
[0024]这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0025]附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0026]附图中所示的流程图仅是示例性说明,不是必须本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法,其特征在于,所述方法包括:获取主题词汇,并获取预先构建的知识图谱;其中,所述知识图谱包括多个图谱节点;计算所述主题词汇以及所述图谱节点之间的匹配度,以根据所述匹配度大于匹配度阈值的图谱节点得到至少一个知识子图;根据所述知识子图,得到关键词集合以及所述关键词集合中每个关键词针对所述知识子图的路径特征;将所述关键词集合以及所述关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本。2.根据权利要求1所述的方法,其特征在于,所述根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图,包括:将所述匹配度大于匹配度阈值的图谱节点作为目标节点,得到目标节点集合;根据所述知识图谱获取与所述目标节点相邻的图谱节点,将所述相邻的图谱节点添加至所述目标节点集合,直至所述目标节点集合中目标节点的数量达到预设节点数量;根据所述目标节点集合中的目标节点以及所述目标节点之间的关系,得到所述知识子图。3.根据权利要求1所述的方法,其特征在于,所述根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图,包括:将所述匹配度大于匹配度阈值的图谱节点作为起始节点,根据所述起始节点向所述知识图谱中的其它图谱节点进行随机游走;将所述随机游走中遍历的图谱节点作为目标节点,直至所述目标节点的数量达到预设节点数量,得到目标节点集合;根据所述目标节点集合中的目标节点以及所述目标节点之间的关系,得到所述知识子图。4.根据权利要求1所述的方法,其特征在于,所述文本生成模型是基于自注意力机制的编码解码模型训练得到的,所述将所述关键词集合以及所述关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中,得到目标文本,包括:对所述关键词集合中的关键词进行编码处理,得到所述关键词对应的词向量;对所述关键词对应的词向量以及所述关键词针对知识子图的路径特征进行融合,得到每个关键词对应的特征向量;通过自注意力机制对所述特征向量进行处理,得到目标文本。5.根据权利要求4所述的方法,其特征在于,所述通过自注意力机制对所述特征向量进行处理,得到目标文本,包括:根据所述每个关键词对应的特...

【专利技术属性】
技术研发人员:孙梓淇张智
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1