文本生成方法、装置、设备及介质制造方法及图纸

技术编号：33469481 阅读：9 留言：0更新日期：2022-05-19 00:47

本申请涉及人工智能技术领域，具体公开了一种文本生成方法、装置、设备及介质，所述文本生成方法通过获取主题词汇，并获取预先构建的知识图谱；计算主题词汇以及图谱节点之间的匹配度，以根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图；根据知识子图，得到关键词集合以及关键词集合中每个关键词针对知识子图的路径特征；将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中，得到目标文本。以通过知识图谱以及主题词汇进行词汇扩充，以得到足够数量的关键词，进而将关键词输入文本生成模型，以得到内容更加丰富的目标文本，实现了根据极少的词汇信息即可自动生成内容丰富的文本信息。的文本信息。的文本信息。

全部详细技术资料下载

【技术实现步骤摘要】
文本生成方法、装置、设备及介质

[0001]本申请涉及人工智能
，具体而言，涉及一种文本生成方法、装置、设备及介质。

技术介绍

[0002]近年来，随着互联网技术的不断发展，文本生成已广泛运用于各行各业，包括新闻的自动生成、商品介绍的自动生成等。但是在文本生成任务中，由于生成任务的输入数据信息较少，使得生成的文本的信息内容不足，生成效果较差。
[0003]因此，如何生成内容丰富的文本，是本领域技术人员需要关注的重点。

技术实现思路

[0004]为解决上述技术问题，本申请的实施例提供了一种文本生成方法、装置、设备及介质，以生成内容丰富的文本。
[0005]第一方面，本申请提供一种文本生成方法，包括：获取主题词汇，并获取预先构建的知识图谱；其中，知识图谱包括多个图谱节点；计算主题词汇以及图谱节点之间的匹配度，以根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图；根据知识子图，得到关键词集合以及关键词集合中每个关键词针对知识子图的路径特征；将关键词集合以及关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中，得到目标文本。
[0006]根据本专利技术优选实施例，根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图，包括：将匹配度大于匹配度阈值的图谱节点作为目标节点，得到目标节点集合；根据知识图谱获取与目标节点相邻的图谱节点，将相邻的图谱节点添加至目标节点集合，直至目标节点集合中目标节点的数量达到预设节点数量；根据目标节点集合中的目标节点以及目标节点之间...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法，其特征在于，所述方法包括：获取主题词汇，并获取预先构建的知识图谱；其中，所述知识图谱包括多个图谱节点；计算所述主题词汇以及所述图谱节点之间的匹配度，以根据所述匹配度大于匹配度阈值的图谱节点得到至少一个知识子图；根据所述知识子图，得到关键词集合以及所述关键词集合中每个关键词针对所述知识子图的路径特征；将所述关键词集合以及所述关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中，得到目标文本。2.根据权利要求1所述的方法，其特征在于，所述根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图，包括：将所述匹配度大于匹配度阈值的图谱节点作为目标节点，得到目标节点集合；根据所述知识图谱获取与所述目标节点相邻的图谱节点，将所述相邻的图谱节点添加至所述目标节点集合，直至所述目标节点集合中目标节点的数量达到预设节点数量；根据所述目标节点集合中的目标节点以及所述目标节点之间的关系，得到所述知识子图。3.根据权利要求1所述的方法，其特征在于，所述根据匹配度大于匹配度阈值的图谱节点得到至少一个知识子图，包括：将所述匹配度大于匹配度阈值的图谱节点作为起始节点，根据所述起始节点向所述知识图谱中的其它图谱节点进行随机游走；将所述随机游走中遍历的图谱节点作为目标节点，直至所述目标节点的数量达到预设节点数量，得到目标节点集合；根据所述目标节点集合中的目标节点以及所述目标节点之间的关系，得到所述知识子图。4.根据权利要求1所述的方法，其特征在于，所述文本生成模型是基于自注意力机制的编码解码模型训练得到的，所述将所述关键词集合以及所述关键词集合中每个关键词针对知识子图的路径特征输入预先训练的文本生成模型中，得到目标文本，包括：对所述关键词集合中的关键词进行编码处理，得到所述关键词对应的词向量；对所述关键词对应的词向量以及所述关键词针对知识子图的路径特征进行融合，得到每个关键词对应的特征向量；通过自注意力机制对所述特征向量进行处理，得到目标文本。5.根据权利要求4所述的方法，其特征在于，所述通过自注意力机制对所述特征向量进行处理，得到目标文本，包括：根据所述每个关键词对应的特...

【专利技术属性】
技术研发人员：孙梓淇，张智，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人