文本生成模型的训练方法、文本生成方法及相关设备技术

技术编号:26478732 阅读:26 留言:0更新日期:2020-11-25 19:22
本发明专利技术实施例涉及自然语言处理技术领域,公开了一种文本生成模型的训练方法、文本生成方法及相关设备。本发明专利技术中文本生成模型的训练方法,包括:提供输入样本和输出样本;所述输入样本包括第一文本以及所述第一文本的结构图,所述结构图用于表征所述第一文本中各文字之间的关联关系;所述输出样本为与所述第一文本具有相同结构图的第二文本;根据所述输入样本和输出样本,对预设的图神经网络进行训练,得到文本生成模型。采用本实施方式,使得训练得到的文本生成模型可以准确生成具有特定结构的文本。

【技术实现步骤摘要】
文本生成模型的训练方法、文本生成方法及相关设备
本专利技术实施例涉及自然语言处理
,特别涉及一种文本生成模型的训练方法、文本生成方法及相关设备。
技术介绍
文本生成是自然语言处理中一个重要的研究领域,具有广阔的应用前景。文本生成是通过输入信息,生成可读的文字表述,例如,对联、春联生成的方法。专利技术人发现相关技术中至少存在如下问题:目前的文本生成方法采用深度学习方式,解释性差,不能准确地生成具有特定结构的文本内容,例如,生成的对联不满足对联对仗工整的需求。
技术实现思路
本专利技术实施方式的目的在于提供一种文本生成模型的训练方法、文本生成方法及相关设备,使得训练得到的文本生成模型可以准确生成具有特定结构的文本。为解决上述技术问题,本专利技术的实施方式提供了一种文本生成模型的训练方法,包括:提供输入样本和输出样本;所述输入样本包括第一文本以及所述第一文本的结构图,所述结构图用于表征所述第一文本中各文字之间的关联关系;所述输出样本为与所述第一文本具有相同结构图的第二文本;根据所述输入样本和输出样本,对预设的本文档来自技高网...

【技术保护点】
1.一种文本生成模型的训练方法,其特征在于,包括:/n提供输入样本和输出样本;所述输入样本包括第一文本以及所述第一文本的结构图,所述结构图用于表征所述第一文本中各文字之间的关联关系;所述输出样本为与所述第一文本具有相同结构图的第二文本;/n根据所述输入样本和输出样本,对预设的图神经网络进行训练,得到文本生成模型。/n

【技术特征摘要】
1.一种文本生成模型的训练方法,其特征在于,包括:
提供输入样本和输出样本;所述输入样本包括第一文本以及所述第一文本的结构图,所述结构图用于表征所述第一文本中各文字之间的关联关系;所述输出样本为与所述第一文本具有相同结构图的第二文本;
根据所述输入样本和输出样本,对预设的图神经网络进行训练,得到文本生成模型。


2.根据权利要求1所述的文本生成模型的训练方法,其特征在于,所述根据所述输入样本和输出样本,对预设的图神经网络进行训练,得到文本生成模型,包括:迭代步骤;
所述迭代步骤包括:
根据所述第一文本的结构图、所述第一文本以及所述预设的图神经网络模型,确定所述第一文本在所述图神经网络模型的编码端的第一状态向量;
根据所述第一状态向量,确定解码结构图中各节点的隐含向量,其中,所述解码结构图为所述图神经网络模型的解码端中待输出文本的结构图,与所述第一文本的结构图相同;
根据各所述隐含向量,确定每次解码的解码位置以及所述解码位置对应的文字,得到所述待输出文本,其中,每次解码的解码位置为本次待解码的节点在所述解码结构图中的所处位置;
判断所述待输出文本与所述第二文本的误差是否满足预设条件,若满足,结束迭代步骤得到所述文本生成模型,否则,调整所述编码端和所述解码端中的权重参数,重新执行所述迭代步骤。


3.根据权利要求2所述的文本生成模型的训练方法,其特征在于,所述根据所述第一文本的结构图、所述第一文本以及所述预设的图神经网络模型,确定所述第一文本在所述图神经网络模型的编码端的第一状态向量,包括:
获取所述第一文本的结构图中每条边的边向量;
将各所述边向量以及所述第一文本中每个文字的字向量输入所述编码端进行编码,得到所述第一文本的结构图中每个节点对应的文字的第一向量;
对多个所述第一向量进行平均池化,得到所述第一文本在所述编码端的第一状态向量。


4.根据权利要求2或3所述的文本生成模型的训练方法,其特征在于,所述根据所述第一状态向量,确定解码结构图中各节点的隐含向量,包括:
将所述第一状态向量变换为所述解码端的第二状态向量;
将所述编...

【专利技术属性】
技术研发人员:王正魁李翠姣付霞
申请(专利权)人:达闼机器人有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1