文本生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31502035 阅读:32 留言:0更新日期:2021-12-22 23:21
本申请公开了一种文本生成方法、装置、计算机设备及存储介质,属于计算机技术领域。本申请通过对提示文本按照提示语句为单位提取出语句特征,能够预测出下文中各个目标语句的目标语句特征,这些目标语句特征作为解码过程的语义指导信息,能够以语句为单位解码出各个目标语句,从而得到目标文本,相当于在生成目标文本的过程中,依赖于各个目标语句特征的引导,导致即使某个目标语句中的字符发生了语义偏离,这一语义偏离现象会被下一个目标语句特征纠正,从而并不会在整个目标文本中传递,大大提高了文本生成过程的准确度。大提高了文本生成过程的准确度。大提高了文本生成过程的准确度。

【技术实现步骤摘要】
文本生成方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,特别涉及一种文本生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,长文本生成技术(也称为机器人写作、人工智能写作)被广泛应用于辅助故事创作,例如,针对作家给出的提示文本,机器自动生成故事的草稿,作家可在草稿基础上进一步完善,以减轻作家的工作量。
[0003]在生成长文本的过程中,用户给定提示文本,将提示文本输入到变换器语言模型(Transformer Language Model)中,逐个字符地输出提示文本所对应的长文本的字符序列(例如草稿)。由于以字符为单位来预测长文本,假设某个时刻的字符发生语义偏离,这一错误会逐渐传递到后面每个时刻的字符,从而导致语义偏离逐渐累计,文本生成的准确度较低。因此,亟需一种能够提升文本生成准确度的方法。

技术实现思路

[0004]本申请实施例提供了一种文本生成方法、装置、计算机设备及存储介质,能够提升文本生成的准确度。该技术方案如下:
[0005]一方面,提供了一种文本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法,其特征在于,所述方法包括:基于包含至少一个提示语句的提示文本,获取所述至少一个提示语句的语句特征,所述语句特征用于表征所述提示语句的语义;基于所述至少一个提示语句的语句特征,预测得到至少一个目标语句特征,所述目标语句特征用于表征目标语句的语义,所述目标语句为所述提示语句的下文;基于所述至少一个目标语句特征,解码得到包含至少一个目标语句的目标文本,所述目标文本与所述提示文本具有语义对应关系。2.根据权利要求1所述的方法,其特征在于,所述基于包含至少一个提示语句的提示文本,获取所述至少一个提示语句的语句特征包括:对所述至少一个提示语句中的任一提示语句,获取所述任一提示语句中至少一个字符的嵌入特征;对所述至少一个字符的嵌入特征进行编码,得到所述至少一个字符的语义特征;对所述至少一个字符的语义特征进行融合,得到所述任一提示语句的语句特征。3.根据权利要求2所述的方法,其特征在于,所述获取所述任一提示语句中至少一个字符的嵌入特征包括:将所述任一提示语句中的所述至少一个字符输入至语句编码模型中的语句嵌入层,通过所述语句嵌入层对所述至少一个字符进行嵌入处理,输出所述至少一个字符的嵌入特征,所述语句编码模型用于对输入语句编码以提取语句特征;所述对所述至少一个字符的嵌入特征进行编码,得到所述至少一个字符的语义特征包括:将所述至少一个字符的嵌入特征输入至所述语句编码模型中的至少一个编码层,通过所述至少一个编码层对所述至少一个字符的嵌入特征进行加权处理,输出所述至少一个字符的语义特征;所述对所述至少一个字符的语义特征进行融合,得到所述任一提示语句的语句特征包括:对所述至少一个字符的语义特征进行均值池化,得到所述任一提示语句的语句特征。4.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个提示语句的语句特征,预测得到至少一个目标语句特征包括:获取所述至少一个提示语句的位置特征,所述位置特征用于表征所述提示语句在所述提示文本中的语序信息;将所述至少一个提示语句的语句特征和所述至少一个提示语句的位置特征进行融合,得到所述至少一个提示语句的融合特征;对所述至少一个提示语句的融合特征进行解码,得到所述至少一个目标语句特征。5.根据权利要求4所述的方法,其特征在于,所述对所述至少一个提示语句的融合特征进行解码,得到所述至少一个目标语句特征包括:将所述至少一个提示语句的融合特征输入语句规划模型中的至少一个解码层,通过所述至少一个解码层对所述至少一个提示语句的融合特征进行解码,由最后一个解码层输出所述至少一个目标语句特征,所述语句规划模型用于基于提示语句的融合特征预测下文语句的目标语句特征。6.根据权利要求5所述的方法,其特征在于,所述语句规划模型的训练过程包括:对包含至少一个样本提示语句的样本文本,将所述至少一个样本提示语句的融合特征输入初始规划模型,输出至少一个预测语句特征;
基于所述至少一个预测语句特征和标注文本的至少一个标注语句特征,获取损失函数值,所述标注文本为所述样本文本的下文;迭代调整所述初始规划模型的参数,直到损失函数值符合停止条件,得到所述语句规划模型。7.根据权利要求6所述的方法,其特征在于,所述基于所述至少一个预测语句特征和标注文本的至少一个标注语句特征,获取损失函数值包括:基于所述至少一个预测语句特征和所述至少一个标注语句特征,获取至少一个第一相似度,一个第一相似度用于表征一个预测语句特征与对应的标注语句特征之间的相似程度;基于所述至少一个第一相似度,获取所述损失函数值。8.根据权利要求6所述的方...

【专利技术属性】
技术研发人员:王伟李丕绩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1