一种文本生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37845052 阅读:25 留言:0更新日期:2023-06-14 22:28
本申请提供了一种文本生成方法,包括:获取针对目标视频的评论文本及针对所述目标视频的分享文本的限制条件信息;将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量;其中,所述字典向量为多个,且一个字典向量与所述分享文本中一个字符的目标位置对应;根据所述字典向量,从所述预设字典中确定每个目标位置的字符,得到所述目标视频的分享文本。这样,分享文本具有高质量及与目标视频的高相关性,有利于对目标视频的分享和传播。视频的分享和传播。视频的分享和传播。

【技术实现步骤摘要】
一种文本生成方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,特别是涉及一种文本生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网的发展,越来越多的用户会在互联网平台上进行视频分享,将感兴趣的视频分享给其他人欣赏,通常,进行分享时需要输入相应的文本,比如,文本可以是对所分享的视频的描述或感悟等等,这样,其他用户可以快速了解所分享的视频。
[0003]目前,视频分享时的文本需要用户手动输入,用户很可能因为觉得自己词不达意而放弃分享,或者,由于文本的生成效率及质量较低,导致所分享的视频的吸引力较低,从而影响视频的传播效应,使得视频的分享量与播放量降低。

技术实现思路

[0004]为解决上述技术问题,本申请示出了一种文本生成方法、装置、电子设备及存储介质,以至少解决相关技术中视频的分享文本生成效率较低,质量较差,导致视频分享量与播放量不高的问题。本公开的技术方案如下:
[0005]第一方面,本申请示出了一种文本生成方法,所述方法包括:
[0006]获取针对目标视频的评论文本及针对所述目标视频的分享文本的限制条件信息;
[0007]将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量;其中,所述字典向量为多个,且一个字典向量与所述分享文本中一个字符的目标位置对应;
[0008]根据所述字典向量,从所述预设字典中确定每个目标位置的字符,得到所述目标视频的分享文本。
[0009]可选的,在所述将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量之前,还包括:
[0010]获取样本文本及预设字典;
[0011]由预设自然语言处理模型对所述预设字典进行文本生成处理,得到所述样本文本中的每个字符分别对应的预测字典向量;所述预测字典向量中的第M个值表示所述预设字典中的第M个字符为所述预测字典向量对应的样本文本中的字符的概率,所述M为正整数;
[0012]确定所述预测字典向量与对应的所述样本文本中的字符的样本字符向量之间的差值;
[0013]根据所述差值,对所述预设自然语言处理模型的模型参数进行调整,直至调整次数达到预设迭代次数,得到所述文本生成模型。
[0014]可选的,所述获取样本文本及预设字典,包括:
[0015]获取样本文本;
[0016]对所述样本文本进行字符提取并去重,得到多个字典字符;
[0017]对所述字典字符进行编号,将所述编号映射为所述字典字符的一维向量;
[0018]基于所述样本文本,将所述一维向量转换为多维向量,作为所述字典字符的字符向量;
[0019]根据所述字典字符及每个字典字符对应的字符向量生成预设字典。
[0020]可选的,所述由预设自然语言处理模型对所述预设字典进行文本生成处理,得到所述样本文本中的每个字符分别对应的预测字典向量,包括:
[0021]将所述样本文本对应的第一开始标识作为输入信息,并将所述预设自然语言处理模型作为候选文本生成模型;所述第一开始标识位于所述样本文本中的第一个字符之前;
[0022]将所述输入信息输入至所述候选文本生成模型,由所述候选文本生成模型对所述预设字典进行文本生成处理,得到所述输入信息的后一位字符对应的预测字典向量;
[0023]所述确定所述预测字典向量与对应的所述样本文本中的字符的样本字符向量之间的差值,包括:
[0024]确定所述输入信息的后一位字符对应的预测字典向量与对应的样本字符向量之间的差值。
[0025]可选的,所述根据所述差值,对所述预设自然语言处理模型的模型参数进行调整,直至调整次数达到预设迭代次数,得到所述文本生成模型,包括:
[0026]根据所述差值,对所述候选文本生成模型的模型参数进行调整,得到新的候选文本生成模型;
[0027]将所述输入信息及所述输入信息的后一位字符作为新的输入信息,返回所述将所述输入信息输入至所述候选文本生成模型的步骤,直至所述输入信息的后一位字符不存在,将得到的候选文本生成模型作为文本生成模型。
[0028]可选的,所述将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量,包括:
[0029]将第二开始标识作为参考信息,将所述参考信息的后一位字符的位置作为目标位置;所述第二开始标识的后一位对应于待生成的分享文本中的第一个字符;
[0030]将所述参考信息、所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的目标字典向量;所述目标字典向量为对应于所述目标位置的字典向量。
[0031]可选的,所述根据所述字典向量,从所述预设字典中确定每个目标位置的字符,得到所述目标视频的分享文本,包括:
[0032]根据所述目标字典向量,从所述预设字典中确定所述目标位置的目标字符;
[0033]将所述参考信息及所述目标字符作为新的参考信息,返回所述将所述参考信息、所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型的步骤,得到多个目标字符;
[0034]将得到的目标字符按照对应的目标位置组合为所述目标视频的分享文本。
[0035]可选的,所述将所述参考信息、所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的目标字典向量,包括:
[0036]获取所述分享文本中的加权位置;所述加权位置用于指示所述分享文本中预设的待进行加权计算的字符的位置;
[0037]在所述加权位置不包括所述目标位置的情况下,将所述参考信息、所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型对预设字典进行文本生成处理,得到与所述限制条件信息相匹配的目标字典向量;
[0038]在所述加权位置包括所述目标位置的情况下,将所述参考信息、所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的目标字典向量。
[0039]可选的,所述根据所述字典向量,从所述预设字典中确定每个目标位置的字符,得到所述目标视频的分享文本,包括:
[0040]根据所述字典向量,从所述预设字典中确定每个目标位置的字符,得到所述目标视频的候选文本;
[0041]基于预设文本替换规则,对所述候选文本进行字符替换处理,得到分享文本。
...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法,其特征在于,包括:获取针对目标视频的评论文本及针对所述目标视频的分享文本的限制条件信息;将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量;其中,所述字典向量为多个,且一个字典向量与所述分享文本中一个字符的目标位置对应;根据所述字典向量,从所述预设字典中确定每个目标位置的字符,得到所述目标视频的分享文本。2.根据权利要求1所述的方法,其特征在于,在所述将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量之前,还包括:获取样本文本及预设字典;由预设自然语言处理模型对所述预设字典进行文本生成处理,得到所述样本文本中的每个字符分别对应的预测字典向量;所述预测字典向量中的第M个值表示所述预设字典中的第M个字符为所述预测字典向量对应的样本文本中的字符的概率,所述M为正整数;确定所述预测字典向量与对应的所述样本文本中的字符的样本字符向量之间的差值;根据所述差值,对所述预设自然语言处理模型的模型参数进行调整,直至调整次数达到预设迭代次数,得到所述文本生成模型。3.根据权利要求2所述的方法,其特征在于,所述获取样本文本及预设字典,包括:获取样本文本;对所述样本文本进行字符提取并去重,得到多个字典字符;对所述字典字符进行编号,将所述编号映射为所述字典字符的一维向量;基于所述样本文本,将所述一维向量转换为多维向量,作为所述字典字符的字符向量;根据所述字典字符及每个字典字符对应的字符向量生成预设字典。4.根据权利要求2所述的方法,其特征在于,所述由预设自然语言处理模型对所述预设字典进行文本生成处理,得到所述样本文本中的每个字符分别对应的预测字典向量,包括:将所述样本文本对应的第一开始标识作为输入信息,并将所述预设自然语言处理模型作为候选文本生成模型;所述第一开始标识位于所述样本文本中的第一个字符之前;将所述输入信息输入至所述候选文本生成模型,由所述候选文本生成模型对所述预设字典进行文本生成处理,得到所述输入信息的后一位字符对应的预测字典向量;所述确定所述预测字典向量与对应的所述样本文本中的字符的样本字符向量之间的差值,包括:确定所述输入信息的后一位字符对应的预测字典向量与对应的样本字符向量之间的差值。5.根据权利要求4所述的方法,其特征在于,所述根据所述差值,对所述预设自然语言处理模型的模型参数进行调整,直至调整次数达到预设迭代次数,得到所述文本生成模型,包括:根据所述差值,对所述候选文本生成模型的模型参数进行调整,得到新的候选文本生成模型;
将所述输入信息及所述输入信息的后一位字符作为新的输入信息,返回所述将所述输入信息输入至所述候选文本生成模型的步骤,直至所述输入信息的后一位字符不存在,将得到的候选文本生成模型作为文本生成模型。6.根据权利要求1所述的方法,其特征在于,所述将所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的字典向量,包括:将第二开始标识作为参考信息,将所述参考信息的后一位字符的位置作为目标位置;所述第二开始标识的后一位对应于待生成的分享文本中的第一个字符;将所述参考信息、所述评论文本及所述限制条件信息输入至预先训练得到的文本生成模型,由所述文本生成模型基于所述评论文本对预设字典进行加权计算,生成与所述限制条件信息相匹配的目标字典向量;所述目标字典向量为对应于所述目标位置的字典向量。7.根据权利要求6所述的方法,其特征在于,所述根据所述字典向量,从所述预设字典中确定每个目标位...

【专利技术属性】
技术研发人员:杜国强
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1