描述文本生成方法和装置、文本处理模型的训练方法制造方法及图纸

技术编号:30633081 阅读:17 留言:0更新日期:2021-11-04 00:08
本申请涉及人工智能领域,具体请涉及一种描述文本生成方法、装置、计算机设备和存储介质。所述方法包括:获取与目标任务对应的共享内容文本和辅助描述文本;辅助描述文本的文本类型为评论类型和标签类型中的其中一种;分别对共享内容文本和辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列;对共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量;基于共享隐变量和辅助向量序列进行语义解码处理,输出与目标任务对应的目标描述文本,目标描述文本的文本类型为评论类型和标签类型中的一种,且目标描述文本与辅助描述文本的文本类型不同。采用本方法能够提升目标描述文本的生成效率。方法能够提升目标描述文本的生成效率。方法能够提升目标描述文本的生成效率。

【技术实现步骤摘要】
描述文本生成方法和装置、文本处理模型的训练方法


[0001]本申请涉及计算机
,特别是涉及一种描述文本生成方法和装置、文本处理模型的训练方法。

技术介绍

[0002]随着网络科技的发展,用户可以随时随地的接触到各种文本信息,比如音乐评论、新闻标签、博客评论、报告标签、论文评论等。目前,主要采用人工手动撰写文本的方式,例如,可通过音乐应用在相应的评论输入区域中手动输入音乐评论,或者可通过新闻应用在相应的新闻添加区域中手动添加新闻标签。然而,随着互联网技术的发展,人们可接触到的文本信息的信息量在不断增长,对创作类型的文本信息的需求量也在不断地增大,例如,人们希望能够阅读更多地音乐评论和新闻标签。如此,便使得文本创作人员需要手动创作大量的文本内容,从而存在人工手动撰写文本的方式效率低。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够提升目标描述文本的生成效率的描述文本生成方法、装置、计算机设备和存储介质。
[0004]一种描述文本生成方法,所述方法包括:
[0005]获取与目标任务对应的共享内容文本和辅助描述文本;所述辅助描述文本的文本类型为评论类型和标签类型中的其中一种;
[0006]分别对所述共享内容文本和所述辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列;
[0007]对所述共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量;
[0008]基于所述共享隐变量和所述辅助向量序列进行语义解码处理,输出与所述目标任务对应的目标描述文本,所述目标描述文本的文本类型为评论类型和标签类型中的一种,且所述目标描述文本与所述辅助描述文本的文本类型不同。
[0009]在一个实施例中,所述获取与目标任务对应的共享内容文本和辅助描述文本,包括:
[0010]确定目标任务,并获取与所述目标任务对应的线索关键词;
[0011]基于所述线索关键词进行检索,得到与所述目标任务匹配的共享内容文本和辅助描述文本。
[0012]在一个实施例中,所述描述文本生成通过文本处理模型执行;所述文本处理模型包括评论生成网络和标签生成网络;所述评论生成网络用于根据所述共享内容文本和属于标签类型的辅助描述文本,生成属于评论类型的目标描述文本;所述标签生成网络用于根据所述共享内容文本和属于评论类型的辅助描述文本,生成属于标签类型的目标描述文本。
[0013]在一个实施例中,所述文本处理模型还包括内容编码网络,所述分别对所述共享
内容文本和所述辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列,包括:
[0014]通过所述内容编码网络,对所述共享内容文本进行语义编码处理,得到与所述共享内容文本对应的共享向量序列;
[0015]当所述辅助描述文本属于标签类型时,通过所述评论生成网络对所述辅助描述文本进行语义编码处理,得到对应的第一辅助向量序列;
[0016]当所述辅助描述文本属于评论类型时,通过所述标签生成网络对所述辅助描述文本进行语义编码处理,得到对应的第二辅助向量序列;
[0017]所述对所述共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量,包括:
[0018]当所述辅助描述文本属于标签类型时,通过所述评论生成网络,对所述共享向量序列进行随机化处理,并基于处理结果确定第一共享隐变量;
[0019]当所述辅助描述文本属于评论类型时,通过所述标签生成网络,对所述共享向量序列进行随机化处理,并基于处理结果确定第二共享隐变量;
[0020]所述基于所述共享隐变量和所述辅助向量序列进行语义解码处理,输出与所述目标任务对应的目标描述文本,包括:
[0021]当所述辅助描述文本属于标签类型时,通过所述评论生成网络,基于所述第一共享隐变量对所述第一辅助向量序列进行解码处理,得到属于评论类型的目标描述文本;
[0022]当所述辅助描述文本属于评论类型时,通过所述标签生成网络,基于所述第二共享隐变量对所述第二辅助向量序列进行解码处理,得到属于标签类型的目标描述文本。
[0023]在一个实施例中,所述通过所述评论生成网络,基于所述第一共享隐变量对所述第一辅助向量序列进行解码处理,得到属于评论类型的目标描述文本,包括:
[0024]通过所述评论生成网络,基于所述第一共享隐变量以及前次输出的目标词的词向量,对所述第一辅助向量序列进行解码,得到当次的目标端向量序列;
[0025]通过所述评论生成网络,根据当次的所述目标端向量序列,确定当次输出的目标词;
[0026]通过所述评论生成网络,基于输出的各个所述目标词,构成属于评论类型的目标描述文本。
[0027]在一个实施例中,所述所述文本处理模型的训练步骤包括:
[0028]获取第一样本训练集,所述第一样本训练集包括第一内容文本、以及与所述第一内容文本对应的第一样本评论和第一样本标签;
[0029]对所述第一内容文本进行语义编码处理,得到对应的样本内容向量序列;
[0030]通过待训练的文本处理模型中的评论生成网络,对所述样本内容向量序列和所述第一样本标签进行编解码处理,得到对应的第一预测评论;
[0031]通过所述待训练的文本处理模型中的标签生成网络,对所述样本内容向量序列和所述第一样本评论进行编解码处理,得到对应的第一预测标签;其中,所述评论生成网络和所述标签生成网络互为对偶结构;
[0032]根据所述第一预测标签和所述第一样本标签之间的第一差异,以及所述第一预测评论和所述第一样本评论之间的第二差异,确定对偶损失;
[0033]基于所述对偶损失对所述文本处理模型进行训练,直至满足训练结束条件时结束,得到训练好的文本处理模型;所述训练好的文本处理模型用于生成与目标任务对应的目标描述文本;所述目标描述文本为目标评论文本和目标标签文本中的至少一种。
[0034]一种描述文本生成装置,所述装置包括:
[0035]文本获取模块,用于获取与目标任务对应的共享内容文本和辅助描述文本;所述辅助描述文本的文本类型为评论类型和标签类型中的其中一种;
[0036]随机化处理模块,用于分别对所述共享内容文本和所述辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列;对所述共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量;
[0037]解码模块,用于基于所述共享隐变量和所述辅助向量序列进行语义解码处理,输出与所述目标任务对应的目标描述文本,所述目标描述文本的文本类型为评论类型和标签类型中的一种,且所述目标描述文本与所述辅助描述文本的文本类型不同。
[0038]在一个实施例中,所述文本获取模块还用于确定目标任务,并获取与所述目标任务对应的线索关键词;基于所述线索关键词进行检索,得到与所述目标任务匹配的共享内容文本和辅助描述文本。
[0039]在一个实施例中,所述随机化处理模块还包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种描述文本生成方法,其特征在于,所述方法包括:获取与目标任务对应的共享内容文本和辅助描述文本;所述辅助描述文本的文本类型为评论类型和标签类型中的其中一种;分别对所述共享内容文本和所述辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列;对所述共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量;基于所述共享隐变量和所述辅助向量序列进行语义解码处理,输出与所述目标任务对应的目标描述文本,所述目标描述文本的文本类型为评论类型和标签类型中的一种,且所述目标描述文本与所述辅助描述文本的文本类型不同。2.根据权利要求1所述的方法,其特征在于,所述分别对所述共享内容文本和所述辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列,包括:确定与所述共享内容文本对应的共享词序列,并确定与所述辅助描述文本对应的辅助词序列;对所述共享词序列分别进行正向语义编码和反向语义编码,得到正向共享编码向量序列和反向共享编码向量序列;对所述正向共享编码向量序列和所述反向共享编码向量序列进行序列融合处理,得到与所述共享内容文本对应的共享向量序列;对所述辅助词序列分别进行正向语义编码和反向语义编码,得到正向辅助编码向量序列和反向辅助编码向量序列;对所述正向辅助编码向量序列和所述反向辅助编码向量序列进行序列融合处理,得到与所述辅助描述文本对应的辅助向量序列。3.根据权利要求1所述的方法,其特征在于,所述对所述共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量,包括:将所述共享向量序列转化成对应的目标概率分布,并基于所述目标概率分布确定对应的目标均值和目标方差;当所述辅助描述文本属于标签类型时,根据所述目标均值和所述目标方差,基于所述目标概率分布进行至少一次采样,得到与所述辅助描述文本对应的至少一个共享隐变量;当所述辅助描述文本属于评论类型时,将所述目标均值作为与所述辅助描述文本对应的共享隐变量。4.根据权利要求3所述的方法,其特征在于,当所述辅助描述文本属于标签类型时,所述基于所述共享隐变量和所述辅助向量序列进行语义解码处理,输出与所述目标任务对应的目标描述文本,包括:将每个共享隐变量分别与所述辅助向量序列构成一组待解码对象;基于每组待解码对象分别进行语义解码处理,输出与所述目标任务对应的至少一个的目标描述文本,且输出的每个目标描述文本各不相同。5.根据权利要求1所述的方法,其特征在于,所述方法通过文本处理模型执行;所述文本处理模型包括评论生成网络和标签生成网络;所述评论生成网络用于根据所述共享内容文本和属于标签类型的辅助描述文本,生成属于评论类型的目标描述文本;所述标签生成网络用于根据所述共享内容文本和属于评论类型的辅助描述文本,生成属于标签类型的目
标描述文本。6.根据权利要求5所述的方法,其特征在于,所述文本处理模型还包括内容编码网络,所述分别对所述共享内容文本和所述辅助描述文本进行语义编码处理,得到对应的共享向量序列和辅助向量序列,包括:通过所述内容编码网络,对所述共享内容文本进行语义编码处理,得到与所述共享内容文本对应的共享向量序列;当所述辅助描述文本属于标签类型时,通过所述评论生成网络对所述辅助描述文本进行语义编码处理,得到对应的第一辅助向量序列;当所述辅助描述文本属于评论类型时,通过所述标签生成网络对所述辅助描述文本进行语义编码处理,得到对应的第二辅助向量序列;所述对所述共享向量序列进行随机化处理,并基于随机化处理结果确定共享隐变量,包括:当所述辅助描述文本属于标签类型时,通过所述评论生成网络,对所述共享向量序列进行随机化处理,并基于处理结果确定第一共享隐变量;当所述辅助描述文本属于评论类型时,通过所述标签生成网络,对所述共享向量序列进行随机化处理,并基于处理结果确定第二共享隐变量;所述基于所述共享隐变量和所述辅助向量序列进行语义解码处理,输出与所述目标任务对应的目标描述文本,包括:当所述辅助描述文本属于标签类型时,通过所述评论生成网络,基于所述第一共享隐变量对所述第一辅助向量序列进行解码处理,得到属于评论类型的目标描述文本;当所述辅助描述文本属于评论类型时,通过所述标签生成网络,基于所述第二共享隐变量对所述第二辅助向量序列进行解码处理,得到属于标签类型的目标描述文本。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述目标任务为音乐评论生成任务或者音乐标签生成任务;当所述目标任务为音乐评论生成任务时,所述共享内容文本包括目标歌曲所对应的歌曲名称、歌词文本、韵律描述文本、以及作者属性文本中的至少一种,所述辅助描述文本为所述目标歌曲所对应的音乐标签集合,所述目标描述文本为所述目标歌曲所对应的音乐评论集合;当所述目标任务为音乐标签生成任务时,所述共享内容文本包括目标歌曲所对应的歌曲名称、歌词文本、韵律描述文本、以及作者属性文本的至少一种,所述辅助描述文本为所述目标歌曲所对应的音乐评论集合,所述目标描述文本为所述目标歌曲所对应的音乐标签集合。8.一种文本处理模型的训练方法,其特征在于,所述方法包括:获取第一样本训练集,所述第一样本训练集包括第一内容文本、以及与所述第一内容文本对应的第一样本评论和第一样本标签;对所述第一内容文本进行语义编码处理,得到对应的样本内容向量序列;通过待训练的文本处理模型中的评论生成网络,对所述样本内容向量序列和所述第一样本标签进行编解码处理,得到对应的第一预测评论;通过所述待训练的文本处理模型中的标签生成网络,对所述样本内容向量序列和所述
第一样本评论进行编解码处理,得到对应的第一预测标签;其中,所述评论生成网络和所述标签生成网络互为对偶结构;根据所述第一预测标签和所述第一样本标签之间的第一差...

【专利技术属性】
技术研发人员:霍腾飞刘志强张金超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1