内容文本生成方法和装置、音乐评论文本生成方法制造方法及图纸

技术编号:26792138 阅读:48 留言:0更新日期:2020-12-22 17:07
本申请涉及人工智能领域,具体涉及一种内容文本生成方法和装置、音乐评论文本生成方法。内容文本生成方法包括:获取与目标任务对应的描述文本;对描述文本进行语义编码处理,得到对应的编码向量序列;根据编码向量序列,确定与多个视角维度分别对应的多个视角特征;基于多个视角特征中的每个视角特征,分别对编码向量序列进行解码处理,输出与目标任务对应、且与每个视角维度分别对应的内容文本。采用本方法能够提升内容文本的多样性。

【技术实现步骤摘要】
内容文本生成方法和装置、音乐评论文本生成方法
本申请涉及计算机
,特别是涉及一种内容文本生成方法和装置、音乐评论文本生成方法。
技术介绍
随着网络科技的发展,用户可以随时随地的接触到各种文本信息,比如博客、音乐歌词、报告、论文等。目前,主要采用人工手动撰写文本的方式,但这种人工手动的方式效率非常低。现有技术中,可以基于改进的指针生成(pointer-generator)模型生成新的内容文本:即一篇初始文本和其对应的一个参考内容文本,组成一个训练对,使用上述一对一的训练对,训练指针生成模型,从而训练后的指针生成模型可基于初始文本生成新的内容文本。但是,基于指针生成模型所生成的内容文本没有特色,缺乏多样性。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提升所生成的内容文本的多样性的内容文本生成方法、装置、计算机设备和存储介质、以及一种能够提升所生成的音乐评论文本多样性的音乐评论文本生成方法、装置、计算机设备和存储介质。一种内容文本生成方法,所述方法包括:获取与目标任务对应的描述文本;对所述描述文本进行语义编码处理,得到对应的编码向量序列;根据所述编码向量序列,确定与多个视角维度分别对应的多个视角特征;基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与所述每个视角维度分别对应的内容文本。一种内容文本生成装置,所述装置包括:描述文本获取模块,用于获取与目标任务对应的描述文本;视角特征获取模块,用于对所述描述文本进行语义编码处理,得到对应的编码向量序列;根据所述编码向量序列,确定与多个视角维度分别对应的多个视角特征;内容文本确定模块,用于基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与所述每个视角维度分别对应的内容文本。在一个实施例中,描述文本获取模块还用于确定目标任务,并获取与所述目标任务对应的线索关键词;基于所述线索关键词进行检索,得到与所述目标任务匹配的描述文本。在一个实施例中,视角特征获取模块还用于确定所述描述文本的词序列;对所述描述文本的词序列进行正向语义编码和反向语义编码,得到对应的正向编码向量序列和反向编码向量序列;对所述正向编码向量序列和所述反向编码向量序列进行序列融合,得到与所述描述文本对应的编码向量序列。在一个实施例中,视角特征获取模块还用于确定与每个视角维度分别对应的特征提取函数;其中,不同视角维度所对应的特征提取函数具有不同的视角参数;将所述编码向量序列分别输入至每个所述特征提取函数,通过各个特征提取函数所对应的视角参数,对各自输入的编码向量序列进行处理,得到与多个视角维度分别对应的多个视角特征。在一个实施例中,内容文本包括多于一个的内容子文本,内容文本确定模块还包括第一内容获取模块,用于基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,得到与各个视角维度分别对应的首轮的内容子文本;从所述首轮之后的第二轮次起的当前轮次中,对于每个视角维度,分别根据相应视角维度的历史轮次的内容子文本和所述描述文本进行语义编码处理,得到当前轮次的编码向量序列;所述历史轮次为在所述当前轮次之前的至少一个轮次;对于每个视角维度,分别通过与相应视角维度对应的视角参数继续对所述当前轮次的编码向量序列进行处理,得到当前轮次的相应视角维度的视角特征;对于每个视角维度,分别基于当前轮次的相应视角维度的视角特征,对所述当前轮次的编码向量序列进行解码处理,得到所述当前轮次的与各个视角维度分别对应的内容子文本;将下一轮次作为当前轮次并返回至所述从所述首轮之后的第二轮次起的当前轮次中,对于每个视角维度,分别根据相应视角维度的历史轮次的内容子文本和所述描述文本进行语义编码处理,得到当前轮次的编码向量序列的步骤并继续执行,直至满足预设停止条件时停止,得到所述多个视角维度各自对应的多于一轮的内容子文本;对于所述多个视角维度中的每个视角维度,将每个视角维度所对应的多于一轮的内容子文本,构成相应视角维度所对应的内容文本。在一个实施例中,内容文本确定模块还包括第二内容获取模块,用于对于所述多个视角维度中的每个视角维度,分别依次对所述编码向量序列进行解码得到解码隐层向量,且每次解码时根据前次确定的目标词的词向量进行解码,并根据当次的解码隐层向量确定当次的目标词;其中,对于所述多个视角维度中的每个视角维度,分别将相应视角维度所对应的视角特征,作为与相应视角维度对应的解码过程中初次解码时的初始解码隐层向量;对于每个视角维度,分别基于相应依次解码得到的各个目标词,构成相应的视角维度所对应的内容文本。在一个实施例中,第二内容获取模块还用于依次获取当次的与所述编码向量序列对应的注意力权重向量;根据所述注意力权重向量、以及所述编码向量序列,计算得到当次的内容向量;依次根据当次的内容向量、前次的解码隐层向量、以及前次确定的目标词的词向量,计算得到当次的解码隐层向量,并根据当次的解码隐层向量和当次的内容向量确定当次的目标词。在一个实施例中,内容文本生成方法通过文本生成模型执行,文本生成模型包括编码结构、视角特征抽取结构和解码结构。内容文本生成装置还用于通过文本生成模型中的编码结构对描述文本进行语义编码处理,得到对应的编码向量序列;通过所述文本生成模型中的视角特征抽取结构,并基于与各个视角维度分别对应的视角参数,对所述编码向量序列分别进行处理,得到与各个视角维度分别对应的视角特征;通过所述文本生成模型中的解码结构,并基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与每个所述视角维度分别对应的内容文本。在一个实施例中,内容文本生成装置还包括训练模块,用于获取样本描述文本,并获取与所述样本描述文本对应的、且与所述多个视角维度分别对应的视角参考文本;通过所述文本生成模型中的编码结构,对所述样本描述文本进行语义编码处理,得到对应的预测编码向量序列;通过所述文本生成模型中的视角特征抽取结构,并根据所述预测编码向量序列,确定多个视角维度下的多个预测视角特征;从所述多个预测视角特征中,筛选与相应视角参考文本所对应的目标视角维度的目标视角特征,并基于所述目标视角特征对所述编码向量序列进行解码处理,输出与所述目标视角维度对应的预测内容文本;基于多个视角维度各自对应的预测内容文本、以及相应视角维度所对应的视角参考文本,对所述文本生成模型进行训练。在一个实施例中,训练模块还包括目标视角特征确定模块,用于对于所述多个预测视角特征中的每个预测视角特征,分别确定与相应预测视角特征对应的视角参考文本;确定每个预测视角特征分别与所述样本描述文本相匹配的第一匹配值;确定每个预测视角特征分别与对应的视角参考文本相匹配的第二匹配值;根据所述第一匹配值及所述第二匹配值,从所述多个预测视角特征中筛选出与所述视角参考文本所对应的目标视角维度的目标视角特征。在一个实施例本文档来自技高网...

【技术保护点】
1.一种内容文本生成方法,其特征在于,所述方法包括:/n获取与目标任务对应的描述文本;/n对所述描述文本进行语义编码处理,得到对应的编码向量序列;/n根据所述编码向量序列,确定与多个视角维度分别对应的多个视角特征;/n基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与每个所述视角维度分别对应的内容文本。/n

【技术特征摘要】
1.一种内容文本生成方法,其特征在于,所述方法包括:
获取与目标任务对应的描述文本;
对所述描述文本进行语义编码处理,得到对应的编码向量序列;
根据所述编码向量序列,确定与多个视角维度分别对应的多个视角特征;
基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与每个所述视角维度分别对应的内容文本。


2.根据权利要求1所述的方法,其特征在于,所述获取与目标任务对应的描述文本,包括:
确定目标任务,并获取与所述目标任务对应的线索关键词;
基于所述线索关键词进行检索,得到与所述目标任务匹配的描述文本。


3.根据权利要求1所述的方法,其特征在于,所述对所述描述文本进行语义编码处理,得到对应的编码向量序列,包括:
确定所述描述文本的词序列;
对所述描述文本的词序列进行正向语义编码和反向语义编码,得到对应的正向编码向量序列和反向编码向量序列;
对所述正向编码向量序列和所述反向编码向量序列进行序列融合,得到与所述描述文本对应的编码向量序列。


4.根据权利要求1所述的方法,其特征在于,所述根据所述编码向量序列,确定与多个视角维度分别对应的多个视角特征,包括:
确定与每个视角维度分别对应的特征提取函数;其中,不同视角维度所对应的特征提取函数具有不同的视角参数;
将所述编码向量序列分别输入至每个所述特征提取函数,通过各个特征提取函数所对应的视角参数,对各自输入的编码向量序列进行处理,得到与多个视角维度分别对应的多个视角特征。


5.根据权利要求1所述的方法,其特征在于,所述内容文本包括多于一个的内容子文本,所述基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与每个所述视角维度分别对应的内容文本,包括:
基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,得到与各个视角维度分别对应的首轮的内容子文本;
从所述首轮之后的第二轮次起的当前轮次中,对于每个视角维度,分别根据相应视角维度的历史轮次的内容子文本和所述描述文本进行语义编码处理,得到当前轮次的编码向量序列;所述历史轮次为在所述当前轮次之前的至少一个轮次;
对于每个视角维度,分别通过与相应视角维度对应的视角参数继续对所述当前轮次的编码向量序列进行处理,得到当前轮次的相应视角维度的视角特征;
对于每个视角维度,分别基于当前轮次的相应视角维度的视角特征,对所述当前轮次的编码向量序列进行解码处理,得到所述当前轮次的与各个视角维度分别对应的内容子文本;
将下一轮次作为当前轮次并返回至所述从所述首轮之后的第二轮次起的当前轮次中,对于每个视角维度,分别根据相应视角维度的历史轮次的内容子文本和所述描述文本进行语义编码处理,得到当前轮次的编码向量序列的步骤并继续执行,直至满足预设停止条件时停止,得到所述多个视角维度各自对应的多于一轮的内容子文本;
对于所述多个视角维度中的每个视角维度,将每个视角维度所对应的多于一轮的内容子文本,构成相应视角维度所对应的内容文本。


6.根据权利要求1所述的方法,其特征在于,所述基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与每个所述视角维度分别对应的内容文本,包括:
对于所述多个视角维度中的每个视角维度,分别依次对所述编码向量序列进行解码得到解码隐层向量,且每次解码时根据前次确定的目标词的词向量进行解码,并根据当次的解码隐层向量确定当次的目标词;其中,对于所述多个视角维度中的每个视角维度,分别将相应视角维度所对应的视角特征,作为与相应视角维度对应的解码过程中初次解码时的初始解码隐层向量;
对于每个视角维度,分别基于相应依次解码得到的各个目标词,构成相应的视角维度所对应的内容文本。


7.根据权利要求1所述的方法,其特征在于,所述方法通过文本生成模型执行,所述文本生成模型包括编码结构、视角特征抽取结构和解码结构;所述对所述描述文本进行语义编码处理,得到对应的编码向量序列,包括:
通过所述文本生成模型中的编码结构对所述描述文本进行语义编码处理,得到对应的编码向量序列;
所述根据所述编码向量序列,确定与多个视角维度分别对应的多个视角特征,包括:
通过所述文本生成模型中的视角特征抽取结构,并基于与各个视角维度分别对应的视角参数,对所述编码向量序列分别进行处理,得到与各个视角维度分别对应的视角特征;
所述基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处理,输出与所述目标任务对应、且与所述每个视角维度分别对应的内容文本,包括:
通过所述文本生成模型中的解码结构,并基于所述多个视角特征中的每个视角特征,分别对所述编码向量序列进行解码处...

【专利技术属性】
技术研发人员:霍腾飞刘志强张金超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1