歌词生成方法及装置制造方法及图纸

技术编号:14938825 阅读:84 留言:0更新日期:2017-04-01 00:47
本发明专利技术提出了一种歌词生成方法及装置,其中,方法包括:S1、获取源歌词,并确定源歌词中句子的数量S以及每个句子的长度;S2、基于双向时间递归神经网络LSTM模型将待生成句子的主题词、待生成句子的长度和已生成的歌词组成的输入序列进行编码,以将输入序列转换为一组隐状态;S3、基于包含内部状态向量的时间递归神经网络LSTM模型对隐状态进行解码,以生成待生成句子的歌词;S4、重复步骤S2和S3,以生成S句歌词。通过本发明专利技术能够准确控制生成的每句歌词的长度,通过为每句话分配主题词提高生成的歌词与主题词之间的相关性,并利用已生成的句子生成后续的句子,提高句子与句子之间的逻辑关联性。

【技术实现步骤摘要】

本专利技术涉及音频处理
,尤其涉及一种歌词生成方法及装置
技术介绍
众所周知,歌曲由歌词和乐曲组合而成。歌词作为诗歌的一种表现形式,是歌曲的本意所在。随着科技的不断发展,机器自动生成歌词的技术也逐渐成熟。目前,可以模仿现有歌曲的歌词结构生成新的歌词,保证生成的歌词与原歌词字数一致,使生成的歌词能够按照原来歌曲的乐曲进行演唱。因此,在给定乐曲的情况下,如何生成与乐曲匹配的歌词成为极具挑战的技术问题。现有基于循环神经网络(RecurrentNeuralNetwork,RNN)语言模型的歌词生成技术,需要先给定歌词的开始部分,将歌词的开始部分作为输入,利用RNN语言模型输出字典里所有字的概率,将概率最大的字作为下一个字。接着将新生成的字作为输入继续生成下一个字。重复上述步骤,直至生成最后一个字,歌词生成过程结束。然而,现有基于语言模型的歌词生成技术难以保证生成歌词与用户所需歌词主旨的相关性,生成的歌词之间的逻辑关联性低。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的第一个目的在于提出一种歌词生成方法,该方法能够准确控制生成的每句歌词的长度,提高生成的歌词与主题词之间的相关性以及句子与句子之间的逻辑关联性。本专利技术的第二个目的在于提出一种歌词生成装置。本专利技术的第三个目的在于提出一种终端。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为了实现上述目的,本专利技术第一方面实施例提出了一种歌词生成方法,包括:S1、获取源歌词,并确定源歌词中句子的数量S以及每个句子的长度;S2、基于双向时间递归神经网络LSTM模型将待生成句子的主题词、待生成句子的长度和已生成的歌词组成的输入序列进行编码,以将输入序列转换为一组隐状态;S3、基于包含内部状态向量的时间递归神经网络LSTM模型对隐状态进行解码,以生成待生成句子的歌词;S4、重复步骤S2和S3,以生成S句歌词。本专利技术第一方面实施例提出的歌词生成方法,通过确定源歌词中句子的数量和每个句子的长度,基于双向时间递归神经网络模型将待生成句子的主题词、长度和已生成的歌词组成的输入序列进行编码转换为一组隐状态,并基于包含内部状态向量的时间递归神经网络模型对隐状态进行解码生成待生成句子的歌词,进而生成与源歌词句子数量相同的新的歌词。由此,能够准确控制生成的每句歌词的长度,通过为每句话分配主题词提高生成的歌词与主题词之间的相关性,并利用已生成的句子生成后续的句子,提高句子与句子之间的逻辑关联性。为了实现上述目的,本专利技术第二方面实施例提出了一种歌词生成装置,包括:确定模块,用于获取源歌词,并确定源歌词中句子的数量S以及每个句子的长度;转换模块,用于基于双向时间递归神经网络LSTM模型将待生成句子的主题词、待生成句子的长度和已生成的组成的输入序列进行编码,以将输入序列转换为一组隐状态;生成模块,用于基于包含内部状态向量的时间递归神经网络LSTM模型对隐状态进行解码,以生成待生成句子的歌词。本专利技术第二方面实施例提出的歌词生成装置,通过确定源歌词中句子的数量和每个句子的长度,基于双向时间递归神经网络模型将待生成句子的主题词、长度和已生成的歌词组成的输入序列进行编码转换为一组隐状态,并基于包含内部状态向量的时间递归神经网络模型对隐状态进行解码生成待生成句子的歌词,进而生成与源歌词句子数量相同的新的歌词。由此,能够准确控制生成的每句歌词的长度,通过为每句话分配主题词提高生成的歌词与主题词之间的相关性,并利用已生成的句子生成后续的句子,提高句子与句子之间的逻辑关联性。为了实现上述目的,本专利技术第三方面实施例提出了一种终端,包括:处理器;用于存储处理器可执行指令的存储器。其中,处理器被配置为执行以下步骤:S1’、获取源歌词,并确定源歌词中句子的数量S以及每个句子的长度;S2’、基于双向时间递归神经网络LSTM模型将待生成句子的主题词、待生成句子的长度和已生成的歌词组成的输入序列进行编码,以将输入序列转换为一组隐状态;S3’、基于包含内部状态向量的时间递归神经网络LSTM模型对隐状态进行解码,以生成待生成句子的歌词;S4’、重复步骤S2’和S3’,以生成S句歌词。本专利技术第三方面实施例提出的终端,通过确定源歌词中句子的数量和每个句子的长度,基于双向时间递归神经网络模型将待生成句子的主题词、长度和已生成的歌词组成的输入序列进行编码转换为一组隐状态,并基于包含内部状态向量的时间递归神经网络模型对隐状态进行解码生成待生成句子的歌词,进而生成与源歌词句子数量相同的新的歌词。由此,能够准确控制生成的每句歌词的长度,通过为每句话分配主题词提高生成的歌词与主题词之间的相关性,并利用已生成的句子生成后续的句子,提高句子与句子之间的逻辑关联性。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,用于存储一个或多个程序,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行第一方面实施例提出的歌词生成方法。本专利技术第四方面实施例提出的非临时性计算机可读存储介质,通过确定源歌词中句子的数量和每个句子的长度,基于双向时间递归神经网络模型将待生成句子的主题词、长度和已生成的歌词组成的输入序列进行编码转换为一组隐状态,并基于包含内部状态向量的时间递归神经网络模型对隐状态进行解码生成待生成句子的歌词,进而生成与源歌词句子数量相同的新的歌词。由此,能够准确控制生成的每句歌词的长度,通过为每句话分配主题词提高生成的歌词与主题词之间的相关性,并利用已生成的句子生成后续的句子,提高句子与句子之间的逻辑关联性。为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行第一方面实施例提出的歌词生成方法。本专利技术第五方面实施例提出的计算机程序产品,通过确定源歌词中句子的数量和每个句子的长度,基于双向时间递归神经网络模型将待生成句子的主题词、长度和已生成的歌词组成的输入序列进行编码转换为一组隐状态,并基于包含内部状态向量的时间递归神经网络模型对隐状态进行解码生成待生成句子的歌词,进而生成与源歌词句子数量相同的新的歌词。由此,能够准确控制生成的每句歌词的长度,通过为每句话分配主题词提高生成的歌词与主题词之间的相关性,并利用已生成的句子生成后续的句子,提高句子与句子之间的逻辑关联性。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的歌词生成方法的流程示意图;图2是基于LSTM模型进行编解码生成待生成句子的歌词的过程示意图;图3是基于LSTM模型将输入序列转换为隐状态的流程示意图;图4是基于包含内部状态向量的LSTM模型对隐状态进行解码生成待生成句子的歌词的流程示意图;图5是本专利技术另一实施例提出的歌词生成方法的流程示意图;图6是本专利技术又一实施例提出的歌词生成方法的流程示意图;图7是本专利技术一实施例提出的歌词生成装置的结构示意图;图8是本专利技术另一实施例提出的歌词生成装置的结构示意图;图9是本专利技术又一实施例提出的歌词生成装置的结构示意图;图10是本专利技术还一实施例提出的歌词生成装置的结构示意图;图11是本发本文档来自技高网...
歌词生成方法及装置

【技术保护点】
一种歌词生成方法,其特征在于,包括:S1、获取源歌词,并确定所述源歌词中句子的数量S以及每个句子的长度;S2、基于双向时间递归神经网络LSTM模型将待生成句子的主题词、所述待生成句子的长度和已生成的歌词组成的输入序列进行编码,以将所述输入序列转换为一组隐状态;S3、基于包含内部状态向量的时间递归神经网络LSTM模型对所述隐状态进行解码,以生成所述待生成句子的歌词;S4、重复步骤S2和S3,以生成S句歌词。

【技术特征摘要】
1.一种歌词生成方法,其特征在于,包括:S1、获取源歌词,并确定所述源歌词中句子的数量S以及每个句子的长度;S2、基于双向时间递归神经网络LSTM模型将待生成句子的主题词、所述待生成句子的长度和已生成的歌词组成的输入序列进行编码,以将所述输入序列转换为一组隐状态;S3、基于包含内部状态向量的时间递归神经网络LSTM模型对所述隐状态进行解码,以生成所述待生成句子的歌词;S4、重复步骤S2和S3,以生成S句歌词。2.如权利要求1所述的方法,其特征在于,所述步骤S2,包括:基于正向LSTM模型对所述输入序列进行正向编码,以获取正向隐状态;基于反向LSTM模型对所述输入序列进行反向编码,以获取反向隐状态;拼接所述正向隐状态和所述反向隐状态,以生成所述隐状态。3.如权利要求1所述的方法,其特征在于,所述步骤S3,包括:获取所述隐状态对应的注意力得分;根据所述隐状态和所述隐状态对应的注意力得分获得所述输入序列的历史信息向量;根据所述内部状态向量、所述历史信息向量和前一个字生成当前字;将生成的当前字组合成所述待生成句子的歌词。4.如权利要求3所述的方法,其特征在于,在根据所述内部状态向量、所述历史信息向量和前一个字生成当前字之后,还包括:更新所述内部状态向量。5.如权利要求1所述的方法,其特征在于,还包括:训练所述双向LSTM模型和包含内部状态向量的LSTM模型。6.如权利要求5所述的方法,其特征在于,训练所述双向LSTM模型和包含内部状态向量的LSTM模型,包括:获取主题词样本和所述主题词样本对应的歌词样本;根据所述主题词样本和所述歌词样本训练所述双向LSTM模型和包含内部状态向量的LSTM模型。7.一种歌词生成装置,其特征在于,包括:...

【专利技术属性】
技术研发人员:王哲和为赵世奇吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1