歌词生成方法、歌词生成设备以及计算机可读存储介质技术

技术编号:38245045 阅读:8 留言:0更新日期:2023-07-25 18:06
本申请实施例公开了一种歌词生成方法、歌词生成设备以及计算机可读存储介质,用于在提高歌词在故事情节上与故事片段文本的匹配度的情况下,生成歌词。本申请实施例方法包括:获得故事片段文本,将故事片段文本输入预先训练的情节图抽取模型,由情节图抽取模型确定故事片段文本中每个句子对应的情节阶段、每个句子对应的元素实体和每个元素实体对应的元素关系,并基于每个元素实体对应的元素关系得到情节图抽取模型输出的情节图,将情节图输入预先训练的歌词编解码模型,由歌词编解码模型对情节图进行歌词的编解码处理后,得到歌词编解码模型输出的故事片段文本对应的歌词。模型输出的故事片段文本对应的歌词。模型输出的故事片段文本对应的歌词。

【技术实现步骤摘要】
歌词生成方法、歌词生成设备以及计算机可读存储介质


[0001]本申请实施例涉及歌词生成领域,更具体的,是歌词生成方法、歌词生成设备以及计算机可读存储介质。

技术介绍

[0002]随着计算机技术的快速发展,作词人已经可以通过计算机等设备进行歌词的生成。
[0003]现有的歌词生成方法是,先获得目标文本,将目标文本输入预先训练的歌词生成模型,由歌词生成模型提取目标文本的关键词、主题或风格,并根据确定出来的关键词、主题或风格生成目标文本对应的歌词。
[0004]但是,这种歌词生成方法,只是提取目标文本的关键词、主题或风格,而关键词、主题或风格都是一些对于目标文本的故事概括性较大的特征,因此,根据概括性较大的特征生成歌词,歌词在故事情节上与故事片段文本的匹配度较低。

技术实现思路

[0005]本申请实施例提供了一种歌词生成方法、歌词生成设备以及计算机可读存储介质,用于在提高歌词在故事情节上与故事片段文本的匹配度的情况下,生成歌词。
[0006]第一方面,本申请实施例提供了一种歌词生成方法,包括:
[0007]获得故事片段文本;
[0008]将所述故事片段文本输入预先训练的情节图抽取模型,由所述情节图抽取模型确定所述故事片段文本中每个句子对应的情节阶段、每个句子对应的元素实体和每个元素实体对应的元素关系,并基于所述每个元素实体对应的元素关系得到情节图后,得到所述情节图抽取模型输出的情节图;
[0009]将所述情节图输入预先训练的歌词编解码模型,由所述歌词编解码模型对所述情节图进行歌词的编解码处理后,得到所述歌词编解码模型输出的所述故事片段文本对应的歌词。
[0010]可选的,所述情节图抽取模型包括BERT编码模型、情节阶段检测模型、情节元素抽取模型和元素关系识别模型;
[0011]所述由所述情节图抽取模型确定所述故事片段文本中每个句子对应的情节阶段、每个情节阶段对应的元素实体和每个元素实体对应的元素关系,包括:
[0012]由所述BERT编码模型对所述故事片段文本进行编码,以得到所述BERT编码层输出的所述故事片段文本中每个句子对应的句向量,及每个句子中每个字对应的字向量;
[0013]由所述情节阶段检测模型基于每个句子对应的句向量,对每个句子进行情节阶段的检测,以得到所述情节阶段检测模型输出的每个句子对应的情节阶段,及每个情节阶段对应的情节阶段向量;
[0014]针对每个句子,由所述情节要素抽取模型基于所述句子中每个字对应的字向量和
所述句子对应的情节阶段向量,对所述句子进行元素实体的抽取,以得到所述情节要素抽取模型输出的所述句子对应的元素实体,及每个元素实体对应的元素实体向量;
[0015]由所述元素关系识别模型基于所述句子中每个元素实体对应的元素实体向量,对所述句子对应的元素实体进行元素关系的识别,以得到所述元素关系识别模型输出的所述句子中每个元素实体对应的元素关系。
[0016]可选的,所述由所述情节要素抽取层模型基于所述句子中每个字对应的字向量和所述句子对应的情节阶段向量,对所述句子进行元素实体的抽取,以得到所述情节要素抽取层模型输出的所述句子对应的元素实体,及每个元素实体对应的元素实体向量,包括:
[0017]由所述情节要素抽取层模型将所述句子中每个字对应的字向量和所述句子对应的情节阶段向量进行拼接,得到所述句子中每个字对应的拼接向量;
[0018]基于所述每个字对应的拼接向量确定每个字对应的关联标签;
[0019]基于所述每个字对应的关联标签确定字与字之间的关联关系,并根据所述关联关系得到所述句子对应的元素实体,及每个元素实体对应的元素实体向量。
[0020]可选的,所述由所述元素关系识别层模型基于所述句子中每个元素实体对应的元素实体向量,对所述句子对应的元素实体进行元素关系的识别,以得到所述元素关系识别层模型输出的所述句子中每个元素实体对应的元素关系,包括:
[0021]针对所述句子中的每个元素实体,由所述元素关系识别层模型基于所述元素实体对应元素实体向量和所述句子对应的情节阶段向量得到所述元素实体对应的查询向量;
[0022]针对每个元素实体,基于所述元素实体对应的查询向量和所述句子中每个字对应的字向量,确定所述句子中每个字在所述元素实体维度上各自对应的注意力分数;
[0023]将所述每个字在所述元素实体维度上各自对应的注意力分数和所述每个字对应的字向量进行加权求和,得到所述元素实体对应的融合特征向量,所述融合特征向量融合了元素实体信息和情节阶段类型信息的特征;
[0024]基于所述元素实体对应的融合特征向量确定所述元素实体对应的元素关系。
[0025]可选的,所述由所述情节阶段检测模型基于每个句子对应的句向量,对每个句子进行情节阶段的检测,以得到所述情节阶段检测层模型输出的每个句子对应的情节阶段,及每个情节阶段对应的情节阶段向量之前,所述方法还包括:
[0026]获得故事片段样本中每个句子样本对应的句向量样本;所述句向量样本标注有情节阶段;
[0027]将所述句向量样本输入情节阶段检测模型,得到所述情节阶段检测模型输出的预测情节阶段;
[0028]根据回归损失函数计算所述预测情节阶段与标注的情节阶段之间的损失,当所述损失满足收敛条件时,得到训练完成的情节阶段检测模型。
[0029]可选的,所述针对每个句子,由所述情节要素抽取模型基于所述句子中每个字对应的字向量和所述句子对应的情节阶段向量,对所述句子进行元素实体的抽取,以得到所述情节要素抽取层模型输出的所述句子对应的元素实体,及每个元素实体对应的元素实体向量之前,所述方法还包括:
[0030]针对故事片段样本的每个句子样本,获得所述句子样本中每个字样本对应的字向量样本和所述句子样本对应的情节阶段向量样本;
[0031]将所述句子样本中每个字样本对应的字向量样本和所述句子样本对应的情节阶段向量样本进行拼接,得到所述句子样本中每个字样本对应的拼接向量样本;所述每个字样本对应的拼接向量样本标注有每个字样本对应的关联标签;
[0032]将所述所述句子样本中每个字样本对应的拼接向量样本输入关联标签识别模型,得到所述关联标签识别模型输出的每个字样本对应的预测关联标签;其中,所述关联标签识别模型为所述情节要素抽取层模型中的子模型;
[0033]根据回归损失函数计算所述预测关联标签与标注的关联标签之间的损失,当所述损失满足收敛条件时,得到训练完成的关联标签识别模型。
[0034]可选的,所述由所述元素关系识别模型基于所述句子中每个元素实体对应的元素实体向量,对所述句子对应的元素实体进行元素关系的识别,以得到所述元素关系识别模型输出的所述句子中每个元素实体对应的元素关系之前,所述方法还包括:
[0035]获得故事片段样本的每个句子样本中的元素实体样本;所述元素实体样本标注有元素关系;
[0036]将所述元素实体样本输入元素关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种歌词生成方法,其特征在于,包括:获得故事片段文本;将所述故事片段文本输入预先训练的情节图抽取模型,由所述情节图抽取模型确定所述故事片段文本中每个句子对应的情节阶段、每个句子对应的元素实体和每个元素实体对应的元素关系,并基于所述每个元素实体对应的元素关系得到情节图后,得到所述情节图抽取模型输出的情节图;将所述情节图输入预先训练的歌词编解码模型,由所述歌词编解码模型对所述情节图进行歌词的编解码处理后,得到所述歌词编解码模型输出的所述故事片段文本对应的歌词。2.根据权利要求1所述的方法,其特征在于,所述情节图抽取模型包括BERT编码模型、情节阶段检测模型、情节元素抽取模型和元素关系识别模型;所述由所述情节图抽取模型确定所述故事片段文本中每个句子对应的情节阶段、每个情节阶段对应的元素实体和每个元素实体对应的元素关系,包括:由所述BERT编码模型对所述故事片段文本进行编码,以得到所述BERT编码层输出的所述故事片段文本中每个句子对应的句向量,及每个句子中每个字对应的字向量;由所述情节阶段检测模型基于每个句子对应的句向量,对每个句子进行情节阶段的检测,以得到所述情节阶段检测模型输出的每个句子对应的情节阶段,及每个情节阶段对应的情节阶段向量;针对每个句子,由所述情节要素抽取模型基于所述句子中每个字对应的字向量和所述句子对应的情节阶段向量,对所述句子进行元素实体的抽取,以得到所述情节要素抽取模型输出的所述句子对应的元素实体,及每个元素实体对应的元素实体向量;由所述元素关系识别模型基于所述句子中每个元素实体对应的元素实体向量,对所述句子对应的元素实体进行元素关系的识别,以得到所述元素关系识别模型输出的所述句子中每个元素实体对应的元素关系。3.根据权利要求2所述的方法,其特征在于,所述由所述情节要素抽取层模型基于所述句子中每个字对应的字向量和所述句子对应的情节阶段向量,对所述句子进行元素实体的抽取,以得到所述情节要素抽取层模型输出的所述句子对应的元素实体,及每个元素实体对应的元素实体向量,包括:由所述情节要素抽取层模型将所述句子中每个字对应的字向量和所述句子对应的情节阶段向量进行拼接,得到所述句子中每个字对应的拼接向量;基于所述每个字对应的拼接向量确定每个字对应的关联标签;基于所述每个字对应的关联标签确定字与字之间的关联关系,并根据所述关联关系得到所述句子对应的元素实体,及每个元素实体对应的元素实体向量。4.根据权利要求2所述的方法,其特征在于,所述由所述元素关系识别层模型基于所述句子中每个元素实体对应的元素实体向量,对所述句子对应的元素实体进行元素关系的识别,以得到所述元素关系识别层模型输出的所述句子中每个元素实体对应的元素关系,包括:针对所述句子中的每个元素实体,由所述元素关系识别层模型基于所述元素实体对应元素实体向量和所述句子对应的情节阶段向量得到所述元素实体对应的查询向量;
针对每个元素实体,基于所述元素实体对应的查询向量和所述句子中每个字对应的字向量,确定所述句子中每个字在所述元素实体维度上各自对应的注意力分数;将所述每个字在所述元素实体维度上各自对应的注意力分数和所述每个字对应的字向量进行加权求和,得到所述元素实体对应的融合特征向量,所述融合特征向量融合了元素实体信息和情节阶段类型信息的特征;基于所述元素实体对应的融合特征向量确定所述元素实体对应的元素关系。5.根据权利要求2所述的方法,其特征在于,所述由所述情节阶段检测模型基于每个句子对应的句向量,对每个句子进行情节阶段的检测,以得到所述情节阶段检测层模型输出的每个句子对应的情节阶段,及每个情节阶段对应的情节阶段向量之前,所述方法还包括:获得故事片段样本中每个句子样本对应的句向量样本;所述句向量样本标注有情节阶段;将所述句向量样本输入情节阶段检测模型,得到所述情节阶段检测模型输出的预测情节阶段;根据回归损失函数计算所述预测情节阶段与标注的情节阶段之间的损失,当所述损失满足收敛条件时,得到训练完成的情节阶段检测模型。6.根据权利要求2所述的方法,其特征在于,所述针对每个句子,由所述情节要...

【专利技术属性】
技术研发人员:王鸿立潘树燊周蓝珺杜嘉晨
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1