说唱音乐自动生成方法及系统技术方案

技术编号:37378760 阅读:11 留言:0更新日期:2023-04-27 07:21
本申请公开了一种说唱音乐自动生成方法,该方法包括:获取输入的文本,根据分句分词技术得到所述文本的分句分词结果;根据伴奏音乐的节拍检测结果和所述分句分词结果向所述伴奏音乐的每个乐句中进行填词;根据填词结果使用语音合成技术得到每个分句的说唱语音音频;拼接每个所述说唱语音音频,并与所述伴奏音乐进行混音,输出最终的说唱结果。本申请还公开了一种说唱音乐自动生成系统、电子装置和计算机可读存储介质。由此,能够自动生成完全贴合的说唱音乐。的说唱音乐。的说唱音乐。

【技术实现步骤摘要】
说唱音乐自动生成方法及系统


[0001]本申请涉及语音处理
,尤其涉及一种说唱音乐自动生成方法、系统、电子装置及计算机可读存储介质。

技术介绍

[0002]随着嘻哈文化的发展,近年来说唱音乐在大众中得到普及,不少人受到说唱音乐年轻、活力、帅酷等特质的影响跃跃欲试。然而对于普通用户来说,说唱的节奏、韵律以及语音语调都难以把控。因此,自动说唱的技术,可以让每个喜爱说唱的用户都具有说唱的能力,而对于专业说唱歌手,也可以在一定程度上提供启示作用,并辅助其进行创作。
[0003]但是,当前的自动说唱技术无法完全与音乐的韵律和节奏做到完全贴合,并且不具备押韵能力,与人工创作的说唱音乐还存在很大的差距。

技术实现思路

[0004]本申请的主要目的在于提出一种说唱音乐自动生成方法、系统、电子装置及计算机可读存储介质,旨在解决如何提升自动生成的说唱音乐的效果的问题。
[0005]为实现上述目的,本申请实施例提供了一种说唱音乐自动生成方法,所述方法包括:
[0006]获取输入的文本,根据分句分词技术得到所述文本的分句分词结果;
[0007]根据伴奏音乐的节拍检测结果和所述分句分词结果向所述伴奏音乐的每个乐句中进行填词;
[0008]根据填词结果使用语音合成技术得到每个分句的说唱语音音频;
[0009]拼接每个所述说唱语音音频,并与所述伴奏音乐进行混音,输出最终的说唱结果。
[0010]可选地,所述方法在获取输入的文本之后还包括:
[0011]将所述文本转换为音素级别,并根据每种音素的统计结果确定韵脚;及
[0012]根据所述韵脚和分句分词技术,得到所述文本的所述分句分词结果。
[0013]可选地,所述根据每种音素的统计结果确定韵脚包括:
[0014]统计所述文本中每种音素出现的频率;
[0015]根据所述频率得到候选韵脚;
[0016]从所述候选韵脚中确定目标韵脚。
[0017]可选地,所述根据所述韵脚和分句分词技术得到所述文本的分句分词结果包括:
[0018]结合所述韵脚和分句技术,以及预设的字数限制,得到所述文本的分句结果;
[0019]使用分词技术对每个分句进行分词,得到分词结果。
[0020]可选地,所述根据伴奏音乐的节拍检测结果和所述分句分词结果向所述伴奏音乐的每个乐句中进行填词包括:
[0021]获取伴奏音乐,对所述伴奏音乐进行节拍检测,得到重拍和节拍信息;
[0022]获取所述伴奏音乐的每个乐句和对应的所述重拍和节拍信息,根据所述分句分词
结果中每个分句的字数向每个乐句中进行填词;
[0023]记录填词之后每个分句、每个字在所述伴奏音乐中的位置。
[0024]可选地,所述根据所述分句分词结果中每个分句的字数向每个乐句中进行填词包括:
[0025]针对一个分句中的第一个分词为单数词的情形,在填词时从反拍进入。
[0026]可选地,所述根据所述分句分词结果中每个分句的字数向每个乐句中进行填词包括:
[0027]将三个字的分词设定位三连音。
[0028]可选地,所述根据所述分句分词结果中每个分句的字数向每个乐句中进行填词包括:
[0029]在所述分句的字数超过第一预设字数的情形下,为所述分句中的多字数分词添加复杂节奏型。
[0030]可选地,所述根据所述分句分词结果中每个分句的字数向每个乐句中进行填词包括:
[0031]在所述分句的字数超过第二预设字数的情形下,向前一个乐句借拍。
[0032]可选地,所述根据填词结果使用语音合成技术得到每个分句的说唱语音音频包括:
[0033]根据填词结果确定每个分句中每个字的时长,以及每个分句基于乐句的开始位置;
[0034]根据所述每个字的时长和每个分句的开始位置,使用语音合成技术将所述文本中的每个分句转换为对应时长的说唱语音音频。
[0035]可选地,所述方法在输出最终的说唱结果之前还包括:
[0036]对混音结果中的语音进行美化处理。
[0037]此外,为实现上述目的,本申请实施例还提供一种说唱音乐自动生成系统,所述系统包括:
[0038]分句模块,用于获取输入的文本,根据分句分词技术得到所述文本的分句分词结果;
[0039]填词模块,用于根据伴奏音乐的节拍检测结果和所述分句分词结果向所述伴奏音乐的每个乐句中进行填词;
[0040]合成模块,用于根据填词结果使用语音合成技术得到每个分句的说唱语音音频;
[0041]混音模块,用于拼接每个所述说唱语音音频,并与所述伴奏音乐进行混音,输出最终的说唱结果。
[0042]为实现上述目的,本申请实施例还提供一种电子装置,所述电子装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的说唱音乐自动生成程序,所述说唱音乐自动生成程序被所述处理器执行时实现如上述的说唱音乐自动生成方法。
[0043]为实现上述目的,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有说唱音乐自动生成程序,所述说唱音乐自动生成程序被处理器执行时实现如上述的说唱音乐自动生成方法。
[0044]本申请实施例提出的说唱音乐自动生成方法、系统、电子装置及计算机可读存储
介质,能够结合韵脚识别技术、分词分句技术、音乐卡点技术、自动Flow算法和语音合成技术,根据输入的文本和伴奏音乐自动生成完全贴合的说唱音乐,并且实现分句自动押韵。
附图说明
[0045]图1为实现本申请各个实施例的一种应用环境架构图;
[0046]图2为本申请第一实施例提出的一种说唱音乐自动生成方法的流程图;
[0047]图3为图2中步骤S202的细化流程示意图;
[0048]图4为图2中步骤S204的细化流程示意图;
[0049]图5为本申请第一实施例中一些常用的节奏型的示意图;
[0050]图6为图2中步骤S206的细化流程示意图;
[0051]图7为图2中步骤S208的细化流程示意图;
[0052]图8为本申请第二实施例提出的一种说唱音乐自动生成方法的流程图;
[0053]图9为图8中步骤S300的细化流程示意图;
[0054]图10为图8中步骤S302的细化流程示意图;
[0055]图11为本申请第二实施例的所述说唱音乐自动生成方法的另一种形式的流程示意图;
[0056]图12为本申请第三实施例提出的一种电子装置的硬件架构示意图;
[0057]图13为本申请第四实施例提出的一种说唱音乐自动生成系统的模块示意图;
[0058]图14为本申请第五实施例提出的一种说唱音乐自动生成系统的模块示意图。
具体实施方式
[0059]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种说唱音乐自动生成方法,其特征在于,所述方法包括:获取输入的文本,根据分句分词技术得到所述文本的分句分词结果;根据伴奏音乐的节拍检测结果和所述分句分词结果向所述伴奏音乐的每个乐句中进行填词;根据填词结果使用语音合成技术得到每个分句的说唱语音音频;拼接每个所述说唱语音音频,并与所述伴奏音乐进行混音,输出最终的说唱结果。2.根据权利要求1所述的说唱音乐自动生成方法,其特征在于,所述方法在获取输入的文本之后还包括:将所述文本转换为音素级别,并根据每种音素的统计结果确定韵脚;及根据所述韵脚和分句分词技术,得到所述文本的所述分句分词结果。3.根据权利要求2所述的说唱音乐自动生成方法,其特征在于,所述根据每种音素的统计结果确定韵脚包括:统计所述文本中每种音素出现的频率;根据所述频率得到候选韵脚;从所述候选韵脚中确定目标韵脚。4.根据权利要求2所述的说唱音乐自动生成方法,其特征在于,所述根据所述韵脚和分句分词技术得到所述文本的分句分词结果包括:结合所述韵脚和分句技术,以及预设的字数限制,得到所述文本的分句结果;使用分词技术对每个分句进行分词,得到分词结果。5.根据权利要求1或2所述的说唱音乐自动生成方法,其特征在于,所述根据伴奏音乐的节拍检测结果和所述分句分词结果向所述伴奏音乐的每个乐句中进行填词包括:获取伴奏音乐,对所述伴奏音乐进行节拍检测,得到重拍和节拍信息;获取所述伴奏音乐的每个乐句和对应的所述重拍和节拍信息,根据所述分句分词结果中每个分句的字数向每个乐句中进行填词;记录填词之后每个分句、每个字在所述伴奏音乐中的位置。6.根据权利要求5所述的说唱音乐自动生成方法,其特征在于,所述根据所述分句分词结果中每个分句的字数向每个乐句中进行填词包括:针对一个分句中的第一个分词为单数词的情形,在填词时从反拍进入。7.根据权利要求5所述的说唱音乐自动生成方法,其特征在于,所述根据所述分句分词结果中每个分句的字数向每个乐句中进行填词包括:将三个字的分词设定位三...

【专利技术属性】
技术研发人员:请求不公布姓名徐嘉城舒景辰
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1