数据处理方法、计算机设备及计算机可读存储介质技术

技术编号:37582154 阅读:18 留言:0更新日期:2023-05-15 07:56
本申请实施例提供了一种数据处理方法、计算机设备及计算机可读存储介质,其中方法包括:获取目标曲谱和目标曲谱对应的目标风格序列;其中,所述目标风格序列用于指示预测的基频的风格特征,所述目标风格序列是根据风格参数确定的,所述风格参数包括抖动频率和/或抖动幅度;对目标曲谱进行解析处理,得到目标曲谱的音高序列和音素序列;并根据音高序列、音素序列和目标风格序列进行基频预测处理,得到目标曲谱对应的目标基频序列;该目标基频序列用于指示演唱者的演唱旋律。通过本申请实施例可以直接根据曲谱生成曲谱的基频序列,且风格序列的加入使得基频序列更加符合真实情况。序列的加入使得基频序列更加符合真实情况。序列的加入使得基频序列更加符合真实情况。

【技术实现步骤摘要】
数据处理方法、计算机设备及计算机可读存储介质


[0001]本申请涉及计算机
,尤其涉及数据处理方法、计算机设备及计算机可读存储介质。

技术介绍

[0002]随着音乐应用的普及,歌声合成技术也越来越受到关注。歌声合成技术是根据曲谱信息合成接近真人演唱的歌声音频的技术。
[0003]在歌声合成时,基频曲线和能量曲线通常决定了合成歌声的音高和唱功水平,是歌声合成的关键信息。其中,能量曲线包含音量信息,决定歌声的强弱;基频曲线包含音高信息,是决定歌声是否跑调的关键因素,基频曲线通常是根据基频序列生成的,但如何生成基频序列是有待解决的问题。

技术实现思路

[0004]本申请实施例提供了一种数据处理方法、计算机设备及计算机可读存储介质,可以直接根据曲谱生成曲谱的基频序列,且风格序列的加入使得基频序列更加符合真实情况。
[0005]一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
[0006]获取目标曲谱和所述目标曲谱对应的目标风格序列;其中,所述目标风格序列用于指示预测的基频的风格特征,所述目标风格序列是根据风格参数确定的,所述风格参数包括抖动频率和/或抖动幅度;
[0007]对所述目标曲谱进行解析处理,得到所述目标曲谱的音高序列和音素序列;
[0008]根据所述音高序列、所述音素序列和所述目标风格序列进行基频预测处理,得到所述目标曲谱对应的目标基频序列;所述目标基频序列用于指示演唱者的演唱旋律。
[0009]一方面,本申请实施例提供了一种数据处理装置,所述装置包括:
[0010]获取单元,用于获取目标曲谱和所述目标曲谱对应的目标风格序列;其中,所述目标风格序列用于指示预测的基频的风格特征,所述目标风格序列是根据风格参数确定的,所述风格参数包括抖动频率和/或抖动幅度;
[0011]处理单元,用于对所述目标曲谱进行解析处理,得到所述目标曲谱的音高序列和音素序列;
[0012]所述处理单元,还用于根据所述音高序列、所述音素序列和所述目标风格序列进行基频预测处理,得到所述目标曲谱对应的目标基频序列;所述目标基频序列用于指示演唱者的演唱旋律。
[0013]一方面,本申请实施例提供了一种计算机设备,包括:处理器和存储器,所述存储器存储有可执行程序代码,所述处理器用于调用所述可执行程序代码,实现本申请实施例提供的数据处理方法。
[0014]相应地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储
介质中存储有指令,当其在计算机上运行时,使得计算机实现本申请实施例提供的数据处理方法。
[0015]相应地,本申请实施例还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备实现本申请实施例提供的数据处理方法。
[0016]本申请中,首先获取目标曲谱和目标曲谱对应的目标风格序列,该目标风格序列用于指示预测的基频的风格特征,且该目标风格序列是根据风格参数确定的,而风格参数包括抖动频率和/或抖动幅度;对目标曲谱进行解析处理,得到目标曲谱的音高序列和音素序列,并根据音高序列、音素序列和目标风格序列进行基频预测处理,得到用于指示演唱者的演唱旋律的目标基频序列。本申请提供的数据处理方法,可以直接根据曲谱进行预测得到对应的基频序列,且由于在预测过程中加入了包含抖动频率和/或抖动幅度的风格序列,因此预测得到的基频序列中包含了合理的抖动,这使得基频序列更加符合真实情况。
附图说明
[0017]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本申请实施例提供的数据处理方法适用的系统架构示意图;
[0019]图2是本申请实施例提供的一种数据处理方法的流程示意图;
[0020]图3是本申请实施例提供的一种曲谱的示意图;
[0021]图4是本申请实施例提供的一种模型训练方法的流程示意图;
[0022]图5是本申请实施例提供的一种风格参数获取方法的流程示意图;
[0023]图6是本申请实施例提供的一种确定风格参数方法的示意图;
[0024]图7是本申请实施例提供的一种基频预测模型的结构示意图;
[0025]图8是本申请实施例提供的一种数据处理装置的结构示意图;
[0026]图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
[0027]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]需要说明的是,本申请实施例中所涉及到的“第一”、“第二”等描述仅用于描述目的,而不能理解为指示或者暗示其相对重要性或者隐含指明所指示的技术特征的数量。因此,限定有“第一”、“第二”的技术特征可以明示或者隐含的包括至少一个该特征。
[0029]歌声合成技术是指,利用计算机程序合成接近真人演唱的歌声语音的技术。在合成歌声语音的过程中,通常需要输入曲谱、基频曲线以及其他参数。曲谱是记录歌词和音高
等信息的各种书面符号的有规律组合。基频曲线是组成歌唱语音的多个频率不同的正弦波中频率最低的正弦波,基频曲线决定旋律,也是判断歌声跑调与否的关键因素,而基频曲线是根据基频序列得到的。
[0030]基于此,本申请实施例提供了一种数据处理方法,可以直接根据曲谱和风格序列预测得到细节丰富的基频序列,且该基频序列与真实情况更加相似。本申请实施例提供的数据处理方法,可以应用于人工智能领域。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0031]本申请实施例提供的数据处理方法可以图1所述的数据处理设备101实现。在数据处理设备101进行基频序列预测处理的过程中,首先获取曲谱和曲谱对应的风格序列,这个风格序列用于指示预测基频的风格特征。该风格序列是根据风格参数确定的,而风格参数包括抖动频率和/或抖动幅度。然后,对曲谱进行解析处理,得到曲谱的音高序列和音素序列。最后根据音高序列、音素序列和风格序列进行基频预测处理,得到曲谱对应的基频序列。该基频序列用于指示演唱者的演唱旋律。根据曲谱预测得到的基频序列包含了风格特征,因此基频序列能够体现更多歌声细节,这使得基频序列更加真实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取目标曲谱和所述目标曲谱对应的目标风格序列;其中,所述目标风格序列是根据风格参数确定的,所述风格参数包括抖动频率和/或抖动幅度;对所述目标曲谱进行解析处理,得到所述目标曲谱的音高序列和音素序列;根据所述音高序列、所述音素序列和所述目标风格序列进行基频预测处理,得到所述目标曲谱对应的目标基频序列;所述目标基频序列用于指示演唱者的演唱旋律。2.根据权利要求1所述的方法,其特征在于,所述根据所述音高序列、所述音素序列和所述目标风格序列进行基频预测处理,得到所述目标曲谱对应的目标基频序列,包括:调用目标基频预测模型对所述音高序列、所述音素序列和所述目标风格序列进行处理,得到所述目标曲谱对应的目标基频序列;其中,所述目标基频预测模型是根据样本数据训练得到,所述样本数据包括样本音高序列、样本音素序列、样本风格序列和样本基频序列;所述样本音高序列和所述样本音素序列是根据样本曲谱的解析结果确定的,所述样本风格序列是根据所述样本音高序列和所述样本基频序列确定的,所述样本基频序列是根据所述样本曲谱对应的样本歌声数据的基频确定的;所述目标基频预测模型是根据第一损失参数和第二损失参数对初始基频预测模型进行模型参数调整得到,所述第一损失参数是根据所述样本基频序列和预测基频序列确定的,所述预测基频序列是调用所述初始基频预测模型对所述样本音高序列、样本音素序列和样本风格序列进行处理得到,所述第二损失参数是根据所述样本风格序列和预测风格序列确定的,所述预测风格序列是根据所述样本音高序列和所述预测基频序列确定的。3.根据权利要求2所述的方法,其特征在于,所述目标基频预测模型包括卷积模块、编码模块和解码模块;所述调用目标基频预测模型对所述音高序列、所述音素序列和所述目标风格序列进行处理,得到所述目标曲谱对应的目标基频序列,包括:将所述音高序列、所述音素序列和所述目标风格序列分别输入所述目标基频预测模型,由所述卷积模块对所述音高序列、所述音素序列和所述目标风格序列分别进行卷积处理,并对所述音高序列、所述音素序列和所述目标风格序列分别对应的卷积处理结果进行融合处理,得到第一特征序列;由所述编码模块对所述第一特征序列进行编码处理,得到编码特征序列,并由所述解码模块对所述编码特征序列进行解码处理,得到解码特征序列;将所述解码特征序列与所述音高序列进行融合处理,得到所述目标曲谱对应的目标基频序列。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述样本曲谱对应的样本歌声数据进行分帧处理,得到多帧歌声音频;对所述多帧歌声音频中每一帧歌声音频进行基频提取处理,得到所述每一帧歌声音频所对应的基频值;根据所述每一帧歌声音频对应的播放时间的先后顺序,对所述每一帧歌声音频所对应的基频值进行排列处理,得到参考基频序列;根据所述参考基频序列确定所述样本基频序列。5.根据权利要求4所述的方法,其特征在于,所述根据所述参考基频序列确定所述样本
基频序列,包括:将所述参考基频序列确定为所述样本基频序列;或者,对所述参考...

【专利技术属性】
技术研发人员:庄晓滨
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1