本公开关于一种声音处理方法、装置、电子设备及存储介质。所述声音处理方法包括:获取与演唱内容对应的人声信号;获取与所述演唱内容对应的歌曲的调性;根据所述调性对所述人声信号进行处理,以调整所述人声信号的音高。以调整所述人声信号的音高。以调整所述人声信号的音高。
【技术实现步骤摘要】
声音处理方法、装置、电子设备及存储介质
[0001]本公开涉及信号处理领域,尤其涉及一种声音处理方法、装置、电子设备及存储介质。
技术介绍
[0002]随着电子音乐的兴起,大众对音乐的审美也在潜移默化中发生改变。已经有不少歌手在创作中,融入了电子音乐的元素来烘托音乐氛围,打破固有流行音乐的传统编曲套路。人声电音也是音乐电子化的一种表现,经过电音化人声变得更加华丽突出,更加引人瞩目,尤其在音高衔接部分会有非常鲜明的电子效果,另外也可以改善人声跑调、破音、气息不稳导致的颤音等问题。然而,为了获得人声的电音效果,通常需要混音师们通过一些音频插件(如wave-tune、Melodyne)手动对采集的人声音高进行修正,而这会耗费大量的人力和时间成本,给期望获得电音效果的用户带来不便。
技术实现思路
[0003]本公开提供一种声音处理方法、装置、电子设备及存储介质,以至少解决相关技术中的产生电音效果耗费大量人力和时间成本而给用户带来不便的问题。本公开的技术方案如下:
[0004]根据本公开实施例的第一方面,提供了一种声音处理方法,所述声音处理方法包括:获取与演唱内容对应的人声信号;获取与所述演唱内容对应的歌曲的调性;根据所述调性对所述人声信号进行处理,以调整所述人声信号的音高。
[0005]可选地,所述根据所述调性对所述人声信号进行处理,包括:获得所述人声信号的基频序列,并根据所述基频序列确定所述人声信号的音高;确定所述调性下各音阶的音高;基于所述基频序列、所述人声信号的音高以及所述调性下各音阶的音高,对所述人声信号进行处理。
[0006]可选地,所述获取与演唱内容对应的人声信号,包括:获取声音信号,并在所述声音信号中检测所述人声信号,其中,所述在所述声音信号中检测所述人声信号,包括:利用获取的声音信号的短时平均能量和短时过零率检测所述人声信号,或者利用人声检测模型检测所述人声信号。
[0007]可选地,所述利用获取的声音信号的短时平均能量和短时过零率检测所述人声信号,包括:计算所述声音信号的短时平均能量和短时过零率;根据短时平均能量检测出所述声音信号中的浊音,并根据过零率检测出所述声音信号中的清音;将由检测到的浊音和清音组成的声音信号作为所述人声信号。
[0008]可选地,所述获得所述人声信号的基频序列,包括:将所述人声信号划分为多个音频帧;计算所述人声信号中的各音频帧对应的自相关系数;基于计算出的自相关系数确定各音频帧的基频,以构成所述基频序列。
[0009]可选地,所述基于计算出的自相关系数确定各音频帧的基频,包括:基于计算出的
自相关系数确定各音频帧的周期,并根据所述周期与所述人声信号的采样率之间的关系确定各音频帧的基频。
[0010]可选地,所述根据所述基频序列确定所述人声信号的音高,包括:将所述基频序列中的各音频帧的基频转换为midi音高,作为所述人声信号中各音频帧的音高。
[0011]可选地,所述基于所述基频序列、所述人声信号的音高以及所述调性下各音阶的音高,对所述人声信号进行处理,包括:将所述人声信号的每个音频帧的音高与所述调性下各音阶的音高进行比较,并将各音阶的音高之中的与所述每个音频帧的音高最接近的音高确定为所述每个音频帧的目标音高;根据所述每个音频帧的目标音高所对应的基频以及所述基频序列中的所述每个音频帧的基频对所述人声信号进行处理。
[0012]可选地,所述根据所述每个音频帧的目标音高所对应的基频以及所述基频序列中的所述每个音频帧的基频对所述人声信号进行处理,包括:计算所述每个音频帧的目标音高所对应的基频与所述基频序列中的所述每个音频帧的基频之间的比值,并根据所述比值对所述人声信号中的所述每个音频帧进行处理。
[0013]可选地,所述根据所述比值对所述人声信号中的所述每个音频帧进行处理,包括:根据邻近所述每个音频帧的先前的至少一部分音频帧的目标音高所对应的基频与所述至少一部分音频帧的基频之间的比值,调整所述每个音频帧的目标音高所对应的基频与所述每个音频帧的基频之间的比值;根据调整后的比值改变所述每个音频帧的基频。
[0014]可选地,所述根据调整后的比值改变所述每个音频帧的基频,包括:根据调整后的比值,利用相位声码器改变所述每个音频帧的基频。
[0015]可选地,所述声音处理方法还包括:对处理后的人声信号应用预定音频效果,并且将应用音频效果后的人声信号与对应的伴奏进行组合。
[0016]可选地,所述声音处理方法还包括:对组合后的信号进行限幅处理。
[0017]根据本公开实施例的第二方面,提供了一种声音处理装置,所述声音处理装置可包括:人声信号获取单元,被配置为获取与演唱内容对应的人声信号;调性获取单元,被配置为获取与所述演唱内容对应的歌曲的调性;人声信号处理单元,被配置为根据所述调性对所述人声信号进行处理,以调整所述人声信号的音高。
[0018]可选地,所述根据所述调性对所述人声信号进行处理,包括:获得所述人声信号的基频序列,并根据所述基频序列确定所述人声信号的音高;确定所述调性下各音阶的音高;基于所述基频序列、所述人声信号的音高以及所述调性下各音阶的音高,对所述人声信号进行处理。
[0019]可选地,所述获取与演唱内容对应的人声信号,包括:获取声音信号,并在所述声音信号中检测所述人声信号,其中,所述在所述声音信号中检测所述人声信号,包括:利用获取的声音信号的短时平均能量和短时过零率检测所述人声信号,或者利用人声检测模型检测所述人声信号。
[0020]可选地,所述利用获取的声音信号的短时平均能量和短时过零率检测所述人声信号,包括:计算所述声音信号的短时平均能量和短时过零率;根据短时平均能量检测出所述声音信号中的浊音,并根据过零率检测出所述声音信号中的清音;将由检测到的浊音和清音组成的声音信号作为所述人声信号。
[0021]可选地,所述获得所述人声信号的基频序列,包括:将所述人声信号划分为多个音
频帧;计算所述人声信号中的各音频帧对应的自相关系数;基于计算出的自相关系数确定各音频帧的基频,以构成所述基频序列。
[0022]可选地,所述基于计算出的自相关系数确定各音频帧的基频,包括:基于计算出的自相关系数确定各音频帧的周期,并根据所述周期与所述人声信号的采样率之间的关系确定各音频帧的基频。
[0023]可选地,所述根据所述基频序列确定所述人声信号的音高,包括:将所述基频序列中的各音频帧的基频转换为midi音高,作为所述人声信号中各音频帧的音高。
[0024]可选地,所述基于所述基频序列、所述人声信号的音高以及所述调性下各音阶的音高,对所述人声信号进行处理,包括:将所述人声信号的每个音频帧的音高与所述调性下各音阶的音高进行比较,并将各音阶的音高之中的与所述每个音频帧的音高最接近的音高确定为所述每个音频帧的目标音高;根据所述每个音频帧的目标音高所对应的基频以及所述基频序列中的所述每个音频帧的基频对所述人声信号进行处理。
[0025]可选地,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种声音处理方法,其特征在于,包括:获取与演唱内容对应的人声信号;获取与所述演唱内容对应的歌曲的调性;根据所述调性对所述人声信号进行处理,以调整所述人声信号的音高。2.如权利要求1所述的声音处理方法,其特征在于,所述根据所述调性对所述人声信号进行处理,包括:获得所述人声信号的基频序列,并根据所述基频序列确定所述人声信号的音高;确定所述调性下各音阶的音高;基于所述基频序列、所述人声信号的音高以及所述调性下各音阶的音高,对所述人声信号进行处理。3.如权利要求2所述的声音处理方法,其特征在于,所述基于所述基频序列、所述人声信号的音高以及所述调性下各音阶的音高,对所述人声信号进行处理,包括:将所述人声信号的每个音频帧的音高与所述调性下各音阶的音高进行比较,并将各音阶的音高之中的与所述每个音频帧的音高最接近的音高确定为所述每个音频帧的目标音高;根据所述每个音频帧的目标音高所对应的基频以及所述基频序列中的所述每个音频帧的基频对所述人声信号进行处理。4.如权利要求3所述的声音处理方法,其特征在于,其特征在于,所述根据所述每个音频帧的目标音高所对应的基频以及所述基频序列中的所述每个音频帧的基频对所述人声信号进行处理,包括:计算所述每个音频帧的目标音高所对应的基频与所述基频序列中的所述每个音频帧的基频之间的比值,并根据所述比值对所述人声信号中的所述每个音频帧进行处理。5.如权利要求4所述的声音处理方法,其特征在于,所述根据所述比值对所述人声信号中的所述每个音频帧进行处理,包括:根据邻近所述每个音频帧的先前的至少一部分音频帧的目...
【专利技术属性】
技术研发人员:范欣悦,张晨,李楠,郑羲光,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。