当前位置: 首页 > 专利查询>中北大学专利>正文

一种演唱声音转换器制造技术

技术编号:23316762 阅读:42 留言:0更新日期:2020-02-11 18:24
本发明专利技术公开了一种演唱声音转换器,属于音乐器械技术领域。演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将演唱声音发送给音频识别系统;音频识别系统,用于通过预设神经网络模型识别演唱声音,确定演唱声音的声音特征,并将声音特征发送给即时合成器;即时合成器,用于从人声音色库中确定出目标人声音色库,并根据声音特征,调用目标人声音色库中的音色,合成新演唱声音,并将新演唱声音发送给播放器。本发明专利技术可以在用户演唱歌曲的同时,即时合成新演唱声音,减少了合成前的计算时间,加快了合成新演唱声音的速度,保证了合成的及时性。

A voice converter for singing

【技术实现步骤摘要】
一种演唱声音转换器
本专利技术涉及音乐器械
,特别涉及一种演唱声音转换器。
技术介绍
在音乐演唱中,同一首歌有不同的唱法,不同的人对同一首歌也有不同的情感表达,有时需要将一个人演唱的声音转换为另一个人演唱的声音,而有时需要将一个人演唱的声音转换成不同的声音版本(如美声唱法、民族唱法等)。现有技术中,变声器或变声软件往往是先采集并识别用户演唱声音的音频信号,然后再对识别到的音频信号进行处理,修改其音频特征,从而对识别到的音频信号进行转换,得到新的演唱声音。然而,上述转换均是通过对音频信号的改变,实现对演唱声音的改变,依然会保留原始演唱声音的音频特征,不能对演唱声音进行很好的处理,演唱声音转换的准确率较低;另外,上述转换均是先识别用户演唱声音的音频信号,然后再进行演唱声音的转换,也即将音频识别和声音转换分开处理,无法进行即时转换,演唱声音转换的效率较低。
技术实现思路
为了解决相关技术中演唱声音转换的准确率较低和效率较低的问题,本专利技术实施例提供了一种演唱声音转换器,所述演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;所述用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统;所述音频识别系统,用于通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,并将所述声音特征发送给所述即时合成器;所述即时合成器,用于从所述人声音色库中确定出目标人声音色库,并根据所述声音特征,调用所述目标人声音色库中的音色,合成新演唱声音,并将所述新演唱声音发送给所述播放器;所述播放器,用于实时播放所述新演唱声音。可选地,所述实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统,包括:每当检测到转换用户演唱歌曲的一个音频时,将所述一个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统;或者,当检测到转换用户演唱歌曲的预设数值个音频时,将所述预设数值个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统。可选地,所述通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,包括:将所述演唱声音输入所述预设神经网络模型,并将所述预设神经网络模型的输出确定为所述演唱声音的声音特征。可选地,所述通过预设神经网络模型识别所述演唱声音之前,还包括:获取演唱声音集,通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型。可选地,所述通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型,包括:标注所述演唱声音集中的各个演唱声音的声音特征;将所述演唱声音集中的各个演唱声音输入神经网络,根据所述神经网络的输出与标注的声音特征之间的差值,调整所述神经网络的参数;当所述演唱声音集中的各个演唱声音输入所述神经网络后,所述神经网络的输出均与标注的声音特征之间的差值小于预设参数阈值时,将所述神经网络确定为所述预设神经网络模型。可选地,所述声音特征包括音高和拼音,所述从人声音色库中确定出目标人声音色库之前,还包括:用户预先录制汉语的所有拼音组合的第一预设声调对应的音色;识别所述音色的音高是否为第一预设音高,如果所述音色的音高不是第一预设音高,则通过变速变调算法,将所述音色的音高调整为第一预设音高;根据所述音色的音高和拼音的声调,通过预设算法扩展出第二预设音高和第二预设声调的音色,并标记每个音色的音高和拼音,生成一个所述人声音色库。可选地,所述根据所述声音特征,调用目标人声音色库中的音色,合成新演唱声音,包括:在所述目标人声音色库中查找所述声音特征;当查找到所述声音特征时,调用所述声音特征对应的音色,合成新演唱声音。可选地,所述在所述目标人声音色库中查找所述声音特征之后,还包括:当无法查找到所述声音特征时,调用与所述声音特征相似度大于预设相似度阈值的音色,合成新演唱声音。可选地,所述在所述目标人声音色库中查找所述声音特征之后,还包括:当无法查找到所述声音特征时,返回合成失败信号,并提示用户更新所述目标人声音色库。本专利技术实施例提供的技术方案带来的有益效果是:在本专利技术实施例中使用目标人声音色库中的音色代替转换用户的演唱声音,即同源替换,并不是通过对音频信号的改变实现对演唱声音的改变,转换用户的演唱声音可以被彻底的过滤,提高了合成新演唱声音的准确率;另外,本专利技术中是预先生成覆盖所有拼音和音高的音色,不需要即时进行变速变调生成新的音色,因而在用户演唱歌曲的同时,可以即时调用预先生成的音色,即时合成新演唱声音,不需要等到用户演唱完毕,再进行合成,减少了合成前的计算时间,加快了合成新演唱声音的速度,即提高了合成新演唱声音的效率,保证了合成的及时性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种演唱声音转换器的结构框图;图2是本专利技术实施例提供的一种录制人声音色库的流程示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。为了便于理解,在对本专利技术实施例进行详细的解释说明之前,先对本专利技术实施例涉及的应用场景进行介绍。随着音乐器械技术的快速发展,人们经常会使用变声器或变声软件进行演唱声音转换。目前,变声器或变声软件往往是先采集并识别用户演唱声音的音频信号,然后再对识别到的音频信号进行处理,修改其音频特征,从而对识别到的音频信号进行转换,得到新的演唱声音,如此依然会保留原始演唱声音的音频特征,不能对演唱声音进行很好的处理,演唱声音转换的准确率较低,且由于是将音频识别和声音转换分开处理,无法进行即时转换,因而导致演唱声音转换的效率也较低。为此,本专利技术提供了一种演唱声音转换器,来提高演唱声音转换的准确率和效率。接下来将结合附图1-附图2对本专利技术实施例提供的演唱声音转换器进行详细介绍。图1是本专利技术实施例提供的一种演唱声音转换器的结构框图。参见图1,演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;其中,用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将该演唱声音发送给音频识别系统;音频识别系统,用于通过预设神经网络模型识别该演唱声音,确定该演唱声音的声音特征,并将该声音特征发送给即时合成器;即时合成器,用于从人声音色库中确定出目标人声音色库,并根据该声音特征,调用目标人声音色库中的音色,合成新演唱声音,并将该新演唱声音发送给播放器;播放器,用于实时播放该新演唱声音。进一步地,用户演唱系统实时检测转本文档来自技高网...

【技术保护点】
1.一种演唱声音转换器,其特征在于,所述演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;/n所述用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统;/n所述音频识别系统,用于通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,并将所述声音特征发送给所述即时合成器;/n所述即时合成器,用于从所述人声音色库中确定出目标人声音色库,并根据所述声音特征,调用所述目标人声音色库中的音色,合成新演唱声音,并将所述新演唱声音发送给所述播放器;/n所述播放器,用于实时播放所述新演唱声音。/n

【技术特征摘要】
1.一种演唱声音转换器,其特征在于,所述演唱声音转换器包括:用户演唱系统、音频识别系统、即时合成器、人声音色库和播放器;
所述用户演唱系统,用于实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统;
所述音频识别系统,用于通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,并将所述声音特征发送给所述即时合成器;
所述即时合成器,用于从所述人声音色库中确定出目标人声音色库,并根据所述声音特征,调用所述目标人声音色库中的音色,合成新演唱声音,并将所述新演唱声音发送给所述播放器;
所述播放器,用于实时播放所述新演唱声音。


2.根据权利要求1所述的演唱声音转换器,其特征在于,所述实时检测转换用户演唱歌曲的演唱声音,并将所述演唱声音发送给所述音频识别系统,包括:
每当检测到转换用户演唱歌曲的一个音频时,将所述一个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统;或者,
当检测到转换用户演唱歌曲的预设数值个音频时,将所述预设数值个音频确定为所述演唱声音,并将所述演唱声音发送给所述音频识别系统。


3.根据权利要求1所述的演唱声音转换器,其特征在于,所述通过预设神经网络模型识别所述演唱声音,确定所述演唱声音的声音特征,包括:
将所述演唱声音输入所述预设神经网络模型,并将所述预设神经网络模型的输出确定为所述演唱声音的声音特征。


4.根据权利要求1所述的演唱声音转换器,其特征在于,所述通过预设神经网络模型识别所述演唱声音之前,还包括:
获取演唱声音集,通过所述演唱声音集对神经网络的参数进行训练,得到所述预设神经网络模型。


5.根据权利要求4所述的演唱声音转换器,其特征在于,所述通过所述演唱声音集对神经网络的参数进行训练,...

【专利技术属性】
技术研发人员:杨宇娟王小侠曹鑫
申请(专利权)人:中北大学
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1