【技术实现步骤摘要】
本专利技术主要涉及音色转换领域,尤其涉及一种语音音色转换中的节奏控制方法、电子设备和存储介质。
技术介绍
1、对于零样本语音转换任务,通常直接使用一句目标人的语音作为参考,来生成关于这个人音色的语音。然而,很多语音转换任务只关注音色的转换是否够好,并没有考虑到转换后的语音是否保持了原来的节奏。保持语音原来的节奏在很多场景是非常重要的。比如在线直播或者是视频场景,我们是需要保持转换后的语音与说话人嘴部的动作和身体的动作是要同步的。也就是要保持原本说话人的节奏。
技术实现思路
1、有鉴于现有技术不关注转换后的语音是否保持了原来的节奏,本专利技术所要解决的技术问题包括:
2、如何设计一种语音音色转换中的节奏控制方法,从而保持原本说话人的节奏。
3、为实现上述目的,本专利技术提供了一种语音音色转换中的节奏控制方法,包括,获取源语音的源语音语义向量和源语音梅尔谱;
4、对源语音进行扰动后,获取源语音的源语音节奏向量;
5、获取参考语音的参考语音语义向量
...【技术保护点】
1.一种语音音色转换中的节奏控制方法,其特征在于:包括,
2.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于:所述获取源语音的源语音语义向量,具体为:
3.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述对源语音进行扰动,具体为:
4.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述获取扰动后的源语音的节奏向量,具体为:
5.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述获取源语音的源语音梅尔谱,具体为:
6.根据权利要求1所述的语音音色转
...【技术特征摘要】
1.一种语音音色转换中的节奏控制方法,其特征在于:包括,
2.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于:所述获取源语音的源语音语义向量,具体为:
3.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述对源语音进行扰动,具体为:
4.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述获取扰动后的源语音的节奏向量,具体为:
5.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述获取源语音的源语音梅尔谱,具体为:
6.根据权利要求1所述的语音音色转换中的节奏控制方法,其特征在于,所述获取参考语音的源语音梅尔谱,具体为:
7.根据权利...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。