一种变声控制方法、装置、设备、存储介质及产品制造方法及图纸

技术编号:36602003 阅读:19 留言:0更新日期:2023-02-04 18:17
本申请实施例提供了一种变声控制方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过将待转换语音信息输入到音色转换模型中,由音色转换模型将待转换语音信息的基频特征和语义特征,以及设定的音色特征进行结合得到语音特征,并对语音特征进行变声处理得到目标语音信息,通过将与待转换语音信息的语气语调相关的基频特征与语义特征以及音色特征进行结合,提升语气语调转换的自然度,提高变声音频与原始音频的相似度,有效提高变声效果。效果。效果。

【技术实现步骤摘要】
一种变声控制方法、装置、设备、存储介质及产品


[0001]本申请实施例涉及音频处理
,尤其涉及一种变声控制方法、装置、设备、存储介质及产品。

技术介绍

[0002]随着音频处理技术的发展,对音频的处理方式也越来越丰富,例如对原始音频进行音色转换处理得到不同音色的音频。音色转换广泛运用于音频内容生成、娱乐音频制作和保密通话等场景。
[0003]目前变声控制一般是通过两个编码器网络提取原始音频的音色信息和语义信息,再通过声学模型重构出声学特征,进而通过声码器将声学特征合成语音波形。但是这种变声控制方式对音色信息和语义信息的解耦效果较差,容易丢失原始音频的语气语调等特征,变声音频与原始音频的相似度较低,变声效果较差。

技术实现思路

[0004]本申请实施例提供一种变声控制方法、装置、设备、存储介质及产品,以解决相关技术中的变声控制方式容易出现变声音频与原始音频的相似度较低,变声效果较差的技术问题,提高变声音频与原始音频的相似度,有效提高变声效果。
[0005]在第一方面,本申请实施例提供了一种变声控制方法,包括:本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种变声控制方法,其特征在于,包括:获取待转换语音信息;将所述待转换语音信息输入至设定的音色转换模型,通过所述音色转换模型基于所述待转换语音信息的基频特征和语义特征,以及设定的音色特征进行结合得到语音特征,并对所述语音特征进行变声处理,以得到目标语音信息。2.根据权利要求1所述的变声控制方法,其特征在于,所述音色转换模型包括基频提取网络、语音识别网络、音色映射网络以及声学模型网络,所述音色转换模型在基于所述待转换语音信息的基频特征和语义特征,以及设定的音色特征进行结合得到语音特征时,包括:通过所述基频提取网络提取所述待转换语音信息的基频特征;通过所述语音识别网络提取所述待转换语音信息的语义特征;通过所述音色映射网络,基于目标音色标识确定设定的音色特征;通过所述声学模型网络将所述待转换语音信息的基频特征和语义特征,以及设定的音色特征进行结合得到语音特征。3.根据权利要求2所述的变声控制方法,其特征在于,所述基频提取网络在提取所述待转换语音信息的基频特征时,包括:提取所述待转换语音信息的基频特征,并对所述待转换语音信息的基频特征进行高斯标准化处理。4.根据权利要求3所述的变声控制方法,其特征在于,所述基频提取网络在对所述待转换语音信息的基频特征进行高斯标准化处理时,包括:确定所述待转换语音信息的基频特征对应的第一基频均值和第一基频标准差,以及目标音色的基频特征对应的第二基频均值和第二基频标准差;基于所述第一基频均值、所述第一基频标准差、所述第二基频均值和所述第二基频标准差对所述待转换语音信息的基频特征进行高斯标准化处理。5.根据权利要求4所述的变声控制方法,其特征在于,所述基频提取网络在基于所述第一基频均值、所述第一基频标准差、所述第二基频均值和所述第二基频标准差对所述待转换语音信息的基频特征...

【专利技术属性】
技术研发人员:徐雯马东鹏项伟
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1