语音处理方法及装置制造方法及图纸

技术编号:28843233 阅读:28 留言:0更新日期:2021-06-11 23:42
提供一种语音处理方法及装置。该语音处理方法包括:获取语音信号的音素向量和声纹向量;基于所述语音信号的音素向量和声纹向量,获取所述语音信号的变声信号。根据本公开的语音处理方法及装置,可实现千人千面的变声效果。

【技术实现步骤摘要】
语音处理方法及装置
本公开涉及音视频
更具体地,本公开涉及一种语音处理方法及装置。
技术介绍
语音变声在短视频和直播场景下有着广泛应用。传统变声方法通过信号处理方法分析和改变语音的基频和共振峰达到变声的目的,虽然达到一定效果,但往往不够自然真实。
技术实现思路
本公开的示例性实施例在于提供一种语音处理方法及装置,以至少解决相关技术中的语音处理的问题,也可不解决任何上述问题。根据本公开的示例性实施例,提供一种语音处理方法,包括:获取语音信号的音素向量和声纹向量;基于所述语音信号的音素向量和声纹向量,获取所述语音信号的变声信号。可选地,获取语音信号的音素向量和声纹向量的步骤可包括:对所述语音信号进行特征提取,获得所述语音信号的特征向量;基于所述语音信号的特征向量对所述语音信号进行音素识别和声纹提取,分别获得所述语音信号的音素向量和声纹向量。可选地,基于所述语音信号的特征向量对所述语音信号进行声纹提取的步骤可包括:将所述语音信号的特征向量输入到声纹提取网络进行声纹提取,通过所述声纹提取网络获得所述语本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:/n获取语音信号的音素向量和声纹向量;/n基于所述语音信号的音素向量和声纹向量,获取所述语音信号的变声信号。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:
获取语音信号的音素向量和声纹向量;
基于所述语音信号的音素向量和声纹向量,获取所述语音信号的变声信号。


2.根据权利要求1所述的语音处理方法,其特征在于,获取语音信号的音素向量和声纹向量的步骤包括:
对所述语音信号进行特征提取,获得所述语音信号的特征向量;
基于所述语音信号的特征向量对所述语音信号进行音素识别和声纹提取,分别获得所述语音信号的音素向量和声纹向量。


3.根据权利要求2所述的语音处理方法,其特征在于,基于所述语音信号的特征向量对所述语音信号进行声纹提取的步骤包括:
将所述语音信号的特征向量输入到声纹提取网络进行声纹提取,通过所述声纹提取网络获得所述语音信号的声纹向量。


4.根据权利要求2所述的语音处理方法,其特征在于,基于所述语音信号的特征向量对所述语音信号进行音素识别的步骤包括:
将所述语音信号的特征向量输入到音素识别网络进行音素识别,通过所述音素识别网络获得所述语音信号的音素向量。


5.根据权利要求4所述的语音处理方法,其特征在于,音素向量中的每个元素表示所述语音信号的音素是相应音素的概率。


6.根据权利要求2所述的...

【专利技术属性】
技术研发人员:郑羲光张新李楠张晨
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1