语音风格迁移方法、装置、设备及存储介质制造方法及图纸

技术编号:41879176 阅读:21 留言:0更新日期:2024-07-02 00:32
本发明专利技术涉及人工智能领域及金融科技领域,公开了语音风格迁移方法、装置、设备及存储介质,该方法包括:获取待合成文本的语音风格和样本音频数据的各个细粒度特征;对细粒度特征进行打分,得到各个细粒度特征的分值;对各个细粒度特征的分值进行归一化处理,确定各个细粒度特征的归一化权重值;基于风格迁移强度,对各个细粒度特征的归一化权重值进行修正,得到修正后的各个细粒度特征;获取待合成文本的音素序列,将音素序列输入至编码器中,得到音素编码特征;将音素编码特征以及修正后的各个细粒度特征进行融合处理,确定融合特征;对融合特征进行语音合成处理,生成符合风格迁移强度的合成语音。本发明专利技术有利于提高风格迁移的效率。

【技术实现步骤摘要】

本专利技术涉及人工智能领域及金融科技领域,尤其涉及语音风格迁移方法、装置、设备及存储介质


技术介绍

1、风格迁移是一种语音合成技术,它可以改变合成语音的声音特征,使得合成的语音听起来像是不同的人或不同的情感表达。随着深度学习技术的发展,系统的风格迁移已达到了高自然度、高可懂度的效果。系统可以是保险系统、银行系统、交易系统、订单系统。

2、然而,现有的语音风格迁移方法,无法生成符合风格迁移强度的合成语音,不利于提高风格迁移效率。其原因在于,现有的语音风格迁移方法只对参考音频或参考梅尔谱进行迁移,无法实现风格迁移强度可控的效果,因此,现有的语音风格迁移方法无法生成符合风格迁移强度的合成语音,不利于提高风格迁移效率。


技术实现思路

1、本专利技术提供一种语音风格迁移方法、装置、计算机设备及存储介质,以解决现有的语音风格迁移方法,无法生成符合风格迁移强度的合成语音,不利于提高风格迁移效率的技术问题。

2、第一方面,提供了一种语音风格迁移方法,包括:

3、获取待合成文本的语音风格和本文档来自技高网...

【技术保护点】

1.一种语音风格迁移方法,其特征在于,包括:

2.如权利要求1所述的语音风格迁移方法,其特征在于,在所述获取待合成文本的语音风格和样本音频数据的各个细粒度特征之前,所述语音风格迁移方法包括:

3.如权利要求1所述的语音风格迁移方法,其特征在于,所述采用预设的打分函数,对所述细粒度特征进行打分,得到各个所述细粒度特征的分值,包括:

4.如权利要求1所述的语音风格迁移方法,其特征在于,所述基于预设的风格迁移强度,对各个所述细粒度特征的归一化权重值进行修正,得到修正后的各个所述细粒度特征,包括:

5.如权利要求1所述的语音风格迁移方法,其特征在于...

【技术特征摘要】

1.一种语音风格迁移方法,其特征在于,包括:

2.如权利要求1所述的语音风格迁移方法,其特征在于,在所述获取待合成文本的语音风格和样本音频数据的各个细粒度特征之前,所述语音风格迁移方法包括:

3.如权利要求1所述的语音风格迁移方法,其特征在于,所述采用预设的打分函数,对所述细粒度特征进行打分,得到各个所述细粒度特征的分值,包括:

4.如权利要求1所述的语音风格迁移方法,其特征在于,所述基于预设的风格迁移强度,对各个所述细粒度特征的归一化权重值进行修正,得到修正后的各个所述细粒度特征,包括:

5.如权利要求1所述的语音风格迁移方法,其特征在于,所述获取所述待合成文本的音素序列,将所述音素序列输入至预设的语音合成模型的编码器中,得到所述编码器输出的所述待合成文本的音素编码特征,包括:

6.如权利要求1所...

【专利技术属性】
技术研发人员:郭洋王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1