模型训练、语音合成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:44879032 阅读:11 留言:0更新日期:2025-04-08 00:17
本发明专利技术提供一种模型训练、语音合成方法、装置、电子设备和存储介质,模型训练方法包括:获取生成模型输出的重建声学特征,并提取所述重建声学特征的重建周期性特征;将所述重建周期性特征输入至判别模型中,得到所述判别模型输出的所述重建周期性特征的真伪判别结果;基于所述真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,将训练所得的生成模型作为声学模型。本发明专利技术提供的方法、装置、电子设备和存储介质,显式地将能够反映音色的周期性特征作为优化目标,由此使得对抗训练使得的生成模型在应用于语音合成时,合成语音的音色自然度和逼真度更高。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种模型训练、语音合成方法、装置、电子设备和存储介质


技术介绍

1、随着人工智能技术的发展,语音合成已经从最初简单的文本到语音的转换(text-to-speech,tts)发展为侧重复杂情感表达和个性化音色生成的合成技术。如何准确重建和模仿特定音色,成为了语音合成技术的一个重要挑战。

2、由于每个人的发音习惯和语音特征都不尽相同,因此很难找到一种通用的方法来模拟所有的音色。即使能够模拟出特定的音色,也很难保证其自然度和真实感。目前的语音合成方案中通常是将音色、韵律、内容等信息混合一起进行约束训练,这也导致了音色重建的自然度不及预期。


技术实现思路

1、本专利技术提供一种模型训练、语音合成方法、装置、电子设备和存储介质,用以解决相关技术中语音合成的音色自然度不符合预期的缺陷。

2、本专利技术提供一种模型训练方法,包括:

3、获取生成模型输出的重建声学特征,并提取所述重建声学特征的重建周期性特征;

4、将所述重建周期性特征输入至判别本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的模型训练方法,其特征在于,所述提取所述重建声学特征的重建周期性特征,包括:

3.根据权利要求2所述的模型训练方法,其特征在于,所述多个周期成分为多个以质数为基础的周期成分。

4.根据权利要求2所述的模型训练方法,其特征在于,所述提取所述重建声学特征在多个周期成分下的重建周期性特征,包括:

5.根据权利要求1至4中任一项所述模型训练方法,其特征在于,所述基于所述真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,包括:

6.根据权利要求5所述的模型训练方法,其特...

【技术特征摘要】

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的模型训练方法,其特征在于,所述提取所述重建声学特征的重建周期性特征,包括:

3.根据权利要求2所述的模型训练方法,其特征在于,所述多个周期成分为多个以质数为基础的周期成分。

4.根据权利要求2所述的模型训练方法,其特征在于,所述提取所述重建声学特征在多个周期成分下的重建周期性特征,包括:

5.根据权利要求1至4中任一项所述模型训练方法,其特征在于,所述基于所述真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,包括:

6.根据权利要求5所述的模型训练方法,其特征在于,所述基于真实周期性特征的真伪判别结果、以及所述重建周期性特征的真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,包括:

...

【专利技术属性】
技术研发人员:童永生孟廷伍宏传
申请(专利权)人:安徽讯飞寰语科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1