【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种模型训练、语音合成方法、装置、电子设备和存储介质。
技术介绍
1、随着人工智能技术的发展,语音合成已经从最初简单的文本到语音的转换(text-to-speech,tts)发展为侧重复杂情感表达和个性化音色生成的合成技术。如何准确重建和模仿特定音色,成为了语音合成技术的一个重要挑战。
2、由于每个人的发音习惯和语音特征都不尽相同,因此很难找到一种通用的方法来模拟所有的音色。即使能够模拟出特定的音色,也很难保证其自然度和真实感。目前的语音合成方案中通常是将音色、韵律、内容等信息混合一起进行约束训练,这也导致了音色重建的自然度不及预期。
技术实现思路
1、本专利技术提供一种模型训练、语音合成方法、装置、电子设备和存储介质,用以解决相关技术中语音合成的音色自然度不符合预期的缺陷。
2、本专利技术提供一种模型训练方法,包括:
3、获取生成模型输出的重建声学特征,并提取所述重建声学特征的重建周期性特征;
4、将所述重建
...【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的模型训练方法,其特征在于,所述提取所述重建声学特征的重建周期性特征,包括:
3.根据权利要求2所述的模型训练方法,其特征在于,所述多个周期成分为多个以质数为基础的周期成分。
4.根据权利要求2所述的模型训练方法,其特征在于,所述提取所述重建声学特征在多个周期成分下的重建周期性特征,包括:
5.根据权利要求1至4中任一项所述模型训练方法,其特征在于,所述基于所述真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,包括:
6.根据权利要求5所述
...【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的模型训练方法,其特征在于,所述提取所述重建声学特征的重建周期性特征,包括:
3.根据权利要求2所述的模型训练方法,其特征在于,所述多个周期成分为多个以质数为基础的周期成分。
4.根据权利要求2所述的模型训练方法,其特征在于,所述提取所述重建声学特征在多个周期成分下的重建周期性特征,包括:
5.根据权利要求1至4中任一项所述模型训练方法,其特征在于,所述基于所述真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,包括:
6.根据权利要求5所述的模型训练方法,其特征在于,所述基于真实周期性特征的真伪判别结果、以及所述重建周期性特征的真伪判别结果,对所述生成模型和所述判别模型进行对抗训练,包括:
...
【专利技术属性】
技术研发人员:童永生,孟廷,伍宏传,
申请(专利权)人:安徽讯飞寰语科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。