语音合成方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号：37797975 阅读：26 留言：0更新日期：2023-06-09 09:27

本申请公开了一种语音合成方法、装置、电子设备及计算机可读介质，涉及语音合成技术领域，方法包括：基于输入文本，根据预先获取的基础语种语音合成模型，获取第一合成语音，根据预先获取的目标语种语音合成模型，获取第二合成语音，其中，所述目标语种语音合成模型的训练语音与所述基础语种语音合成模型的训练语音的相似度高于预设值；基于预先获取的基础语种训练语音，对所述第二合成语音进行语音转换，获取第三合成语音；基于所述第一合成语音和所述第三合成语音，获取目标合成语音。因此，进一步提升了不同语种合成语音的相似度，进而，使包括双语甚至多语的目标合成语音具有高度的音色一致性，提升听觉效果。提升听觉效果。提升听觉效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音合成方法、装置、电子设备及计算机可读介质

[0001]本申请涉及语音合成
，更具体地，涉及一种语音合成方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]语音合成是人机交互的一个重要环节，大多数语音合成系统都是针对单个语言开发。但是，在现实生活中，尤其是商务场合，双语甚至多语交流经常出现，针对单个语言开发的语音合成系统应用在双语甚至多语交流的场合下，容易出现不同语言的合成语音差异性比较大的问题。

技术实现思路

[0003]本申请提出了一种语音合成方法、装置、电子设备及计算机可读介质，以改善上述缺陷。
[0004]第一方面，本申请实施例提供了一种语音合成方法，所述方法包括：基于输入文本，根据预先获取的基础语种语音合成模型，获取第一合成语音；基于输入文本，根据预先获取的目标语种语音合成模型，获取第二合成语音，其中，所述目标语种语音合成模型的训练语音与所述基础语种语音合成模型的训练语音的相似度高于预设值；基于预先获取的基础语种训练语音，对所述第二合成语音进行语音转换，获取第三合成语音，所...

【技术保护点】

【技术特征摘要】
1.一种语音合成方法，其特征在于，所述方法包括：基于输入文本，根据预先获取的基础语种语音合成模型，获取第一合成语音；基于输入文本，根据预先获取的目标语种语音合成模型，获取第二合成语音，其中，所述目标语种语音合成模型的训练语音与所述基础语种语音合成模型的训练语音的相似度高于预设值；基于预先获取的基础语种训练语音，对所述第二合成语音进行语音转换，获取第三合成语音，所述第三合成语音与所述基础语种训练语音的相似度高于所述第二合成语音与所述基础语种训练语音的相似度；基于所述第一合成语音和所述第三合成语音，获取目标合成语音。2.根据权利要求1所述的方法，其特征在于，在所述基于输入文本，根据预先获取的目标语种语音合成模型，获取第二合成语音之前，所述方法还包括：获取基础语种训练语音与多个目标语种语音；基于所述基础语种训练语音，在多个所述目标语种语音中选择目标语种训练语音，所述目标语种训练语音为与所述基础语种训练语音的相似度高于预设值的目标语种语音；基于所述目标语种训练语音，获取所述目标语种语音合成模型。3.根据权利要求2所述的方法，其特征在于，基于所述基础语种训练语音，在多个所述目标语种语音中选择目标语种训练语音，包括：将多个所述目标语种语音与所述基础语种训练语音进行逐一对比，获取每个所述目标语种语音与所述基础语种训练语音的相似度；选择所述相似度高于预设值的所述目标语种语音，作为目标语种训练语音。4.根据权利要求3所述的方法，其特征在于，所述将多个所述目标语种语音与所述基础语种训练语音进行逐一对比，获取每个所述目标语种语音与所述基础语种训练语音的相似度，包括：提取每个所述目标语种语音的声纹特征，作为比对声纹特征；提取所述基础语种训练语音的声纹特征，作为基础声纹特征；对多个所述比对声纹特征与所述基础声纹特征进行声纹比对，获取声纹比对得分；基于所述声纹比对得分，获取每个所述目标语种语音与所述基础语种训练语音的相似度。5.根据权利要求1所述的方法，其特征在于，在基...

【专利技术属性】
技术研发人员：林伟伟，张伟彬，陈东鹏，
申请(专利权)人：深圳市声扬科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人