一种语音合成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37994225 阅读：10 留言：0更新日期：2023-06-30 10:08

本申请提供一种语音合成方法、装置、电子设备及存储介质，其中语音合成方法包括：获取目标说话人训练数据，并提取目标说话人音色特征；在预训练数据中筛选与目标说话人的相似说话人音色特征；将训练好的预训练语音合成模型的模型参数加载至finetune语音合成模型；采用相似说话人音色特征与目标说话人音色特征共同训练finetune语音合成模型；将待合成文本输入训练好的finetune语音合成模型进行语音合成任务。通过预选构建的预训练模型，通过finetune的方式对预训练模型进行微调，以满足语音合成任务的及时性需求，极大提升了个性化语音合成模型的训练效率，进而提升了个性化语音合成任务的整体效率。音合成任务的整体效率。音合成任务的整体效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音合成方法、装置、电子设备及存储介质

[0001]本申请涉及语音合成
，具体而言，涉及一种语音合成方法、装置、电子设备及存储介质。

技术介绍

[0002]现有的语音合成算法中，对于特定的说话人语音，都是采用集合内部训练的方式实现，如果出现新的集合外的个性化语音，需要重新进行建模，并重新进行所有的模型训练，非常的耗时耗力，极大地降低了语音合成任务的效率。

技术实现思路

[0003]本申请实施例的目的在于提供一种语音合成方法、装置、电子设备及存储介质，用以提高语音合成任务的效率。
[0004]第一方面，本申请实施例提供一种语音合成方法，包括：获取目标说话人训练数据，并提取目标说话人音色特征；在用于对预训练语音合成模型进行训练的预训练数据中筛选与目标说话人的相似说话人音色特征；将训练好的预训练语音合成模型的模型参数加载至finetune语音合成模型；采用相似说话人音色特征与目标说话人音色特征共同训练finetune语音合成模型；将待合成文本输入训练好的finetune语音合成模型进行语音合成任务。
[0005]在上述方案的实现过程中，通过finetune的方式对预训练模型进行微调，以满足语音合成任务的及时性需求，极大提升了个性化语音合成模型的训练效率，进而提升了个性化语音合成任务的整体效率。
[0006]在第一方面的一种实现方式中，所述预训练语音合成模型为：由包含有多个说话人训练数据的预训练数据所训练的预训练多人语音合成模型。
[0007]在上述方案的实现过程中，...

【技术保护点】

【技术特征摘要】
1.一种语音合成方法，其特征在于，包括：获取目标说话人训练数据，并提取目标说话人音色特征；在用于对预训练语音合成模型进行训练的预训练数据中筛选与目标说话人的相似说话人音色特征；将训练好的预训练语音合成模型的模型参数加载至finetune语音合成模型；采用相似说话人音色特征与目标说话人音色特征共同训练finetune语音合成模型；将待合成文本输入训练好的finetune语音合成模型进行语音合成任务。2.根据权利要求1所述的语音合成方法，其特征在于，所述预训练语音合成模型为：由包含有多个说话人训练数据的预训练数据所训练的预训练多人语音合成模型。3.根据权利要求1所述的语音合成方法，其特征在于，所述finetune语音合成模型为：由包含有一个目标说话人训练数据的目标说话人训练数据所训练的finetune单人语音合成模型；或者，由包含有多个目标说话人训练数据的目标说话人训练数据所训练的finetune多人语音合成模型。4.根据权利要求3所述的语音合成方法，其特征在于，在所述finetune语音合成模型为finetune多人语音合成模型时，所述在用于对预训练语音合成模型进行训练的预训练数据中筛选与目标说话人的相似说话人音色特征，包括：在所述预训练数据中的N个说话人音色特征中分别筛选M个目标说话人的相似说话人音色特征，包括：将所述N个说话人音色特征进行特征平均化处理后的平均音色特征分别作为M个目标说话人的相似说话人音色特征；或者，在所述预训练数据中的N个说话人音色特征中任意选取M个说话人音色特征作为M个目标说话人的相似说话人音色特征；或者，计算预训练数据中N个说话人与M个目标说话人音色相似度，分别将与M个目标说话人的音色相似度最大的说话人音色特征作为M个目标说话人的相似说话人音色特征。5.根据权利要求4所述的语音合成方法，其特征在于，所述计算预训练数据中N个说话人与M个目标说话人音色相似度，包括：分别计算预训练数据中N个说话人与M个目标说话人的音色距离作为音色相似度；或者，分别计算预训练数据中N个说话人的音色特征与M个目标说话人的音色特征之间的余弦相似度作为音色相似度。6.一种语音合成装置，其特征在于，包括：目标说话人训练数据获取模块，用于获取目标说话人训练数据；目标说话人...

【专利技术属性】
技术研发人员：樊冯飞，姚树杰，赵言，
申请(专利权)人：鼎富新动力北京智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人