声音转换模型的训练方法、电子设备及存储介质技术

技术编号:28458524 阅读:50 留言:0更新日期:2021-05-15 21:22
本申请公开了一种声音转换模型的训练方法、电子设备及存储介质。该方法包括:从第一语音数据集中获取第一训练语音数据,其中,第一语音数据集中包括目标说话人的多条语音数据,第一训练语音数据对应第一声学特征;获取第一声学特征对应的后验概率特征;将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型,得到第一平行特征;获取第一平行特征对应的后验概率特征;将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型,得到第二声学特征;基于第二声学特征和第一声学特征之间的差异,调整声音转换模型的参数。通过上述方式,能够提高声音转换模型的转换效果。的转换效果。的转换效果。

【技术实现步骤摘要】
声音转换模型的训练方法、电子设备及存储介质


[0001]本申请涉及语音合成领域,特别是涉及一种声音转换模型的训练方法、电子设备及存储介质。

技术介绍

[0002]声音转换是指利用声音转换模型对源说话人的语音数据进行转换,使其具有目标说话人的音色,同时能够保持语音数据的语义内容不变。该技术具有广泛的应用前景和实用价值。例如,该技术可以用来丰富合成语音数据效果。将该技术与语音数据合成系统相结合,可以方便快捷地生成具有不同音色的语音数据。相对于传统语音数据合成系统需要录制数小时语料,声音转换系统一般只需要几十句的训练语料,可以大大降低合成系统的构建代价。此外,说话人声音转换技术还可以用于娱乐领域进行影视配音或者游戏中实现角色扮演,用于安全领域进行身份隐藏,以及用于医疗领域进行辅助发声等等。
[0003]然而,现有的训练方法得到的声音转换模型的转换效果不佳。

技术实现思路

[0004]本申请提供一种声音转换模型的训练方法、电子设备及存储介质,能够解决现有的训练方法得到的声音转换模型的转换效果不佳的问题。/>[0005]为解本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声音转换模型的训练方法,其特征在于,包括:从第一语音数据集中获取第一训练语音数据,其中,所述第一语音数据集中包括目标说话人的多条语音数据,所述第一训练语音数据对应第一声学特征;获取所述第一声学特征对应的后验概率特征;将所述第一声学特征对应的后验概率特征和第一辅助音色特征输入所述声音转换模型,得到第一平行特征,其中,所述第一辅助音色特征不属于所述目标说话人;获取所述第一平行特征对应的后验概率特征;将所述第一平行特征对应的后验概率特征和目标音色特征输入所述声音转换模型,得到第二声学特征,其中,所述目标音色特征属于所述目标说话人;基于所述第二声学特征和所述第一声学特征之间的差异,调整所述声音转换模型的参数。2.根据权利要求1所述的方法,其特征在于,在所述将所述第一声学特征对应的后验概率特征和第一辅助音色特征输入所述声音转换模型之前,包括:获取至少一条第一辅助语音数据对应的音色特征;对所述至少一条第一辅助语音数据对应的音色特征做插值处理,得到所述第一辅助音色特征。3.根据权利要求1所述的方法,其特征在于,在所述将所述第一平行声学特征对应的后验概率特征和目标音色特征输入所述声音转换模型之前,包括:从所述第一语音数据集中,获取至少一条所述语音数据对应的音色特征;利用所述至少一条语音数据对应的音色特征构造所述目标音色特征。4.根据权利要求1所述的方法,其特征在于,在所述将所述第一声学特征对应的后验概率特征和第一辅助音色特征输入所述声音转换模型,得到第一平行特征之前,包括:对所述声音转换模型进行预训练。5.根据权利要求4所述的方法,其特征在于,对所述声音转换模型进行预训练,包括:从第二语音数据集中获取第二训练语音数据,其中,所述第二语音数据集中包括多个其他说话人的语音数据,所述第二训练语音数据对应第三声学特征;获取所述第三声学特征对应的后验概率特征;将所述第三声学特征对应的后验概率特征和第二辅助音色特征输入声音转换模型,得到第二平行特征,其中,所述第二辅助音色特征所属的所述说话人与所述第三声学特征所属的所述说话人不同;获取所述第二平行特征对应的后验概率特征;将所述第二平行特征对应的后验概率特征和所述第三声学特征所属的所述说话人的音色特征输入声音转换模型,得到第四声学特征;基于所述第四声学特征和所述第三声学特征之间的差异,调整所述声音转换模型的参数。6.根据权利要求5所述的方法,其特征在于,在所述将所述第三声学特征对应的后验概率特征和第二辅助音色特征输入声音转换模型,得到第二平行特征之前,包括:从所述第二语音数据集中,获取至少一条第二辅助语音数据及对应的音色特征;利用所述至少一条第二辅助语音数据对应的音色特征构造所述第二辅助音色特征。
7.根据权利要求5所述的方法,其特征在于,在所述将所述第二...

【专利技术属性】
技术研发人员:陈言年刘利娟胡亚军江源
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1