语音合成模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37204298 阅读：13 留言：0更新日期：2023-04-20 22:58

本公开提供了一种语音合成模型的训练方法、装置、电子设备及存储介质，所述方法包括：将第一语音样本对应的音乐信息，输入至时长提取模块，获取乐谱样本嵌入值；将乐谱样本嵌入值和乐谱样本嵌入值对应的音高样本嵌入值输入至线性变换模块，进行降维；将线性变换模块的输出，作为框架网络模块的输入，获取音乐信息对应的第一预测样本特征；获取第一语音样本对应的隐特征；将隐特征输入至解码器中，获取隐特征对应的预测语音样本；基于第一语音样本和所述预测语音样本，调整解码器的参数；基于第一预测样本特征和隐特征，调整所述线性变换模块和框架网络模块的参数；基于音高样本嵌入值调整音高提取模块的参数。值调整音高提取模块的参数。值调整音高提取模块的参数。

全部详细技术资料下载

【技术实现步骤摘要】
语音合成模型的训练方法、装置、电子设备及存储介质

[0001]本公开涉及语音合成
，尤其涉及一种语音合成模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]相关技术中，通常是采用两阶段语音合成模型实现语音合成，需要单独训练声学模型和声码器；且进行语音合成时考虑的信息不全面，使得最终合成的结果与实际需求存在差异，无法满足用户需求。

技术实现思路

[0003]本公开提供了一种语音合成模型的训练方法、装置、电子设备及存储介质，以至少解决现有技术中存在的以上技术问题。
[0004]根据本公开的第一方面，提供一种语音合成模型的训练方法，包括：
[0005]将第一语音样本对应的音乐信息，输入至时长提取模块，获取乐谱样本嵌入值；
[0006]将所述乐谱样本嵌入值和所述乐谱样本嵌入值对应的音高样本嵌入值输入至线性变换模块，进行降维；
[0007]将所述线性变换模块的输出，作为所述框架网络模块的输入，获取所述音乐信息对应的第一预测样本特征；
[0008]获取所述第一语音样本对应的隐特征；
[0009]将所述隐特征输入至解码器中，获取所述隐特征对应的预测语音样本；
[0010]基于所述第一语音样本和所述预测语音样本，调整所述解码器的参数；基于第一预测样本特征和所述隐特征，调整所述线性变换模块和框架网络模块的参数；基于音高样本嵌入值调整音高提取模块的参数。
[0011]根据本公开的第二方面，提供一种语音合成方法，基于上述第一方面提供的语音合...

【技术保护点】

【技术特征摘要】
1.一种语音合成模型的训练方法，其特征在于，所述方法包括：将第一语音样本对应的音乐信息，输入至时长提取模块，获取乐谱样本嵌入值；将所述乐谱样本嵌入值和所述乐谱样本嵌入值对应的音高样本嵌入值输入至线性变换模块，进行降维；将所述线性变换模块的输出，作为框架网络模块的输入，获取所述音乐信息对应的第一预测样本特征；获取所述第一语音样本对应的隐特征；将所述隐特征输入至解码器中，获取所述隐特征对应的预测语音样本；基于所述第一语音样本和所述预测语音样本，调整所述解码器的参数；基于第一预测样本特征和所述隐特征，调整所述线性变换模块和框架网络模块的参数；基于音高样本嵌入值调整音高提取模块的参数。2.根据权利要求1所述的方法，其特征在于，所述将第一语音样本对应的音乐信息，输入至时长提取模块，获取乐谱样本嵌入值，包括：将所述音乐信息包括的连音信息和颤音信息输入至第一预测模块中，获取所述连音信息和所述颤音信息对应的第一样本嵌入值；将所述音乐信息包括的音素输入至第一编码模块中，获取所述音素对应的音素样本嵌入值；将所述音乐信息包括的时长信息输入至第二预测模块中，获取所述时长信息对应的时长样本嵌入值；将所述第一样本嵌入值、所述音素样本嵌入值、所述时长样本嵌入值和所述音乐信息包括的音高信息输入至所述时长提取模块中，获取所述乐谱样本嵌入值。3.根据权利要求1或2所述的方法，其特征在于，所述将所述乐谱样本嵌入值和所述乐谱样本嵌入值对应的音高样本嵌入值输入至线性变换模块，进行降维之前，所述方法还包括：将所述乐谱样本嵌入值输入至音高提取模块中，获取所述乐谱样本嵌入值对应的音高样本嵌入值。4.根据权利要求1所述的方法，其特征在于，所述获取所述第一语音样本对应的隐特征，包括：将所述第一语音样本输入至所述语音合成模型包括的特征提取模块和第二编码模块中，获取所述第一语音样本对应的隐特征。5.根据权利要求1所述的方法，其特征在于，所述基于所述第一语音样本和所述预测语音样本，调整所述解码器的参数，包括：基于所述第一语音样本和所述预测语音样本确认第一损失函数；基于所述第一损失函数调整所述解码器的参数。6.根据权利要求1所述的方法，其特征在于，所述基于第一预测样本特征和所述隐特征，调整所述线性变换模块和框架网络模块的参数，包括：将所述隐特征输入至所述...

【专利技术属性】
技术研发人员：杨喜鹏，岳鹏飞，陈云琳，
申请(专利权)人：上海墨百意信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人