【技术实现步骤摘要】
语音转化模型的训练方法和装置及语音生成方法和装置
[0001]本申请涉及语音合成领域,更具体地讲,涉及一种语音转化模型的训练方法和装置及语音生成方法和装置。
技术介绍
[0002]定制语音在不同的应用场景中吸引了越来越多的注意,例如个人助理、新闻广播和音频导航,且在商业领域也得到了广泛支持。在现有的定制目标说话人的语音的方法中,通过直接利用目标说话人的语音训练TTS模型实现语音定制,或者通过利用少量可用性自适应数据(通常数据只有几秒钟或者几分钟)对经过训练的基础TTS模型进行微调来实现语音定制,但是它们都无法满足针对目标说话人语音随采随用的大多数场景。
技术实现思路
[0003]本公开提供一种语音到文本(TTS)模型的训练方法和装置及语音合成方法和装置。
[0004]根据本公开实施例的第一方面,提供一种语音转化模型的训练方法,其中,所述训练方法包括:获取第一训练数据,其中,第一训练数据包括语音数据、与所述语音数据对应的音素数据和与所述语音数据对应的标准梅尔谱图;将所述语音数据输入到预训练的说话人识别模型得到与所述语音数据对应的说话人嵌入,其中,所述说话人嵌入用于表示说话人的音色;以及基于所述音素数据、所述标准梅尔谱图和所述说话人嵌入对初始语音转化模型进行训练,得到所述语音转化模型,所述语音转化模型用于将文本转化为语音的梅尔谱图。
[0005]根据本公开实施例的第二方面,提供一种语音生成方法,其中,所述语音生成方法包括:获取目标说话人的目标语音数据和目标文本;将所述目标文本转换为目标音素 ...
【技术保护点】
【技术特征摘要】
1.一种语音转化模型的训练方法,其特征在于,所述训练方法包括:获取第一训练数据,其中,第一训练数据包括语音数据、与所述语音数据对应的音素数据、以及与所述语音数据对应的标准梅尔谱图;将所述语音数据输入到预训练的说话人识别模型得到与所述语音数据对应的说话人嵌入,其中,所述说话人嵌入用于表示说话人的音色;基于所述音素数据、所述标准梅尔谱图和所述说话人嵌入对初始语音转化模型进行训练,得到所述语音转化模型,所述语音转化模型用于将文本转化为语音的梅尔谱图。2.如权利要求1所述的训练方法,其特征在于,所述将所述语音数据输入到预训练的说话人识别模型得到与所述语音数据对应的说话人嵌入之前,所述训练方法还包括:获取第二训练数据,其中,所述第二训练数据包括与所述第一训练数据中的语音数据不相同的语音数据;基于所述第一训练数据中的语音数据和所述第二训练数据或所述第二训练数据训练初始说话人识别模型,得到所述预训练的说话人识别模型。3.如权利要求1所述的训练方法,其特征在于,基于所述音素数据、所述标准梅尔谱图和所述说话人嵌入对所述初始语音转化模型进行训练,得到所述语音转化模型,包括:将所述音素数据和所述说话人嵌入输入到所述初始语音转化模型进行预测,得到预测的梅尔谱图;基于所述预测的梅尔谱图和所述标准梅尔谱图调整所述初始语音转化模型的参数,得到所述语音转化模型。4.如权利要求3所述的训练方法,其特征在于,所述初始语音转化模型包括音素嵌入层、第一编码器、第一加法器、第二编码器、第二加法器、变量适配器、第三编码器、第三加法器和解码器,所述将所述音素数据和所述说话人嵌入输入到所述初始语音转化模型进行预测得到预测的梅尔谱图,包括:通过所述音素嵌入层对所述音素数据进行编码,得到音素嵌入;通过所述第一编码器对所述音素嵌入进行位置编码,得到所述音素嵌入的位置编码信息;通过所述第一加法器将所述音素嵌入的位置编码信息与所述音素嵌入相加,得到叠加了位置编码信息的音素嵌入;通过所述第二编码器对所述叠加了位置编码信息的音素嵌入进行编码,得到第一隐藏序列;通过第二加法器对所述第一隐藏序列与所述说话人嵌入相加,得到第二隐藏序列;通过所述变量适配器对所述第二隐藏序列进行融合处理,得到第三隐藏序列;通过所述第三编码器对所述第三隐藏序列进行位置编码,得到所述第三隐藏序列的位置编码信息;通过所述第三加法器对所述第三隐藏序列的位置编码信息、所述说话人嵌入和所述第三隐藏序列相加,得到第四隐藏序列;通过所述解码器对所述第四隐藏序列进行解码,得到所述预测的梅尔谱图。5.一种语音生成方法,其特征在于,所述语音生成方法包括:获取目标说话人的目标语音数据和目标文本;
将所述目标文本转换为目标音素数据;将所述目标语音数据输入到说话人识别模型,得到目标说话人嵌入,其中,所述目标说话人嵌入用于表示所述目标说话人的音色;将所述目标说话人嵌入和所述目标音素数据输入到语音转化模型,生成与所述目标文本对应的语音的梅尔谱图;利用所述梅尔谱图生成所述语音,其中,所述语音包含所述目标说话人的音色;其中,所述语音转化模型为根据所述说话人识别模型输出的说话人嵌入训练得到。6.如权...
【专利技术属性】
技术研发人员:刘鹏飞,蒋宁,吴海英,刘敏,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。