System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开的示例实施例总体涉及计算机领域,特别地涉及语音生成方法、装置、设备和计算机可读存储介质。
技术介绍
1、伴随着语音合成的快速发展,基于声码器实现高质量的语音合成效果的需求也越来越多。不断推进声码器的合成质量,使其无限的接近真实录音质量,是声码器研究的重要方向。
技术实现思路
1、在本公开的第一方面,提供了一种语音生成的方法。该方法包括:获取待合成的声学特征;以及利用经训练的语音合成模型中的声码器中的第一预定数目个上采样块,依次执行第一预定数目次的第一迭代过程,直至生成最后一个上采样块输出的目标语音,其中上采样块包括上采样网络以及残差栈;其中在一次第一迭代过程中,执行以下操作:利用当前上采样块的上采样网络,基于上一个上采样块输出的第一特征来生成第二特征;以及利用当前上采样块的残差栈,基于第二特征,生成待输出到下一个上采样块的特征,其中输入到第一个上采样块的特征为声学特征,最后一个上采样块输出为目标语音。
2、在本公开的第二方面,提供了一种用于语音生成的装置。该装置包括:获取模块,被配置为获取待合成的声学特征;以及生成模块,被配置为利用经训练的语音合成模型中的声码器中的第一预定数目个上采样块,依次执行第一预定数目次的第一迭代过程,直至生成最后一个上采样块输出的目标语音,其中上采样块包括上采样网络以及残差栈;其中在一次第一迭代过程中,执行以下操作:利用当前上采样块的上采样网络,基于上一个上采样块输出的第一特征来生成第二特征;以及利用当前上采样块的残差栈,基于第二特征,生
3、在本公开的第三方面,提供了一种电子设备。该设备包括至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令。指令在由至少一个处理单元执行时使设备执行第一方面的方法。
4、在本公开的第四方面,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序,计算机程序可由处理器执行以实现第一方面的方法。
5、在本公开的第五方面,提供了一种计算机程序产品。该计算机程序产品包括计算机可执行指令,计算机可执行指令在被处理器执行时实现第一方面的方法。
6、应当理解,本内容部分中所描述的内容并非旨在限定本公开的实施例的关键特征或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的描述而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种语音生成方法,包括:
2.根据权利要求1所述的方法,其中利用当前上采样块的残差栈,基于所述第二特征,生成待输出到下一个上采样块的特征包括:
3.根据权利要求2所述的方法,其中利用所述当前上采样块中的特征融合层,基于每次迭代过程获得的输出特征,生成第五特征包括:
4.根据权利要求2所述的方法,其中所述第二预定数目次的第二迭代过程对应的空洞卷积块对应的空洞呈指数递增。
5.根据权利要求1所述的方法,其中所述第一预定数目个上采样块对应的上采样网络所应用的上采样倍数不同。
6.一种用于语音生成的装置,包括:
7.一种电子设备,包括:
8.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现根据权利要求1至5中任一项所述的方法。
9.一种计算机程序产品,包括计算机可执行指令,其中所述计算机可执行指令在被处理器执行时实现根据权利要求1至5中任一项所述的方法。
【技术特征摘要】
1.一种语音生成方法,包括:
2.根据权利要求1所述的方法,其中利用当前上采样块的残差栈,基于所述第二特征,生成待输出到下一个上采样块的特征包括:
3.根据权利要求2所述的方法,其中利用所述当前上采样块中的特征融合层,基于每次迭代过程获得的输出特征,生成第五特征包括:
4.根据权利要求2所述的方法,其中所述第二预定数目次的第二迭代过程对应的空洞卷积块对应的空洞呈指数递增。
5.根据权利要求1所...
【专利技术属性】
技术研发人员:宋伟,张雅洁,岳杨皓,吴友政,何晓冬,
申请(专利权)人:京东城市北京数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。