一种用于语音合成的特征数据处理方法和装置制造方法及图纸

技术编号:41739530 阅读:22 留言:0更新日期:2024-06-19 12:59
本申请涉及一种用于语音合成的特征数据处理方法和装置。所述特征数据处理方法包括获取待合成语音信号对应的文本;将所述文本作为第一学习网络的输入,所述第一学习网络包括并行设置的第一子网络和第二子网络,其中,所述第一子网络由依序串联的第一卷积层、分组反卷积层、通道重排层和第二卷积层构建而成且基于所述文本生成第一输出特征;第二子网络包括第三卷积层且基于所述文本生成第二输出特征;第一学习网络还包括特征融合部,用于对所述第一输出特征和所述第二输出特征进行融合处理后输出用于合成语音信号的特征数据。本申请在保持语音合成处理低功耗的同时,同时能够提高用于上采样的反卷积层的表示能力,使合成的语音具有更高质量。

【技术实现步骤摘要】

本申请涉及语音合成技术,更具体地,涉及一种用于语音合成的特征数据处理方法和装置


技术介绍

1、随着语音合成技术的发展,基于反卷积的上采样技术得到广泛的应用,然而,当基于反卷积的上采样技术用在低功耗芯片场景中时,往往会要求反卷积算子具有较高的推理效率。

2、针对上述问题,业内一般通过使用分组反卷积等方法来降低上采样的计算复杂度来解决,这种技术方案通常首先对反卷积层的通道数进行分组,然后在每组内部进行反卷积运算实现上采样,以此来降低计算开销。然而,采用分组反卷积实现上采样时由于模型训练时仅在分组内学习,因此降低了反卷积层的表示能力。

3、因此,目前采用分组反卷积实现上采样的现有技术中,反卷积层的表示能力有待提高。


技术实现思路

1、提供了本申请以解决现有技术中存在的上述问题。

2、需要一种用于语音合成的特征数据处理方法和装置,其能够在采用分组反卷积实现上采样的情况下提高反卷积层(也即反卷积算子)的表示能力,保持语音合成处理低功耗的同时,同时提高合成后的语音质量。

本文档来自技高网...

【技术保护点】

1.一种用于语音合成的特征数据处理方法,其特征在于,所述特征数据处理方法包括:

2.根据权利要求1所述的特征数据处理方法,其特征在于,所述通道重排层对所述分组反卷积层输出的包含多个通道的中间特征进行通道重排处理,并且所述通道重排层包括第一重排层和第二重排层;其中

3.根据权利要求1或2所述的特征数据处理方法,其特征在于,

4.根据权利要求3所述的特征数据处理方法,其特征在于,所述激活函数层采用ReLU激活函数或Sigmoid激活函数。

5.根据权利要求1或2所述的特征数据处理方法,其特征在于,由所述特征融合部对所述第一输出特征和所述第二输出...

【技术特征摘要】

1.一种用于语音合成的特征数据处理方法,其特征在于,所述特征数据处理方法包括:

2.根据权利要求1所述的特征数据处理方法,其特征在于,所述通道重排层对所述分组反卷积层输出的包含多个通道的中间特征进行通道重排处理,并且所述通道重排层包括第一重排层和第二重排层;其中

3.根据权利要求1或2所述的特征数据处理方法,其特征在于,<...

【专利技术属性】
技术研发人员:巩宁李倩
申请(专利权)人:恒玄科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1