多频带同步神经声码器制造技术

技术编号：31684518 阅读：16 留言：0更新日期：2022-01-01 10:33

本申请的装置和方法包括：接收将由多频带同步神经声码器进行处理的输入音频信号。将所述输入音频信号分离成多个频带。获取与所述多个频带对应的多个音频信号。对所述多个音频信号中的每个音频信号进行下采样。由所述多频带同步神经声码器，处理下采样的音频信号。生成音频输出信号。音频输出信号。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】多频带同步神经声码器
[0001]相关申请的交叉引用
[0002]本申请要求于2019年9月20日提交美国专利局、申请号为16/576,943的美国正式申请的优先权，其全部内容通过引用结合在本申请中。

技术介绍

[0003]Wavenet是第一个神经声码器并且由谷歌提供。为了提高Wavenet的推理速度，谷歌后来提供了并行的Wavenet。尽管并行的Wavenet的速度明显优于原始的Wavenet，但是，并行的Wavenet在推理时需要大量图形处理单元(GPU)(或大量中央处理单元(CPU))来执行并行计算，这在计算上极其昂贵，并且在实际生产系统中应用受限。随后，提供了WaveRNN模型，并且显著地减少了推理时间。然而，推理速度仍然相当慢。

技术实现思路

[0004]根据本申请实施例，一种由多频带同步神经声码器执行的方法，包括：接收将由所述多频带同步神经声码器进行处理的输入音频信号；由所述多频带同步神经声码器，将所述输入音频信号分离成多个频带；基于将所述输入音频信号分离成所述多个频带，由所述多频带同步神经声码器，获取与所述多个频带对应的多个音频信号；基于获取所述多个音频信号，由所述多频带同步神经声码器，对所述多个音频信号中的每个音频信号进行下采样；由所述多频带同步神经声码器，处理下采样的音频信号；及，由所述多频带同步神经声码器，基于处理下采样的音频信号，生成音频输出信号。
[0005]根据本申请实施例，一种多频带同步神经声码器设备，包括：至少一个存储器，用于存储计算机程序代码；至少一个处理器，用于读取所...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由多频带同步神经声码器执行的方法，其特征在于，包括：接收将由所述多频带同步神经声码器进行处理的输入音频信号；由所述多频带同步神经声码器，将所述输入音频信号分离成多个频带；基于将所述输入音频信号分离成所述多个频带，由所述多频带同步神经声码器，获取与所述多个频带对应的多个音频信号；基于获取所述多个音频信号，由所述多频带同步神经声码器，对所述多个音频信号中的每个音频信号进行下采样；由所述多频带同步神经声码器，处理下采样的音频信号；及，由所述多频带同步神经声码器，基于处理下采样的音频信号，生成音频输出信号。2.根据权利要求1所述的方法，其特征在于，同时处理所述多个频带中每个频带的下采样的音频信号。3.根据权利要求1所述的方法，其特征在于，使用单个处理单元，处理所述多个频带中每个频带的下采样的音频信号。4.根据权利要求1所述的方法，其特征在于，所述神经声码器为WaveNet声码器。5.根据权利要求1所述的方法，其特征在于，所述神经声码器为WaveRNN声码器。6.根据权利要求1所述的方法，其特征在于，所述神经声码器为LPCNet声码器。7.根据权利要求1所述的方法，其特征在于，进一步包括：对每个处理后的音频信号进行上采样；基于每个上采样后的处理后的音频信号，生成所述音频输出信号。8.一种多频带同步神经声码器设备，其特征在于，包括：至少一个存储器，用于存储计算机程序代码；至少一个处理器，用于读取所述计算机程序代码，根据所述计算机程序代码的指令进行操作，所述程计算机序代码包括：接收代码，用于使得所述至少一个处理器，接收将由所述多频带同步神经声码器进行处理的输入音频信号；分离代码，用于使得所述至少一个处理器，由所述多频带同步神经声码器，将所述输入音频信号分离成多个频带；获取代码，用于使得所述至少一个处理器，基于将所述输入音频信号分离成所述多个频带，由所述多频带同步神经声码器，获取与所述多个频带对应的多个音频信号；下采样代码，用于使得所述至少一个处理器，基于获取所述多个音频信号，由所述多频带同步神经声码器，对所述多个音频信号中的每个音频信号进行下采样；处理代码，用于使得所述至少一个处理器，由所述多频带同步神经声码器，处理下采样的音频信号；及，生成代码，用于使得所述至少一个处理器，由所述多频带同步...

【专利技术属性】
技术研发人员：俞承柱，于蒙，卢恒，俞栋，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人