信号处理方法、装置、计算机设备、存储介质及程序产品制造方法及图纸

技术编号：39952616 阅读：5 留言：0更新日期：2024-01-08 23:25

本申请提供一种信号处理方法、装置、计算机设备、存储介质及程序产品，涉及语音技术、人工智能、智慧交通等技术领域。通基于该目标语音信号的带宽、以及预设的目标频率阈值，将该目标语音信号分解为至少两个子带信号；并分别通过第一语音编码器，获取语谱频率高于目标频率阈值的第一子带信号的第一编码码流，可得到低码率的编码码流，降低了低质量需求的高频子带信号所需的传输带宽；以及通过第二语音编码器，获取语谱频率不高于目标频率阈值的第二子带信号的第二编码码流，得到高质量的编码变流，保证了具备大部分信息量的第二子带信号的编码质量，从而在保证编码质量的前提下，尽可能的降低了所需的传输成本。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音技术、人工智能、智慧交通等等，本申请涉及一种信号处理方法、装置、计算机设备、存储介质及程序产品。

技术介绍

1、语音编解码技术在现代通讯系统中占有重要的地位。例如，语音通话过程中，在语音编码时，发送端通过麦克风采集语音信号、并通过模数转换电路将语音信号由模拟信号转换为数字信号后，采用编码器对语音信号压缩再传输给接收端。在语音解码时，接收端通过解码器还原出语音信号，并通过扬声器进行播放。

2、语音编码技术可降低语音信号传输过程所占用的资源。并且，在一些业务场景中，存在通话带宽对运营成本影响较大或传输资源非常有限等情况，尤其需要减少语音信信号传输过程的传输成本。因而，在本领域中，如何在语音编解码过程中更有效的降低传输成本，一直是本领域技术人员的重点研究问题。

技术实现思路

1、本申请提供了一种信号处理方法、装置、计算机设备、存储介质及程序产品。所述技术方案如下：

2、一方面，提供了一种信号处理方法，所述方法包括：

3、获取待传输的目标语音信号；

4、基于所述目标语音信号的带宽、以及预设的目标频率阈值，将所述目标语音信号分解为至少两个子带信号，任一子带信号的带宽低于所述目标语音信信号的带宽；

5、对于第一子带信号，通过第一语音编码器，获取所述第一子带信号的第一编码码流，所述第一子带信号是指所述至少两个子带信号中语谱频率高于目标频率阈值的子带信号，所述第一语音编码器是基于深度学习模型的编码器；

6、对于第

7、向接收端传输所述第一编码码流和所述第二编码码流。

8、另一方面，提供了一种信号处理方法，所述方法包括：

9、接收发送端所传输的第一编码码流和第二编码码流；

10、通过第一语音解码器对所述第一编码码流进行解码，得到第一子带信号，所述第一语音解码器是与第一语音编码器对应的解码器，所述第一语音编码器是基于深度学习模型的编码器；

11、通过第二语音解码器对所述第二编码码流进行解码，得到第二子带信号，所述第二语音解码器是与第二语音编码器对应的解码器，所述第二语音编码器是基于人声语音模型的非深度学习编码器；

12、将所述第一子带信号和所述第二子带信号合成为目标语音信号，并播放所述目标语音信号。

13、另一方面，提供了一种信号处理装置，所述装置包括：

14、目标语音信号获取模块，用于获取待传输的目标语音信号；

15、分解模块，用于基于所述目标语音信号的带宽、以及预设的目标频率阈值，将所述目标语音信号分解为至少两个子带信号，任一子带信号的带宽低于所述目标语音信信号的带宽；

16、第一编码码流获取模块，用于对于第一子带信号，通过第一语音编码器，获取所述第一子带信号的第一编码码流，所述第一子带信号是指所述至少两个子带信号中语谱频率高于目标频率阈值的子带信号，所述第一语音编码器是基于深度学习模型的编码器；

17、第二编码码流获取模块，用于对于第二子带信号，通过第二语音编码器，获取所述第二子带信号的第二编码码流，所述第二子带信号是指所述至少两个子带信号中语谱频率不高于目标频率阈值的子带信号，所述第二语音编码器是基于人声语音模型的非深度学习编码器；

18、传输模块，用于向接收端传输所述第一编码码流和所述第二编码码流。

19、在一个可能实现方式中，所述第二编码码流获取模块，用于：

20、通过所述第二语音编码器，对所述第二子带信号进行线性预测分析，得到线性预测滤波参数，并基于所述线性预测滤波参数和第一码本参数，确定所述第二子带信号的预测滤波信号；

21、确定所述预测滤波信号与所述第二子带信号的原始信号之间的残差信号；

22、重复执行线性预测分析、确定预测滤波信号以及确定残差信号的步骤，以将所述第一码本参数迭代调整为第二码本参数；

23、将线谱对系数、基音周期、自适应码本增益参数和固定码本参数，确定为所述第二编码码流；

24、其中，所述线谱对系数用于表征所述线性预测滤波参数，所述基音周期用于表征所述第二码本参数对应的自适应码本，所述固定码本参数用于表征所述第二码本参数对应的固定码本及固定码本增益参数。

25、在一个可能实现方式中，所述第一编码码流包括基音周期、互相关值以及倒谱系数；所述第一编码码流是通过所述第一语音编码器对所述第一子带信号进行特征提取得到的。

26、在一个可能实现方式中，所述分解模块，用于基于所述接收端的播放支持采样率，通过正交镜像滤波器组基于所述目标语音信号的带宽对所述目标语音信号进行至少一次带宽分解，得到所述至少两个子带信号；

27、其中，所述至少两个子带信号包括不高于所述目标频率阈值的子带信号，所述播放支持采样率与所述至少两个子带信号的数量正相关，每次带宽分解将一个第一信号分解为两个第二信号，第二信号的带宽为第一信号的带宽的一半。

28、另一方面，提供了一种信号处理装置，所述装置包括：

29、接收模块，用于接收发送端所传输的第一编码码流和第二编码码流；

30、第一解码模块，用于通过第一语音解码器对所述第一编码码流进行解码，得到第一子带信号，所述第一语音解码器是与第一语音编码器对应的解码器，所述第一语音编码器是基于深度学习模型的编码器；

31、第二解码模块，用于通过第二语音解码器对所述第二编码码流进行解码，得到第二子带信号，所述第二语音解码器是与第二语音编码器对应的解码器，所述第二语音编码器是基于人声语音模型的非深度学习编码器；

32、合成模块，用于将所述第一子带信号和所述第二子带信号合成为目标语音信号；

33、播放模块，用于播放所述目标语音信号。

34、在一个可能实现方式中，所述第二编码码流包括线谱对系数、基音周期、自适应码本增益参数和固定码本参数；

35、所述第二解码模块，用于：

36、通过所述第二语音解码器，对所述线谱对系数进行内插得到线性预测滤波系数；

37、基于所述固定码本参数所表征的固定码本及固定码本增益参数，生成固定码本激励信号；

38、基于所述自适应码本增益参数、以及所述基音周期所表征的自适应码本，生成自适应码本激励信号；

39、通过所述线性预测滤波系数对应的滤波器，对所述固定码本激励信号和所述自适应码本激励信号的合成信号进行滤波，得到所述第二子带信号。

40、在一个可能实现方式中，所述合成模块，用于基于所述接收端的播放支持采样率，从所述第一子带信号选择至少一个第一目标信号，从所述第二子带信号中选择至少一个第二目标信号；通本文档来自技高网...

【技术保护点】

1.一种信号处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对于第二子带信号，通过第二语音编码器，获取所述第二子带信号的第二编码码流，包括：

3.根据权利要求1所述的方法，其特征在于，所述第一编码码流包括基音周期、互相关值以及倒谱系数；所述第一编码码流是通过所述第一语音编码器对所述第一子带信号进行特征提取得到的。

4.根据权利要求1所述的方法，其特征在于，所述基于所述目标语音信号的带宽、以及预设的目标频率阈值，将所述目标语音信号分解为至少两个子带信号，包括：

5.一种信号处理方法，其特征在于，所述方法包括：

6.根据权利要求5所述的方法，其特征在于，所述第二编码码流包括线谱对系数、基音周期、自适应码本增益参数和固定码本参数；

7.根据权利要求5所述的方法，其特征在于，所述将所述第一子带信号和所述第二子带信号合成为目标语音信号，并播放所述目标语音信号，包括：

8.根据权利要求5所述的方法，其特征在于，所述接收发送端所传输的第一编码码流和所述第二编码码流之后，所述方法还包括：

9.根据权利要求5所述的方法，其特征在于，所述第一编码码流包括基音周期、互相关值以及倒谱系数；

10.一种信号处理装置，其特征在于，所述装置包括：

11.一种信号处理装置，其特征在于，所述装置包括：

12.一种计算机设备，包括存储器、处理器及存储在存储器上的计算机程序，其特征在于，所述处理器执行所述计算机程序以实现权利要求1至9任一项所述的信号处理方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至9任一项所述的信号处理方法。

14.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至9任一项所述的信号处理方法。

...

【技术特征摘要】

1.一种信号处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对于第二子带信号，通过第二语音编码器，获取所述第二子带信号的第二编码码流，包括：

5.一种信号处理方法，其特征在于，所述方法包括：

6.根据权利要求5所述的方法，其特征在于，所述第二编码码流包括线谱对系数、基音周期、自适应码本增益参数和固定码本参数；

7.根据权利要求5所述的方法，其特征在于，所述将所述第一子带信号和所述第二子带信号合成为目标语音信号，并播放...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人