一种处理多声道音频信号的方法、装置和系统制造方法及图纸

技术编号：40034396 阅读：5 留言：0更新日期：2024-01-16 18:44

一种处理多声道音频信号方法、装置和系统，涉及音频编解码技术领域，用以解决现有技术中多声道音频通信系统不能非连续传输音频信号的问题。其中，编码器包括：信号检测单元和信号编码单元，信号编码单元用于在信号检测单元检测到第N帧下混信号中包含语音信号时，对第N帧下混信号编码，以及在信号检测单元检测到第N帧下混信号中不包含语音信号时：若信号检测单元确定第N帧下混信号满足预设的音频帧编码条件，则对第N帧下混信号编码；若信号检测单元确定第N帧下混信号不满足预设的音频帧编码条件，则不对第N帧下混信号编码。这种技术方案由于对下混信号的编码是非连续的，因此解决了现有技术中不能非连续传输音频信号的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频编解码，特别涉及一种处理多声道音频信号的方法、装置和系统。

技术介绍

1、在音频通信中，为了增加通信系统的容量，通常在发送端对被传输的原始的每帧音频信号先编码再进行传输，通过编码实现了对音频信号的压缩，当接收端接收到信号后，对接收到的信号解码，然后恢复出原始音频信号。其中，为了实现对音频信号的最大化压缩，针对不同类型的音频信号，采用不同类型的编码方式。现有技术中，当音频信号为语音信号时，通常采用连续编码的方式，即分别对每帧语音信号编码，当音频信号为噪声信号时，通常采用非连续编码的方式对噪声信号编码，即每隔若干帧的噪声信号对一帧噪声信号编码，例如每隔六帧对噪声信号编码，对第一帧噪声信号编码后，则不再对第二帧至第七帧噪声信号编码，然后对第八帧噪声信号编码，在该第二帧到第七帧分别为六个no_data帧。具体的，上述音频信号指的是单声道的音频信号。

2、随着音频通信技术的发展，在音频通信系统中还有一种特别的通信方式:立体声通信，以立体声通信为双声道通信为例，其中双声道包括第一声道和第二声道，发送端根据第一声道的第n帧语音信号和第二声道中的第n帧语音信号，得到用于将第一声道的第n帧语音信号和第二声道中的第n帧语音信号混合为一帧下混信号的立体声参数后，其中，下混信号为单通道信号，然后，发送端将双声道中的第n帧语音信号混合为一帧下混信号，n为大于零的正整数，再对该帧下混信号编码，最后将编码后的下混信号和立体声参数发送到接收端，接收端在接收到编码后的下混信号和立体声参数后，对编码后的下混信号解码，然后根据立体声参数

3、但是，当在立体声通信中，传输的是噪声信号时，采用的还是与语音信号相同的编码方式，若直接将单声道中非连续编码的方式应用在在立体声通信中，则在接收端不能将噪声信号还原，导致接收端的用户主观体验变差。

技术实现思路

1、本专利技术提供一种处理多声道音频信号的方法、装置和系统，用以解决现有技术中多声道音频通信系统不能非连续传输音频信号的问题。

2、第一方面，提供了一种处理多声道音频信号的方法，包括：编码器检测第n帧下混信号中是否包含语音信号，在检测到第n帧下混信号中包含语音信号时，对第n帧下混信号编码；在检测到第n帧下混信号中不包含语音信号时：若确定第n帧下混信号满足预设的音频帧编码条件，则对第n帧下混信号编码；若确定第n帧下混信号不满足预设的音频帧编码条件，则不对第n帧下混信号编码；其中，第n帧下混信号是由多声道中两个声道的第n帧音频信号基于预定第一算法混合后得到的，n为大于零的正整数。

3、由于编码器只有在下混信号中包含语音信号或者下混信号满足预设的音频帧编码条件时，才对下混信号编码，否则不对下混信号编码，从而使得编码器实现了对下混信号的非连续编码，提高了对下混信号的压缩效率。

4、需要说明的是，在本专利技术实施例中，预设的音频帧编码条件中包括第一帧下混信号，也就是说，在第一帧下混信号中不包含语音信号时，第一帧下混信号满足预设的音频帧编码条件，对第一帧下混信号编码。

5、在第一方面的基础上，为更大程度实现对下混信号的压缩效率，可选的，编码器在检测到第n帧下混信号中包含语音信号时，根据预设的语音帧编码速率对第n帧下混信号编码；在检测到第n帧下混信号中不包含语音信号时：若确定第n帧下混信号满足预设的语音帧编码条件，则根据预设的语音帧编码速率对第n帧下混信号编码；若确定第n帧下混信号不满足预设的语音帧编码条件、但满足预设的sid编码条件，则根据预设的sid编码速率对第n帧下混信号编码；其中，sid编码速率小于语音帧编码速率。

6、应理解，在具体实现时，若确定第n帧下混信号不满足预设的语音帧编码条件、但满足预设的sid编码条件，则预设的sid编码速率对第n帧下混信号进行sid编码，与语音信号编码相比，进一步提高了下混信号的压缩效率。此外，需要说明的是，在第一方面以及上述技术方案中，为了避免解码器无法将下混信号还原，还需将立体声参数集合编码。

7、在第一方面的基础上，为了再进一步提高多声道通信系统的压缩效率，可选的，编码器对立体声参数集合进行非连续编码，具体的，编码器根据第n帧音频信号，得到第n帧立体声参数集合，在检测到第n帧下混信号中包含语音信号时，则对第n帧立体声参数集合编码；在检测到第n帧下混信号中不包含语音信号时：若确定第n帧立体声参数集合满足预设的立体声参数编码条件，则对第n帧立体声参数集合中的至少一个立体声参数编码；若确定第n帧立体声参数集合不满足预设的立体声参数编码条件，则不对立体声参数集合编码；其中，第n帧立体声参数集合中包括z个立体声参数，z个立体声参数包括编码器基于预定算法对第n帧音频信号混合时所用到的参数，z为大于零的正整数。

8、在第一方面的基础上，可选的，为了更进一步提高多声道通信系统的压缩效率，编码器在对第n帧立体声参数集合中的至少一个立体声参数编码前，根据第n帧立体声参数集合中的z个立体声参数，按照预设的立体声参数降维规则，得到x个目标立体声参数，然后再对x个目标立体声参数编码，其中，x为大于零且小于等于z的正整数。

9、其中，预设的立体声参数降维规则可以为预设的立体声参数类型，即从第n帧立体声参数集合中选出符合预设的立体声参数类型的x个立体声参数，或者，预设的立体声参数降维规则为预设的立体声参数个数，即从第n帧立体声参数集合中选出x个立体声参数，或者，预设的立体声参数降维规则为针对第n帧立体声参数集合中至少一个立体声参数降低在时域或频域的分辨率，即按照降低后的至少一个立体声参数在时域或频域的分辨率，基于z个立体声参数确定出x个目标立体声参数。

10、在第一方面的基础上，可选的，还可通过下述方法，提高多声道通信系统的压缩效率：

11、编码器在检测到第n帧音频信号包含语音信号时：根据第n帧音频信号，基于第一立体声参数集合生成方式，得到第n帧立体声参数集合，并对第n帧立体声参数集合编码；在检测到第n帧音频信号不包含语音信号时：若确定第n帧音频信号满足预设的语音帧编码条件，则根据第n帧音频信号，基于第一立体声参数集合生成方式，得到第n帧立体声参数集合，并对第n帧立体声参数集合编码；若确定第n帧音频信号不满足预设的语音帧编码条件，则根据第n帧音频信号，基于第二立体声参数集合生成方式，得到第n帧立体声参数集合，并在确定第n帧立体声参数集合满足预设的立体声参数编码条件时，对第n帧立体声参数集合中的至少一个立体声参数编码；在确定第n帧立体声参数集合不满足预设的立体声参数编码条件时，不对立体声参数集合编码；

12、其中，第一立体声参数集合生成方式和第二立体声参数集合生成方式满足下列至少一个条件：

13、第一立体声参数集合生成方式规定的立体声参数集合中包括的立体声参数类型的个数不少于第二立体声参数集合生成方式规定的本文档来自技高网...

【技术保护点】

1.一种处理多声道音频信号的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述第一类型帧中包含下混信号和立体声参数集合，所述第二类型帧中包含立体声参数集合且不包含下混信号：

3.如权利要求1所述的方法，其特征在于，所述第一类型帧中包含下混信号和立体声参数集合，所述第二类型帧中不包含下混信号且不包含立体声参数集合；

4.如权利要求1所述的方法，其特征在于，所述第一类型帧中包含下混信号和立体声参数集合，第三类型帧中包含立体声参数集合且不包含下混信号，第四类型帧中不包含下混信号且不包含立体声参数集合，所述第三类型帧和所述第四类型帧分别为所述第二类型帧的一种情况：

5.如权利要求1所述的方法，其特征在于，第五类型帧中包含下混信号和立体声参数集合，第六类型帧中包含下混信号且不包含立体声参数集合，所述第五类型帧和所述第六类型帧分别为所述第一类型帧的一种情况，所述第二类型帧中不包含下混信号且不包含立体声参数集合：

6.如权利要求1所述的方法，其特征在于，第五类型帧中包含下混信号和立体声参数集合，第六类型帧中包含下混

7.一种解码器，其特征在于，包括：

8.如权利要求7所述的解码器，其特征在于，所述第一类型帧中包含下混信号和立体声参数集合，所述第二类型帧中包含立体声参数集合且不包含下混信号：

9.如权利要求7所述的解码器，其特征在于，所述第一类型帧中包含下混信号和立体声参数集合，所述第二类型帧中不包含下混信号且不包含立体声参数集合；

10.如权利要求7所述的解码器，其特征在于，所述第一类型帧中包含下混信号和立体声参数集合，第三类型帧中包含立体声参数集合且不包含下混信号，第四类型帧中不包含下混信号且不包含立体声参数集合，所述第三类型帧和所述第四类型帧分别为所述第二类型帧的一种情况：

11.如权利要求7所述的解码器，其特征在于，第五类型帧中包含下混信号和立体声参数集合，第六类型帧中包含下混信号且不包含立体声参数集合，所述第五类型帧和所述第六类型帧分别为所述第一类型帧的一种情况，所述第二类型帧中不包含下混信号且不包含立体声参数集合：

12.如权利要求7所述的解码器，其特征在于，第五类型帧中包含下混信号和立体声参数集合，第六类型帧中包含下混信号且不包含立体声参数集合，所述第五类型帧和所述第六类型帧分别为所述第一类型帧的一种情况，第三类型帧中包含立体声参数集合且不包含下混信号，第四类型帧中不包含下混信号且不包含立体声参数集合，所述第三类型帧和所述第四类型帧分别为所述第二类型帧的一种情况：

13.一种编解码系统，其特征在于，包括和如权利要求7至12任一所述的解码器。

...

【技术特征摘要】

1.一种处理多声道音频信号的方法，其特征在于，包括：

6.如权利要求1所述的方法，其特征在于，第五类型帧中包含下混信号和立体声参数集合，第六类型帧中包含下混信号且不包含立体声参数集合，所述第五类型帧和所述第六类型帧分别为所述第一类型帧的一种情况，第三类型帧中包含立体声参数集合且不包含下混信号，第四类型帧中不包含下混信号且不包含立体声参数集合，所述第三类型帧和所述第四类型帧分别为所述第二类型帧的一种情况：

7.一种解码器，其特征在于，包括：

【专利技术属性】
技术研发人员：王喆，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人