用于多通道语音信号的处理方法、装置、设备和存储介质制造方法及图纸

技术编号：40182112 阅读：20 留言：0更新日期：2024-01-26 23:47

本公开的实施例提供了一种用于多通道语音信号的处理方法、装置、设备和计算机可读存储介质。本公开的实施例所提供的方法面向麦克风阵列阵型已知的应用场景，提出了一种适用于任何麦克风阵列阵型的多通道语音前处理框架，其中，通过将麦克风阵列所采集的多通道语音信号中与该麦克风阵列的阵型信息相关的语音特征应用于该多通道语音信号的处理，使得同一经训练的多通道语音信号处理模型可以应用于任何麦克风阵型，而不需要为每种麦克风阵型训练专用的模型。此外，通过本公开的实施例的方法能够利用可知的阵型信息，支持诸如声源定位、定向增强、音区提取等的多种前处理任务。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据处理领域，更具体地，涉及一种用于多通道语音信号的处理方法、装置、设备和存储介质。

技术介绍

1、多通道语音前处理(multi-channel speech processing，mc-sp)是一种用于增强多通道语音信号质量的技术，其旨在通过利用多通道信息和信号处理技术，提高语音信号的质量和可理解性。在麦克风阵列(即，排列成一定几何结构的多个麦克风)所采集到的多通道语音信号中，来自不同麦克风的信号可以提供更多的空间信息，但也可能受到噪声、回声等干扰。对此，多通道语音前处理模型可以基于麦克风阵列所采集到的多通道语音信号，对其进行目标语音分离、降噪、去混响等操作。

2、多通道语音前处理技术在语音信号处理领域具有重要意义，它能够提高语音信号的质量和可理解性，为后续的语音识别、语音合成等应用提供更好的输入。然而，目前的多通道语音前处理技术仍然存在一些挑战和问题。

3、因此，需要一种改进的多通道语音前处理方法，用于进一步增强多通道语音信号的质量和可理解性。

技术实现思路>

1、为了解决本文档来自技高网...

【技术保护点】

1.一种用于多通道语音信号的处理方法，包括：

2.如权利要求1所述的方法，其中，所述经训练的多通道语音信号处理模型与预定任务相关联，所述预定任务包括定向增强任务、声源定位任务和语音分离任务中的一个或多个。

3.如权利要求1所述的方法，还包括：获取与所述多通道语音信号相关的任务特定信息，所述任务特定信息指示与针对所述多通道语音信号的预定任务相对应的信息；

4.如权利要求3所述的方法，其中，在所述预定任务包括定向增强任务的情况下，

5.如权利要求4所述的方法，其中，基于所述第一麦克风阵列的阵型信息、所述任务特定信息和所述多通道语音信号，确定与所...

【技术特征摘要】

1.一种用于多通道语音信号的处理方法，包括：

4.如权利要求3所述的方法，其中，在所述预定任务包括定向增强任务的情况下，

5.如权利要求4所述的方法，其中，基于所述第一麦克风阵列的阵型信息、所述任务特定信息和所述多通道语音信号，确定与所述第一麦克风阵列的阵型信息相关、并且特定于所述预定任务的语音特征包括：

6.如权利要求4或5所述的方法，其中，所述方向特征是基于在时频域中由所述第一麦克风...

【专利技术属性】
技术研发人员：顾容之，罗艺，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人