麦克风阵列语音波束形成方法、语音信号处理装置及系统制造方法及图纸

技术编号:7059259 阅读:432 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种麦克风阵列语音波束形成方法,包括数字信号转换步骤、频域信号获取步骤、时延获取步骤、时延补偿步骤及加权叠加步骤,尤其在时延获取步骤采用基于相位转换的时延估计,从而获得了增强处理后的指向目标声源空间位置的波束形成信号,相对于现有技术提升了三维空间的定位精度以及指向性,大大增强了在复杂声学环境中的远距离拾音能力,获得了高质量的语音信号,减少了噪声和其它干扰。本发明专利技术实施例还公开了一种语音信号处理装置及系统。

【技术实现步骤摘要】

本专利技术涉及复杂声学环境中室内/外音频信号获取例如噪声污染大或室内混响 (room reverberation)严重情等况下的远距离拾音数字麦克风阵列(digital microphone array, DMA)技术,尤其涉及一种麦克风阵列语音波束形成方法、语音信号处理装置及系统
技术介绍
由于目标声源可能受到背景噪声(汽车、说话的人及爆炸声等)以及多径反射和混响等因素的影响,导致单个麦克风接收的信号信噪比降低,从而使得语音通信质量严重恶化,致使感兴趣的说话人的声音难以听清。在噪声处理上,传统的单个孤立麦克风一般采用频域谱抵消(spectral subtraction)和滤波等技术来抑制噪声。遗憾的是,这些接收到的信号和噪声往往在时间和频谱上相互重叠,尤其是在室内语音条件下,墙壁和其它物体的反射信号实际上就是原信号的复制,要去除这些多径反射极其困难。因此,使用传统的单一麦克风及其相应的数字信号处理方法来增强感兴趣的声音并有效抑制背景噪声、方向性强干扰(如不感兴趣的声音等)和室内混响相当困难。针对单个孤立麦克风的以上不足,人们使用麦克风阵列(Microphone Array, MA ) 来提高语音通信的质量,所谓麦克风阵列,就是由多个麦克风按照一定的拓扑结构组成一个阵列,现有常见的有麦克风均勻线列阵、均勻圆阵等一维或二维阵列。然而,在实际的应用中,更多的则是使用具有任意拓扑结构的麦克风阵列,也即三维空间的麦克风阵列。因此,与麦克风阵列均勻线阵及圆阵模型相比,建立一个通用的可指向三维空间位置的目标声源的麦克风阵列语音信号处理模型更具有普遍的意义。专利技术内容本专利技术实施例所要解决的技术问题在于,建立一种通用的、更具有普遍的意义麦克风阵列语音信号处理模型,提供一种麦克风阵列语音波束形成方法、语音信号处理装置及系统。为了解决上述技术问题,本专利技术实施例提出了一种麦克风阵列语音波束形成方法,包括数字信号转换步骤对由至少两个麦克风组成的麦克风阵列获取的麦克风信号转换为数字信号;频域信号获取步骤获取所述数字信号的频域信号;时延获取步骤对所述频域信号进行广义相关分析获取目标声源相对两个所述麦克风的相对时延;时延补偿步骤根据所述时延对所述频域信号进行时延补偿;加权叠加步骤对时延补偿后的信号进行加权叠加增强处理后获得指向所述目标声源空间位置的波束形成信号。相应地,本专利技术实施例还提供了一种语音信号处理装置,用于对由至少两个麦克风组成的麦克风阵列获取的麦克风信号进行语音增强处理,所述语音信号处理装置包括 用于将所述麦克风阵列获取的麦克风信号转换为数字信号的数字信号转换模块;用于获取所述数字信号的频域信号的频域信号获取模块;用于对所述频域信号进行广义相关分析获取目标声源相对两个所述麦克风的相对时延的时延获取模块;用于根据所述时延对所述频域信号进行时延补偿的时延补偿模块;用于对时延补偿后的信号进行加权叠加增强处理后获得指向所述目标声源空间位置的波束形成信号的加权叠加模块。进一步地,本专利技术实施例还提供了一种语音信号处理系统,该系统包括由至少两个麦克风组成的、用于获取麦克风信号的麦克风阵列;用于对所述麦克风信号进行语音增强处理的语音信号处理装置,其中,所述语音信号处理装置包括用于将所述麦克风阵列获取的麦克风信号转换为数字信号的数字信号转换模块;用于获取所述数字信号的频域信号的频域信号获取模块;用于对所述频域信号进行广义相关分析获取目标声源相对两个所述麦克风的相对时延的时延获取模块;用于根据所述时延对所述频域信号进行时延补偿的时延补偿模块;用于对时延补偿后的信号进行加权叠加增强处理后获得指向所述目标声源空间位置的波束形成信号的加权叠加模块。本专利技术实施例的麦克风阵列语音波束形成方法通过数字信号转换步骤、频域信号获取步骤、时延获取步骤、时延补偿步骤及加权叠加步骤,尤其在时延获取步骤采用基于相位转换的时延估计,从而获得了增强处理后的指向目标声源空间位置的波束形成信号,相对于现有技术提升了三维空间的定位精度以及指向性,大大增强了在复杂声学环境中的远距离拾音能力,获得了高质量的语音信号,减少了噪声和其它干扰。附图说明图1是本专利技术实施例的麦克风阵列的语音信号处理流程示意图。图2是本专利技术实施例的麦克风阵列语音波束形成流程示意图。图3是图2所示的麦克风阵列语音波束对应的三维空间麦克风阵列模型示意图。图4是本专利技术实施例的语音信号处理系统的功能模块示意图。具体实施例方式下面结合附图,对本专利技术实施例进行详细说明。请参考图1,本专利技术实施例的麦克风阵列有麦克风(Γ4组成,各个麦克风获得的语音信号依次经过数字信号转换、频域信号获取及时延获取后,分别进行对应的时延补偿 (Γ4,然后再经过加权叠加,最后得到语音信号增强的语音波束。具体地,本专利技术实施例的麦克风阵列语音波束形成方法,包括数字信号转换步骤对由至少两个麦克风组成的麦克风阵列获取的麦克风信号转换为数字信号;频域信号获取步骤获取所述数字信号的频域信号;时延获取步骤对所述频域信号进行广义相关分析获取目标声源相对两个所述麦克风的相对时延;时延补偿步骤根据所述时延对所述频域信号进行时延补偿; 加权叠加步骤对时延补偿后的信号进行加权叠加增强处理后获得指向所述目标声源空间位置的波束形成信号。具体地,所述频域信号获取步骤中,通过如下公式来获取所述数字信号的频域信号权利要求1.一种麦克风阵列语音波束形成方法,其特征在于,包括数字信号转换步骤对由至少两个麦克风组成的麦克风阵列获取的麦克风信号转换为数字信号;频域信号获取步骤获取所述数字信号的频域信号;时延获取步骤对所述频域信号进行广义相关分析获取目标声源相对两个所述麦克风的相对时延;时延补偿步骤根据所述时延对所述频域信号进行时延补偿; 加权叠加步骤对时延补偿后的信号进行加权叠加增强处理后获得指向所述目标声源空间位置的波束形成信号。2.如权利要求1所述的麦克风阵列语音波束形成方法,其特征在于,所述频域信号获取步骤中,通过如下公式来获取所述数字信号的频域信号即经过J点的快速傅里叶变换变换得到频域信号Zd (□,□) (k=l,……N,w=l,…… J),其中,J为512的正整数倍,1表示第1对麦克风对,1 = 1,……L;r表示声源到麦克风的距离;S表示对应声源的频谱变换;V表示通道及背景噪声的频谱;□表示傅立叶变换函数。3.如权利要求2所述的麦克风阵列语音波束形成方法,其特征在于,所述时延获取步骤包括如下子步骤互功率谱获取子步骤通过如下公式来获取2路所述频域信号之间的互功率谱其中,E表示数学期望;2》(□,□)表示复共轭;反傅立叶变换子步骤通过如下公式来对所述互功率谱做反傅立叶变换其中,R表示互功率谱的反傅立叶变换;ω为300Hz - 2kHz的语音信号频率范围; 为加权函数即相位变换函数,也即互功率谱的模的倒数;搜索最大值子步骤通过如下公式来搜索出所述反傅里叶变换所得数据中的最大值, 对应的时延点即为求出的时延4.如权利要求3所述的麦克风阵列语音波束形成方法,其特征在于,所述时延补偿步骤通过如下公式来对L路多通道频域信号直接进行时延补偿5.如权利要求4所述的麦克风阵列语音波束形成方法,其特征在于,所述加权叠加步骤中,通过如下公式来对所述频域信号进行加权叠加,并进行反本文档来自技高网...

【技术保护点】
1.一种麦克风阵列语音波束形成方法,其特征在于,包括:数字信号转换步骤:对由至少两个麦克风组成的麦克风阵列获取的麦克风信号转换为数字信号;频域信号获取步骤:获取所述数字信号的频域信号;时延获取步骤:对所述频域信号进行广义相关分析获取目标声源相对两个所述麦克风的相对时延;时延补偿步骤:根据所述时延对所述频域信号进行时延补偿;加权叠加步骤:对时延补偿后的信号进行加权叠加增强处理后获得指向所述目标声源空间位置的波束形成信号。

【技术特征摘要】

【专利技术属性】
技术研发人员:钟雄虎舒畅
申请(专利权)人:深圳市华新微声学技术有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1