基于嵌套子阵列的后置滤波与谱减法联合语音增强方法技术

技术编号:3048206 阅读:241 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于嵌套子阵列的自适应后置滤波与谱减法联合的语音增强方法,适用于室内环境,包括车载环境的多通道语音信号的增强。由于本发明专利技术考虑到了语音信号的宽带非平稳特性,基于麦克风阵列多通道语音增强方法对于语音信号的频率响应不一致,且在实际噪声场环境中,各通道噪声之间的相关性等问题,通过由间距不等的子阵列嵌套构成的麦克风阵列采集语音信号,并将各子阵列波束形成后的语音信号分成高频段和低频段,采用不同的语音增强算法进行处理,优势互补,提高了语音增强的效果。

【技术实现步骤摘要】

本专利技术涉及到计算机语音信号处理领域,更具体地说,本专利技术涉及一种基 于嵌套子阵列的后置滤波与谱减法联合语音增强方法,尤其适用于室内嘈杂环 境中话音信号的增强。
技术介绍
语音增强(SpeechEnhancement)技术就是对带噪的语音进行相关处理,从 中提取尽可能纯净的原始语音,以改善接收端语音质量,提高语音的清晰度、 可懂度和舒适度,使人易于接受或提高语音处理系统的性能。常用在自动语音 识别系统、车载非手持式电话、多媒体会议、无线通信、场景录音、军事窃听、 助听设备和智能机器人等领域。语音增强技术的研究发展已有四十多年的历史, 传统的方法皆是基于单一麦克风的系统,其拾音范围、指向性变化、噪声抑制 能力等问题都受到一定的限制。基于麦克风阵列的自适应语音增强技术融合了 阵列信号处理技术、语音信号处理技术以及多通道信号采集技术等多项关键技 术。其技术优势在于它不仅可以利用语音信号的时域和频域特性,而且可以利 用其空间信息来实现对噪声的消除,达到增强和纯化语音的目的。基于麦克风 阵列的语音增强方法典型的工作流程如图l所示,具体描述如下-1) 根据应用要求设计麦克风阵列结构;2) 利用麦克风阵列接收到的多通道语音信号的时间、频率、空间信息, 对语音信号的起始、结束端点进行检测,同时估计通道之间的时间延 迟,估计信号空间方位信息;3) 采用语音增强算法对多通道信号进行处理,实现语音信号的增强。 前述步骤l)中的麦克风阵列结构设计是一项关键的步骤。传统的阵列结构有均匀线阵、非均匀线阵、均匀圆阵和球面阵列等。阵列结构的设计与多通道 信号模型的选择有密切关系。阵列信号模型分为近场模型和远场模型,其最大区别在于在远场模型中, 各阵元接收到的信号幅度被认为是相同的,有相位差;而近场模型则需要考虑传播路径的不同带来的信号幅度衰减,即近场模型除了要考虑信源的到达方向 之外,还必须考虑信源到各个麦克风的距离。在近场情况下,通常采用球面波 前模型,来代替远场的平面波前模型。与时域采样定理类似,为了防止出现空间混迭现象,基于麦克风阵列传感 器空间釆样也需要满足一定的条件,称为空间采样定理,描述为式(l)-<formula>formula see original document page 5</formula> (1)其中,是相邻麦克风阵元间的直线距离,A为声波的波长。只有空间采样率足 够高,才能避免空间混迭。然而,如果阵元距离过小,则是才采样,采用较多 的麦克风传感器并不能提供更多的信号空间信息。此外,信号源与麦克风阵列之间距离也将影响信号模型的建立。定义r为声 源到麦克风阵列中心的直线距离,丄为线性麦克风阵列的总长度。如果满足式(2),则符合远场条件;反之,则需采用近场模型。<formula>formula see original document page 5</formula> (2)对于一个均匀线性麦克风阵列,采用远场平面波模型,则第m个麦克风的 输出离散信号可表示为<formula>formula see original document page 5</formula> (3)其中,^h]为声源信号,A 为第m个麦克风接收到的信号与声源信号之间的样 本点延迟,77j]为第m个麦克风接收到的噪声信号。A^为第m个麦克风接收到的信号与声源信号之间的时间延迟,则有如下关系式-<formula>formula see original document page 5</formula> (4)式(4)中,乂为采样频率,c为声波在空间传播的速度。前述步骤2)中的语音端点检测(Voice Activity Detection, VAD)步骤可视不 同语音增强算法或增或减。鲁棒的VAD方法对实现噪声信号的统计特征估计, 以及后续的语音增强算法的性能都具有重要的作用。通常办法是采用单一通道 的基于短时能量的VAD方法、基于过零率的VAD方法、基于线性预测系统的VAD方法等等。此外,基于阵列结构的端点检测方法常用的有基于波束形成器的VAD方法、基于相位向量的VAD方法以及基于GSC的空间VAD方法。前述步骤3)中,语音增强技术主要可分为基于单一麦克风的方法和基于麦 克风阵列的方法,其中基于单一麦克风的方法最成熟也最简单有效的是谱减法 语音增强算法;而基于麦克风阵列的方法目前广泛采用的有a)固定波束形成 器(Fixed B醒fo謹g, FBF); b)自适应波束形成器(Adaptive Beamforming, ABF); c)具有自适应后置滤波器的波束形成法(Microphone Arrays with Adaptive Postfiltering); d)广义旁瓣消除法(Generalized Sidelobe Canceller, GSC)等等。 除此之外, 一些改进的算法、联合的算法也层出不穷。常用的有将谱减法与固 定波束形成器相结合的语音增强方法;固定波束形成器与自适应后置滤波联合 语音增强方法;基于空间传输函数的广义旁瓣消除语音增强方法等。常用的基 于时延-累加波束形成前述的谱减法(Spectral Subtraction, SS)语音增强算法是经典的单一通道语 音增强方法之一,是1979年由美国犹他大学(University of Utah) Steven F. Boll 教授提出的一种普遍应用于单通道含加性噪声的语音增强算法。如图2所示, 该方法通过对受污染的语音信号和估计的噪声信号的短时幅度谱进行相减处 理,获得纯净的语音信号,其效果相当于在变换域对含噪语音信号进行了某种 均衡化处理。然而,实际中噪声的频谱服从高斯分布,噪声的帧功率谱变化范 围很宽,在频域中的最大、最小值之比往往达到几个数量级,而最大值与均值 之比也达6-8倍。因此,在减去噪声谱之后,会有较大的功率谱分量的剩余部分, 在频谱上呈现随机出现的尖峰,在听觉上形成残留噪声。这种噪声具有一定节 奏起伏感,称为音乐噪声。此外,在谱减算法中语音的各个部分受到的影响 是不同的。摩擦音由于其特征与噪声相似,在处理过程中会和噪声一起被抑制。 鼻音能量较低,其功率谱的幅度与噪声接近,增强效果远不如浊音。谱减法的 衰减作用使语音的非浊音部分和高频部分减弱,这就是增强后语音的可懂度下 降的原因。时延-累加波束形成器(Delay-and-Sum Beamformer, DSBF)是一种典型的 固定波束形成器,分为时延补偿和加权求和两部分。如图3所示,采用远场模 型,假设噪声为加性噪声,以第m通道接收到的信号为例,其表达式为^[][-A;J + J] (5)利用时延估计算法得到语音信号在各通道的时间延迟,再采用时延补偿将各通道信号在时域对齐,得到= + (6)对各通道信号进行加权求和,即得到波束形成输出信号-y[] = 2X[],w[] (7)在波束形成算法中,准确的时延估计是多通道语音增强的基础。延迟-累加 波束形成器具有系统简单、算法鲁棒、计算量小的优点,可应用于实际系统。该算法在理论上可获得101ogH)M的信噪比提高。所以要获得好的语音增强,则本文档来自技高网...

【技术保护点】
一种采用嵌套子阵列的后置滤波谱减法联合的语音增强方法,用于室内环境的多通道语音信号增强,其特征在于,所述方法包括: 1)设计两个均匀子阵列嵌套的麦克风阵列用于多通道信号的采集; 2)检测语音信号的起始、结束端点,估计纯噪声信号的 功率谱; 3)估计语音信号在各通道的时间延迟; 4)对各通道语音信号进行时延补偿,将各通道语音信号在时域对齐; 5)用傅里叶变换将各通道信号从时域转换到频域; 6)估计纯净语音信号的自功率谱和带噪语音信号的自功率谱, 得到维纳滤波器的频响函数; 7)对于两子阵列的信号,分别用固定波束形成器将各子阵列的每个通道的信号进行波束形成; 8)分别将两个子阵列的输出波束进行低通滤波和高通滤波; 9)对滤波后的两子阵列的输出波束进行谱减法或后置维纳 滤波法处理,实现语音增强; 10)将两路增强后的波束交叠相加,进行反傅里叶变换,得到时域里增强后的语音信号。

【技术特征摘要】
1、一种采用嵌套子阵列的后置滤波谱减法联合的语音增强方法,用于室内环境的多通道语音信号增强,其特征在于,所述方法包括1)设计两个均匀子阵列嵌套的麦克风阵列用于多通道信号的采集;2)检测语音信号的起始、结束端点,估计纯噪声信号的功率谱;3)估计语音信号在各通道的时间延迟;4)对各通道语音信号进行时延补偿,将各通道语音信号在时域对齐;5)用傅里叶变换将各通道信号从时域转换到频域;6)估计纯净语音信号的自功率谱和带噪语音信号的自功率谱,得到维纳滤波器的频响函数;7)对于两子阵列的信号,分别用固定波束形成器将各子阵列的每个通道的信号进行波束形成;8)分别将两个子阵列的输出波束进行低通滤波和高通滤波;9)对滤波后的两子阵列的输出波束进行谱减法或后置维纳滤波法处理,实现语音增强;10)将两路增强后的波束交叠相加,进行反傅里叶变换,得到时域里增强后的语音信号。2、 根据权利要求1所述的嵌套子阵列的麦克风阵列结构,其特...

【专利技术属性】
技术研发人员:邹月娴赵璟万波
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1