一种语音信号增强系统和方法技术方案

技术编号:8348203 阅读:244 留言:0更新日期:2013-02-21 02:13
本发明专利技术公开了一种语音信号增强系统和方法,方法包括如下步骤:将输入信号通过自适应滤波器进行滤波得到语音参考信号,利用阻塞矩阵对输入信号进行噪声提取处理,得到噪声参考信号;将噪声参考信号和语音参考信号通过多通道维纳滤波进行滤波得到降噪语音信号;根据噪声参考信号对降噪语音信号进行语音增强处理,得到增强语音信号和语音存在概率信号;根据语音存在概率信号对自适应匹配滤波器的滤波系数、阻塞矩阵、多通道维纳滤波器的滤波系数和学习步长进行更新。本发明专利技术在麦克风阵列比较简单的情况下,很好地克服在实际应用环境下对目标源实时跟踪的收敛不能保证、速度慢和实时增强失真大等问题。

【技术实现步骤摘要】

本专利技术属于信号处理
,具体涉及语音信号的增强处理,特别是一种语音增强系统和方法。
技术介绍
语音增强是指当语音信号被各种各样的噪声干扰后,从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。语音增强的一个主要目标是从带噪语音信号中提取尽可能纯净的原始语音,改进语音质量。随着数字信号处理理论成熟和硬件计算能力的大幅提升,使得基于麦克风阵列语音增强性能和实时性得以保证。传统的广义旁瓣消除语音增强法必须已知准确的目标源方位角,用线性预测的方式对噪声抑制。其缺点是难以满足目标源方位角未知或目标源移动的情况,广义旁瓣消除 方法信号失真较大,并且用传统的NLMS自适应滤波方法收敛速度慢。传统的多通道维纳滤波在平稳噪声环境下较广义旁瓣消除的信号失真较小,但是对于复杂环境下的目标源活性检测误差较大,信号失真也较大。传统的单通道语音幅度谱估计在平稳噪声环境下,能较为准确的估计噪声功率谱密度,但是在非平稳噪声情况下,噪声估计误差较大,会造成严重的音乐噪声和信号失真。如今大多数使用麦克风阵列语音增强的设备主要是基于指向型麦克风,即将有向麦克对准目标源,然后经过简单的处理。因此这类设备需要已知目标源的位置,且不能对目标源做实时跟踪。在实际应用环境下,噪声和干扰的情况往往比较复杂,并且如果目标源存在移动情况,会对目标源尤其是移动目标源的跟踪和增强产生巨大的影响,其结果是使现有的语音增强系统和方法所涉及的一些滤波器系数更新算法难以收敛,处理后得到结果相对于真实的信号源存在大量的失真。而现有的在这些方面表现较好的语音增强系统和方法,往往对麦克风阵列中麦克风的数量和布局有特定的要求。
技术实现思路
(一 )要解决的技术问题本专利技术所述解决的技术问题是现有的语音增强系统和方法在实际应用环境下进行语音信号处理时,对目标源实时跟踪以及对目标源实时增强性能不佳的问题。(二)技术方案为解决上述技术问题,本专利技术提出一种语音信号增强系统,用于对包含目标语音信号的输入信号进行增强,所述目标语音信号由目标源发出,该系统包括目标源跟踪模块、噪声自适应模块、多通道维纳滤波模块和语音幅度谱估计模块,其中输入信号分别连接到目标源跟踪模块和噪声自适应模块,所述目标源跟踪模块用于对输入信号进行滤波,得到一个语音参考信号;所述噪声自适应模块用于对输入信号进行处理,消去目标源成分,得到一个噪声参考信号;所述多通道维纳滤波模块用于接收所述语音参考信号和所述噪声参考信号,并利用所述噪声参考信号对所述语音参考信号进行滤波,得到一个降噪语音信号;所述语音幅度谱估计模块用于接收所述降噪语音信号和所述噪声参考信号,并根据所述噪声参考信号对所述降噪语音信号进行语音增强处理,得到一个语音增强信号和一个语音存在概率信号,并将所述语音存在概率信号反馈到所述目标源跟踪模块、噪声自适应模块和多通道维纳滤波模块,以对目标源跟踪模块、噪声自适应模块和多通道维纳滤波模块的参数进行实时调节。本专利技术还提出一种语音信号增强方法,用于对包含目标语音信号的输入信号进行增强,所述目标语音信号由目标源发出,该方法包括如下步骤Si、将所述输入信号通过一个自适应滤波器进行滤波得到一个语音参考信号,利用阻塞矩阵对所述输入信号进行噪声提取处理,得到一个噪声参考信号;S2、将所述噪声参考信号和所述语音参考信号通过一个多通道维纳滤波进行滤波得到一个降噪语音信号;S3、根据所述噪声参考信号对所述降噪语音信号进行语音增强处理,得到一个增强语音信号和一个语音存在概率信号;S4、根据语音存在概率信号对所述自适应匹配滤波器的滤波系数、阻塞矩阵、多通道维纳滤波器的滤波系数和学习步长进行更新。(三)有益效果·本专利技术的系统和方法可以在麦克风阵列比较简单的情况下,很好地克服在实际应用环境下对目标源实时跟踪的收敛不能保证、速度慢和实时增强失真大等问题。首先,在实际干扰和噪声较为复杂的应用环境下能够进行实时语音信号处理,能够对目标源尤其是移动目标源进行很好地跟踪并进行实时增强。其次,本专利技术所采用的方法对麦克风阵列本身没有太大要求,并且对目标源的先验知识要求比较少,对目标源的行为(主要指移动和是否处于活动状态)要求也不算严格,所以使得本专利技术应用范围比较广泛。再次,本专利技术是基于ASIO音频驱动进行设计和实现的,实时数据的输入和输出的延迟非常小,使本专利技术能够适应数据延迟性要求较高的应用场合,增强了本专利技术的实用性。最后,在本专利技术下的应用时,如果针对不同的应用环境有针对性地选择麦克风阵列,本专利技术的处理效果会更加优越。附图说明图I是本专利技术的语音增强系统的结构框图;图2和图3是本专利技术不能处理的特殊情况的不意图;图4为本专利技术进行实验验证时的实验布局示意图。具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。本专利技术的语音增强系统和该语音增强系统所采用的方法是从实际应用环境出发,根据实际应用环境进行研究的。本专利技术使用的实验数据都是在实际场景下录制得到的,理论结合实验,得到了大体的处理方法框架。同时为了达到本专利技术能够实时运行的目的,我们不仅考虑了运行效果,而且把运算速率作为另一个重要的因素放入本专利技术的研究中,使得本专利技术能同时兼顾运行效果和运算速度。基于以上考虑,专利技术人对于本专利技术进行了进一步的完善,最后得到本专利技术的语音增强系统和方法。图I是本专利技术的语音增强系统的结构框图。如图I所示,本专利技术的语音增强系统主要由目标源跟踪模块、噪声自适应模块、多通道维纳滤波模块和语音幅度谱估计模块四个模块组成,输入信号分别连接到目标源跟踪模块和噪声自适应模块。目标源跟踪模块用于对输入信号进行滤波,得到目标语音参考信号;噪声自适应模块用于对输入信号进行处理,消去目标源成分,得到噪声参考信号。所述输入信号包含目标语音信号,所述目标语音信号由目标源发出。本专利技术的创新点在于根据实际环境的特性,经过反复实验,确定用这四个模块组成本专利技术的信号增强系统的基本架构。本专利技术的四个模块主要涉及传统的广义旁瓣消除、多通道维纳滤波、以及语音幅度谱估计三个技术环节。我们将这些技术环节进行修改并整合到本专利技术的模块中,使这些模块能够有机地结合起来,产生良好的处理效果,以达到实用 的目的。目标源跟踪模块和噪声自适应模块是本专利技术的系统的关键所在,本专利技术能够根据输入信号的信噪比将输入信号判定为纯噪声和带噪信号。纯噪声中不含有目标源成分,带噪信号含有需要提取的目标成分以及噪声成分。根据本专利技术的一个具体实施例,所述目标源跟踪模块可由一个滤波器实现,该滤波器的滤波系数可以实时更新;并且,所述噪声自适应模块利用一个阻塞矩阵消去输入信号中的目标源成分,从而得到噪声参考信号。继续参照图1,所述语音参考信号和噪声参考信号均输入到所述多通道维纳滤波模块,该多通道维纳滤波模块利用噪声参考信号对语音参考信号进行滤波,得到一个降噪语音信号。根据本专利技术的该实施例,该多通道维纳滤波模块可以由计算量很小的基于最小均方误差准则的自适应滤波器实现。所述降噪语音信号和所述噪声参考信号均输入到所述语音幅度谱估计模块,所述语音幅度谱估计模块根据所述噪声参考信号对所述降噪语音信号进行语音增强处理,得到一个语音增强信号和一个语音存在概率信号。根据本专利技术的该实施例,所述语音幅本文档来自技高网
...

【技术保护点】
一种语音信号增强系统,用于对包含目标语音信号的输入信号进行增强,所述目标语音信号由目标源发出,其特征在于,该系统包括目标源跟踪模块、噪声自适应模块、多通道维纳滤波模块和语音幅度谱估计模块,其中输入信号分别连接到目标源跟踪模块和噪声自适应模块,所述目标源跟踪模块用于对输入信号进行滤波,得到一个语音参考信号;所述噪声自适应模块用于对输入信号进行处理,消去目标源成分,得到一个噪声参考信号;所述多通道维纳滤波模块用于接收所述语音参考信号和所述噪声参考信号,并利用所述噪声参考信号对所述语音参考信号进行滤波,得到一个降噪语音信号;所述语音幅度谱估计模块用于接收所述降噪语音信号和所述噪声参考信号,并根据所述噪声参考信号对所述降噪语音信号进行语音增强处理,得到一个语音增强信号和一个语音存在概率信号,并将所述语音存在概率信号反馈到所述目标源跟踪模块、噪声自适应模块和多通道维纳滤波模块,以对目标源跟踪模块、噪声自适应模块和多通道维纳滤波模块的参数进行实时调节。

【技术特征摘要】

【专利技术属性】
技术研发人员:张宁马峰戴礼荣凌震华
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利