当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于优化IMCRA的麦克风阵列语音增强方法技术

技术编号:26422461 阅读:49 留言:0更新日期:2020-11-20 14:18
一种基于优化IMCRA的麦克风阵列语音增强方法,包括:分别计算每个麦克风采集到的信号,构成麦克风阵列;计算麦克风阵列的输出信号;计算阻塞矩阵输出信号中的平均噪声信号;使用优化的IMCRA方法估计的噪声功率谱密度;将麦克风阵列的输出信号和噪声功率谱密度输入到MMSE‑LSA估计器,得到最终的语音增强信号。本发明专利技术不仅提高了噪声估计的精度,而且减少了语音增强的计算量;既利用了麦克风阵列语音增强的空域特性,也进一步去除了传统麦克风阵列语音增强的噪声残留;能估计出更加准确的噪声功率谱密度,从而使MMSE‑LSA估计器能输出质量更高的增强语音信号。

【技术实现步骤摘要】
一种基于优化IMCRA的麦克风阵列语音增强方法
本专利技术涉及一种语音增强方法。特别是涉及一种基于优化IMCRA的麦克风阵列语音增强方法。
技术介绍
语音作为人类最基本的交流手段,是人与人之间最方便、最直接的信息交互工具。随着科学技术的飞速发展,语音也成为人与机器交流的主要工具。但在日常生活中,语音信号往往受到噪声的干扰。因此,如何降低噪声,或者说如何提高语音质量,特别是语音的可懂度,成为众多学者研究的热点。语音增强的目标是尽可能地抑制噪声。近年来,为了降低噪声,人们提出了许多语音增强方法。根据麦克风的数量,可以分为单通道语音增强和麦克风阵列语音增强。其中,单通道语音增强算法是最早的一种。经典的单通道语音增强算法包括谱减法、维纳滤波和卡尔曼滤波等。然而,在处理过程中,谱减法会产生音乐噪声、维纳滤波法在非平稳环境下性能较差、卡尔曼滤波法会对语音造成损伤。与传统的单通道语音增强方法相比,麦克风阵列语音增强方法具有更多的优点。它不仅利用了样本之间的时域信息,还利用了通道之间的空间信息,提高了语音增强性能。目前,已有许多成熟的麦克风阵列语音增强算法。如固定波束形成算法、自适应波束形成算法以及广义旁瓣相消法。固定波束形成算法容易实现,但需要更多的麦克风才能有效地增强语音。自适应波束形成算法是在固定波束形成的基础上发展起来的。与固定波束形成相比,其关键变化在于加权系数。自适应波束形成的加权系数不再是固定值,而是随着输入的变化而变化。该算法的灵活性得到了提高,可以应用到更多的声学环境中。广义旁瓣相消法它能消除强相关噪声,但对弱相干噪声和非相干噪声的抑制能力较差,计算更加方便灵活。对噪声的功率谱密度进行估计是语音增强的一个重要步骤。噪声环境可分为平稳噪声环境和非平稳噪声环境。在平稳噪声环境中,噪声分布均匀且变化缓慢。它只利用含噪语音信号的噪声段来估计噪声谱,而噪声段通常由语音活动检测方法进行识别。在实际应用中,背景噪声往往是非平稳的,因此研究非平稳噪声环境下的噪声估计算法更具有实际意义。在非平稳噪声环境中,噪声是不断变化的。常用的估计方法有最小值统计法、最小控制递归平均法和改进最小控制递归平均法。对于单通道语音增强算法,噪声功率谱估计器一般利用信号的时间谱特性。在非平稳噪声环境下,它的估计精度会下降。因为这些方法假设噪声仅在语音不存在时更新,而在语音存在时不更新。实际上,噪音总是存在的。这将导致在噪声变化很快时,非平稳噪声不能被准确地估计。然而,麦克风阵列可以通过空间分离信号来克服单通道方法的局限性,这相对容易提取语音或噪声成分。因此,将麦克风阵列语音增强与噪声估计算法相结合,可以显著提高噪声估计的精度,同时减少了计算量。
技术实现思路
本专利技术所要解决的技术问题是,提供一种能够提高噪声估计的精度和语音增强性能的基于优化IMCRA的麦克风阵列语音增强方法。本专利技术所采用的技术方案是:一种基于优化IMCRA的麦克风阵列语音增强方法,包括如下步骤:1)分别计算每个麦克风采集到的信号xn(t),构成麦克风阵列;2)计算麦克风阵列的输出信号ya(t);3)计算阻塞矩阵输出信号中的平均噪声信号BAV(t);4)使用优化的IMCRA方法估计的噪声功率谱密度5)将麦克风阵列的输出信号y(t)和噪声功率谱密度输入到MMSE-LSA估计器,得到最终的语音增强信号。步骤1)包括:设定空间中有J个信号sj(t),j∈1,2,3,...,J,N+1个麦克风,第n个麦克风在时间t接收到的信号为xn(t):式中,hn,j是从第j个声源到第n个麦克风的声道脉冲响应,vn(t)表示加性噪声,表示卷积,其中n表示阵列中的麦克风,n∈1,2,...,N;在信号sj(t)中,j=1时,表示所需的期望语音信号,j=2,3,...,J时,表示干扰信号。步骤2)包括:对麦克风阵列在t时刻接收到的信号xN(t)使用波束形成的方法计算阵列的输出信号ya(t):式中,阵列输入信号为xN(t),xN(t)=[x1(t),x2(t),...,xN(t)],波束形成的权重为wa(t),wa(t)=[wa,1(t),wa,2(t),...,wa,N(t)]。步骤3)包括:将基于麦克风阵列在t时刻接收到的信号xN(t)通过如下阻塞矩阵B,得到噪声信号:再将所述的噪声信号采用如下公式进行平均处理得到平均噪声信号BAV(t):其中,N表示麦克风的总个数。步骤4)是将麦克风阵列的输出信号ya(t)和平均噪声信号BAV(t)经过傅立叶变换后得到对应的频域信号ya(k,l)和BAV(k,l),再将所述的频域信号使用优化的IMCRA方法估计噪声的功率谱密度其中,k表示频率。所述的优化的IMCRA方法是在IMCRA方法中的噪声功率谱密度的更新公式加入平均噪声信号BAV(t),具体公式如下:其中,是在频率k和第l帧估计的噪声功率谱密度,是估计的第l+1帧的噪声功率谱密度;αd是平滑因子;p(k,l)是信号存在的概率,q(k,l)是信号不存在的概率;所述的优化的IMCRA方法中,q(k,l)的判决阈值参数γ1=4.6,q(k,l)的判决阈值参数ζ1=1.67,第一次迭代中语音存在的判决阈值参数γ0=4.6,第一次迭代中语音存在的判决阈值参数ζ0=1.67。本专利技术的一种基于优化IMCRA的麦克风阵列语音增强方法,将噪声估计算法与麦克风阵列语音增强相结合,不仅提高了噪声估计的精度,而且减少了语音增强的计算量。本专利技术的方法将麦克风阵列语音增强和单通道语音增强相结合,既利用了麦克风阵列语音增强的空域特性,也进一步去除了传统麦克风阵列语音增强的噪声残留。本专利技术首先使用波束形成的方法对麦克风阵列接收到的含噪信号进行处理,使含噪信号的信噪比得到提升。优化的IMCRA方法能估计出更加准确的噪声功率谱密度,从而使MMSE-LSA估计器能输出质量更高的增强语音信号。附图说明图1是本专利技术的一种基于优化IMCRA的麦克风阵列语音增强方法的构成框图。具体实施方式下面结合实施例和附图对本专利技术的一种基于优化IMCRA的麦克风阵列语音增强方法做出详细说明。如图1所示,本专利技术的一种基于优化IMCRA的麦克风阵列语音增强方法,包括如下步骤:1)分别计算每个麦克风采集到的信号xn(t),构成麦克风阵列;包括:设定空间中有J个信号sj(t),j∈1,2,3,...,J,N+1个麦克风,第n个麦克风在时间t接收到的信号为xn(t):式中,hn,j是从第j个声源到第n个麦克风的声道脉冲响应,vn(t)表示加性噪声,表示卷积,其中n表示阵列中的麦克风,n∈1,2,...,N;在信号sj(t)中,j=1时,表示所需的期望语音信号,j=2,3,...,J时,表示干扰信号。2)计算麦克风阵列的输出信号ya(t);包括:对麦克风阵列在t本文档来自技高网
...

【技术保护点】
1.一种基于优化IMCRA的麦克风阵列语音增强方法,其特征在于,包括如下步骤:/n1)分别计算每个麦克风采集到的信号x

【技术特征摘要】
1.一种基于优化IMCRA的麦克风阵列语音增强方法,其特征在于,包括如下步骤:
1)分别计算每个麦克风采集到的信号xn(t),构成麦克风阵列;
2)计算麦克风阵列的输出信号ya(t);
3)计算阻塞矩阵输出信号中的平均噪声信号BAV(t);
4)使用优化的IMCRA方法估计的噪声功率谱密度
5)将麦克风阵列的输出信号ya(t)和噪声功率谱密度输入到MMSE-LSA估计器,得到最终的语音增强信号。


2.根据权利要求1所述的一种基于优化IMCRA的麦克风阵列语音增强方法,其特征在于,步骤1)包括:
设定空间中有J个信号sj(t),j∈1,2,3,...,J,N+1个麦克风,第n个麦克风在时间t接收到的信号为xn(t):



式中,hn,j是从第j个声源到第n个麦克风的声道脉冲响应,vn(t)表示加性噪声,表示卷积,其中n表示阵列中的麦克风,n∈1,2,...,N;在信号sj(t)中,j=1时,表示所需的期望语音信号,j=2,3,...,J时,表示干扰信号。


3.根据权利要求1所述的一种基于优化IMCRA的麦克风阵列语音增强方法,其特征在于,步骤2)包括:
对麦克风阵列在t时刻接收到的信号xN(t)使用波束形成的方法计算阵列的输出信号ya(t):



式中,阵列输入信号为xN(t),xN(t)=[x1(t),x2(t),...,xN(t)],波束形成的权重为wa(t),wa(t)=[wa,1(t),wa,2(t),...,wa,N(t)]。


...

【专利技术属性】
技术研发人员:李秋颖张涛
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1