一种基于麦克风阵列的低运算量语音增强装置制造方法及图纸

技术编号:25640048 阅读:19 留言:0更新日期:2020-09-15 21:31
本发明专利技术公开了一种基于麦克风阵列的低运算量语音增强装置,该装置更精准地估计出了混响和回声的声学路径,更好地抑制了回声和混响信号,使得输出的音频信号达到更高的信噪比,语音增强体验效果好,针对当前主流的硬件平台均能达到实时处理,且具备很强的鲁棒性。此外,本发明专利技术所提供的装置在提升信号的信噪比的同时,能够大幅降低了信号处理的运算量。而在实现相同信噪比的要求下,传统的信号处理流程需要1‑3倍的运算量。

【技术实现步骤摘要】
一种基于麦克风阵列的低运算量语音增强装置本申请是名称为:一种基于麦克风阵列的语音增强方法及装置、申请日为:2018年06月22日、申请号为:201810652041.7的专利技术专利申请的分案申请。
本专利技术涉及一种语音增强装置,尤其是涉及一种基于麦克风阵列的低运算量语音增强装置。
技术介绍
在现代通信应用场景中,人们开始更多的使用免提设备进行通话和交流,比如扬声器系统、视频会议系统、笔记本电脑和平板电脑。在这些系统中,扬声器通常位于一个封闭的房间内,离麦克风相对较近。这种应用场景导致了在一般非免提设备中不存在的声学信号处理的挑战,而且随着扬声器和麦克风之间的距离增加也会大大降低了通话的信噪比(SNR)。此外,实际生活中,语音通信应用中,语音信号中存在有混响信号和回声,其中混响信号在一些情况下非常有必要的,但即便如此混响信号也会对许多应用程序产生重要的影响,例如,当混响存在时,自动语音识别系统的性能会受到很严重的影响,而且在自动音乐转录时也存在同样的问题;此外,混响也会影响语音的清晰度,尤其是对于听障听众。而回声是指语音通信时产生的回声,即打电话时自己讲的话又从对方传回来被自己听到。回声在固话和手机上都存在,回声小时能够忍受,大时将会严重影响沟通交流,故回声是影响语音质量的重要因素之一,回声分为线路回声和声学回声,线路回声主要存在于固话中,是由于2-4线转换引入的回声,声学回声是由于空间声学反射产生的回声;故回声消除是语音前处理的重要环节。随着硬件芯片和软件技术的快速发展,人们也对音频体验提出更高的要求。基于MEMS(微型机电系统)的麦克风能够提供更好的信噪比拾音。并且近些年来Beamforming(波束形成)技术在语音增强中被重点应用。结合当前新的软硬件技术的实际情况,人们需要开发出更好的技术,能够实现更好的人机交互体验。信号处理面临最大的问题就是噪声的干扰,包括了环境噪声的干扰,以及扬声器放出声音后产生的混响的干扰,此外还存在回声干扰。传统的语音信号处理方式包括以下两种:1、对麦克风阵列接收到的语音信号进行波束形成,然后进依次进行去混响和回声消除,最终获得增强语音信号;此种语音信号处理方式的原理如图1所示。该处理方式适合对于回声和混响处理能力要求不高的场景和设备,语音增强效果不佳。2、对麦克风阵列接收到的语音信号进行去混响处理,然后再进行回声消除处理,最后进行波束形成获得最终的增强语音信号;此种语音信号处理方式的原理如图2所示。该处理方式多用于专业的实验和测试分析,当前的硬件平台上很难达到实时性,且运算总量大,导致数据处理慢。
技术实现思路
本专利技术为了解决现有的基于麦克风阵列语音处理方式中所存在的问题,在此的第一个目的在于提供一种语音增强体验效果好;能够针对当前主流的硬件平台均可以达到实时处理,并且具备很强的鲁棒性的基于麦克风阵列的语音增强方法。本专利技术在此还有第二个目的,在于提供一种具备较低的运算量和适中的功耗的基于麦克风阵列的语音增强装置。本专利技术第一个目的所提供的基于麦克风阵列的语音增强方法包括以下步骤:步骤1:对以下两种信号进行分别处理:1)基于麦克风阵列采集到的N路语音信号进行频域分析,生成对应的频域信号Xn;2)参考信号进行频域分析,生成对应的频域信号Y;步骤2:将频域信号Xi同时分别进行以下处理:1)波束形成,形成波束Bout;2)去混响估计预处理,形成混响估计频域信号Rout;3)与频域信号Y一并进行回声消除及估计预处理,形成回声估计频域信号Eout;步骤3:对波束Bout、混响估计频域信号Rout和回声估计频域信号Eout进行去混响处理和回声消除处理,形成单路麦克风增强信号S;步骤4:对信号S进行IFFT变换形成最终输出的时域信号Sout;所述步骤2中所述的波束形成过程中还产生了滤波权重系数wt,所述混响估计频域信号Rout与所述滤波权重系数wt之间的关系如下:Rout=wt×(R1+R2+R3...+Rn-1+Rn)/n(1)式(1)中Rn表示第N路麦克风频域信号Xn对应的混响估计频域信号;n表示麦克风接收到的语音信号路数,所述回声估计频域信号Eout与所述滤波权重系数wt之间的关系如下:Eout=wt×(E1+E2+E3...+En-1+En)/n(2)式(2)中En表示第N路麦克风频域信号Xn对应的回声估计频域信号;n表示麦克风接收到的语音信号路数。进一步的,所述步骤2中的波束形成由MVDRBeamformer波束形成算法实现。本专利技术第二个目的所提供的基于麦克风阵列的语音增强装置包括:FFT变换模块,对采集到的语音信号和参考信号进行频域分析并存储;时域分析模块,对采集到的语音信号进行时域分析后输入去混响估计预处理模块;回声消除及估计预处理模块,用于对经信号转换后的语音信号和参考信号进行回声消除及估计预处理,形成回声估计频域信号;去混响估计预处理模块,用于对经信号转换后的语音信号进行去混响估计预处理,形成混响估计频域信号;波束形成模块,用于对经信号转换后的语音信号进行回声成分和混响部分进行提取分析,并形成波束;后置滤波模块,用于对回声估计频域信号、混响估计频域信号和波束进行统一的回声、混响以及噪声的消除和抑制处理,形成单路麦克风增强信号;IFFT变换模块,用于对单路麦克风增强信号进行离散快速傅里叶反变换,形成最终输出的时域信号。进一步的,所述波束形成模块包括MVDR滤波器,用于计算麦克风阵列空间域的滤波权重系数wt,并将滤波权重系数wt提供给所述的回声消除及估计预处理模块和所述去混响估计预处理模块。本专利技术所提供的语音增强装置通过去混响预处理及估计模块和回声消除预处理及估计模块对语音信号进行去混响预处理和回声消除预处理,更精准地估计出混响和回声的声学路径,更好地抑制了回声和混响信号,使得输出的语音信号达到更高的信噪比,且具备较低的运算量和适中的功耗。本专利技术的有益效果:本专利技术所提供的方法和装置更精准地估计出了混响和回声的声学路径,更好地抑制了回声和混响信号,使得输出的音频信号达到更高的信噪比,语音增强体验效果好,针对当前主流的硬件平台均能达到实时处理,且具备很强的鲁棒性。本专利技术所提供的方法和装置在提升信号的信噪比的同时,能够大幅降低了信号处理的运算量。而在实现相同信噪比的要求下,传统的信号处理流程需要1-3倍的运算量。附图说明图1为N个阵元的阵列增强传统处理方法一的原理图;图2为N个阵元的阵列增强传统处理方法二的原理图;图3为现有的用于回声消除的回声消除模块的基本原理图;图4为现有的用于去混响的混响消除模块的基本原理图;图5为本专利技术所提供的基于麦克风阵列的语音增强方法原理图;图6为本专利技术所提供的基于麦克风阵列的语音增强装置的结构图。具体实施方式本发本文档来自技高网
...

【技术保护点】
1.一种基于麦克风阵列的低运算量语音增强装置,其特征在于:该装置包括:/nFFT变换模块,对采集到的语音信号和参考信号进行频域分析并存储;/n缓存区:将频域数据保存在缓冲区中,同时送给回声估计模块和波束形成模块以及混响估计模块;/n时域分析模块,对采集到的语音信号进行时域分析后输入去混响估计预处理模块;/n回声消除及估计预处理模块,用于对经信号转换后的语音信号和参考信号进行回声消除及估计预处理,形成回声估计频域信号E

【技术特征摘要】
1.一种基于麦克风阵列的低运算量语音增强装置,其特征在于:该装置包括:
FFT变换模块,对采集到的语音信号和参考信号进行频域分析并存储;
缓存区:将频域数据保存在缓冲区中,同时送给回声估计模块和波束形成模块以及混响估计模块;
时域分析模块,对采集到的语音信号进行时域分析后输入去混响估计预处理模块;
回声消除及估计预处理模块,用于对经信号转换后的语音信号和参考信号进行回声消除及估计预处理,形成回声估计频域信号Eout;
去混响估计预处理模块,用于对经信号转换后的语音信号进行去混响估计预处理,形成混响估计频域信号Rout;
波束形成模块,用于对经信号转换后的语音信号进行回声成分和混响部分进行提取分析,并形成波束Bout;
后置滤波模块,用于对回声估计频域信号Eout、混响估计频域信号Rout和波束Bout进行统一的回声、混响以及噪声的消除和抑制处理,形成单路麦克风增强信号S;
IFFT变换模块,用于对单路麦克风增强信号S进行离散快速傅里叶反变换,形成最终输出的时域信号Sout;
所述波束形成模块包括MVDR滤波器,用于计算麦克风阵列空间域的滤波权重系数wt,...

【专利技术属性】
技术研发人员:刘睿
申请(专利权)人:重庆瑞可利科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1