一种单通道实时降噪方法及系统技术方案

技术编号:24097391 阅读:30 留言:0更新日期:2020-05-09 11:05
本发明专利技术公开了一种单通道实时降噪方法及系统,包括以下步骤:步骤1,将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;步骤2,将步骤1获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;步骤3,根据步骤1获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;步骤4,将步骤3获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号。本发明专利技术能够根据不同的背景噪声实时调整噪声估计方法,实时对带噪语音信号进行降噪处理。

A single channel real-time noise reduction method and system

【技术实现步骤摘要】
一种单通道实时降噪方法及系统
本专利技术属于语音信号处理
,特别涉及一种单通道实时降噪方法及系统。
技术介绍
语音信号是不稳定的,在实际系统中采集时极易受到各种各样的噪声干扰。这些不同类型噪声给语音信号降噪处理带来了巨大的挑战,在过去的数十年里,尝试着用各种噪声谱估计算法去对噪声进行估计,以此来进行语音信号降噪处理。噪声谱的准确估计显得尤为重要,如果对噪声谱估计过低,语音信号中存有残留噪声,如果对噪声谱估计过高,语音信号将会失真、降低可懂度。例如,传统的噪声谱估计方法是基于语音活动检测(VoiceActivityDetector,VAD),这种方法约束了语音缺失段的噪声谱估计更新,而且在弱语音信号、低信噪比情况下很难进行平衡,该方法不适用于非平稳噪声环境;基于直方图的噪声谱估计方法运行时占用内存资源较多,低信噪比情况下噪声谱估计效果较差,在非平稳噪声环境中很难使用。1995年,Doblinger通过连续跟踪每个频率点中有噪语音的最小值来更新噪声估计,这种方法的缺点是无法区分是背景噪声的增大还是语音功率的增大;1995年,Hirsch和Ehrlicher通过比较含噪语音功率和过去噪声谱鼓励来更新噪声谱的估计,该方法实现简单,但当背景噪声突然增大并持续保持在该状态下,此方法无法更新噪声谱的估计;2001年,Martin提出了一种基于最小统计(MinimaStatistics,MS)的噪声谱估计方法,即在一个有限窗口内跟踪平滑含噪语音谱的最小值,并乘以一个偏置补偿因子,以此获得噪声谱的估计,该方法的最大缺陷是当背景噪声突然增大时更新噪声谱所需要的时间比最小搜索窗的时间长,不适合用于背景噪声突然增强的环境中;2002年,Cohen提出了一种基于最小受控递归平均算法(MinimaControlledRecursiveAveraging,MCRA),该方法根据含噪语音的局部能量值与其待定时间窗内的最小值的比值确定子带中是否存在语音,如果给定帧的某个子带中存在语音,那么该子带内的噪声谱估计等于上一帧的噪声谱估计,如果不存在,则结合含噪语音的功率谱,采用一阶递归的方法更新噪声谱,2003年,Cohen提出了改进的最小控制递归平均方法(ImprovedMinimaControlledRecursiveAveraging,IMCRA),主要从三个方面进行了改进,即语音活跃期的最小值跟踪,语音存在概率估计,提出偏置补偿因子,无论是MCRA方法还是IMCRA方法,当噪声谱突然增大时,噪声谱的估计将会出现时延,时延的最大值为窗长的两倍;2012年,Swamy等人提出了一种基于语音增强残差的IMCRA算法,首先采用一种语音增强算法获取增强后的语音,然后对干净语音和增强后的语音作差值运算,如果语音存在,则根据获取的残差,采用一阶递归的方式更新噪声谱估计,减小了估计误差;2013年,Yuan等人提出了一种基于时频相关的噪声谱估计算法,是对IMCRA算法的改进,通过计算时频单元的自相关和交叉相关性,求解出语音存在的粗估计,并重新定义了含噪语音谱的平滑参数、噪声谱估计的递归平均参数以及先验信噪比估计的权重因子,还提出在更小的搜索窗内跟踪含噪语音平滑功率谱最小值;上述这些方法都是典型的噪声谱估计方法,但上述的每一种算法或多或少都存在着这样或者那样的缺陷。语音信号降噪技术的任务是从带噪语音信号中分离出干净的语音信号,消除背景噪声,改善语音质量;该技术拥有广泛的应用,如鲁棒性自动语音识别(ASR)和日常环境中的移动通信;语音信号降噪或分离技术已在信号处理领域进行了数十年的研究;其中,单通道语音降噪技术是非常具有挑战性的课题,因为单通道语音信号仅依靠单个麦克风所采集到的语音信号,无法像麦克风阵列一样得知语音信号空间位置信息,这给语音信号特征参数提取时增加了难度;另一方面,与基于波束形成的麦克风阵列降噪技术相比,单通道降噪技术可应用的声学场景或者实际系统中更为广泛。由于只用到单个麦克风,单通道降噪技术不仅成本低,而且在实际的应用系统中更为方便;除此之外,在实际系统,与基于波束形成的麦克风阵列降噪技术相比较而言,单通道降噪技术更加具有优势,一方面在实时性方面更具有鲁棒性,另一方面算法运行时所占系统资源在数量级上更低。综上,在实际的日常生活中,由于背景噪声的多样性、复杂性、突变性,在有背景噪声的环境下,对语音信号基于单通道实时处理并达到理想的降噪效果是非常具有挑战性的,亟需一种新的单通道实时降噪方法、系统及装置。
技术实现思路
本专利技术的目的在于提供一种单通道实时降噪方法及系统,以解决上述存在的一个或多个技术问题。本专利技术能够根据不同的背景噪声实时调整噪声估计方法,实时对带噪语音信号进行降噪处理。为达到上述目的,本专利技术采用以下技术方案:本专利技术的一种单通道实时降噪方法,包括以下步骤:步骤1,将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;步骤2,将步骤1获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;其中,预处理包括:数据采集时主从时序的产生、数据串并转换、数据缓存、数据预滤波和数据并串转换;步骤3,根据步骤1获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;步骤4,将步骤3获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号,完成单通道实时降噪。本专利技术的一种单通道实时降噪系统,包括:A/D模数转换模块,用于将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;FPGA处理及控制模块,包括:输入处理单元、算法选择单元和输出处理单元;其中,输入处理单元,用于将A/D模数转换模块获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;其中,预处理包括:数据采集时主从时序的产生、数据串并转换、数据缓存、数据预滤波和数据并串转换;算法选择单元,用于根据A/D模数转换模块获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;输出处理单元,用于将降噪处理过后的语音信号进行处理输出;其中,处理包括:数据输出时的主从时序的产生,数据缓存,数据串并转换和数据并串转换;DSP算法处理模块,用于根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;D/A数模转换模块,用于将获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号,完成单通道实时降噪。与现有技术相比,本专利技术具有以下有益效果:本专利技术用FPGA处理单元作为模式切换器,根据不同背景噪声场景实时调整噪声估计方法,以达到准确估计噪声的目的;在DSP处理单元中根据FPGA所传递的参数运行对应的噪声估计算法,以达到实时准确处理带噪语音信号的目的。本专利技术能够完成在不同背景噪声环境下语音降噪,其实时处理单个麦克风所采集到的语音信号,不仅能够本文档来自技高网
...

【技术保护点】
1.一种单通道实时降噪方法,其特征在于,包括以下步骤:/n步骤1,将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;/n步骤2,将步骤1获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;其中,预处理包括:数据采集时主从时序的产生、数据串并转换、数据缓存、数据预滤波和数据并串转换;/n步骤3,根据步骤1获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;/n步骤4,将步骤3获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号,完成单通道实时降噪。/n

【技术特征摘要】
1.一种单通道实时降噪方法,其特征在于,包括以下步骤:
步骤1,将单通道采集到的带噪模拟语音信号转换成带噪离散语音信号;
步骤2,将步骤1获得的带噪离散语音信号进行预处理,获得预处理后的带噪离散语音信号;其中,预处理包括:数据采集时主从时序的产生、数据串并转换、数据缓存、数据预滤波和数据并串转换;
步骤3,根据步骤1获得的预处理后的带噪离散语音信号中的不同背景噪声,生成算法选择参数;根据所述算法选择参数选择噪声估计方法,通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,获得降噪后的时域语音信号;
步骤4,将步骤3获得的降噪后的时域语音信号,转换为时域和幅值上均连续的信号,完成单通道实时降噪。


2.根据权利要求1所述的一种单通道实时降噪方法,其特征在于,步骤3具体包括:
对预处理后的带噪离散语音信号的信噪比进行了计算,如果所求得的信噪比小于等于1dB,则把对应背景噪声判别成强背景噪声环境,生成参数1;
如果所求得的信噪比大于1dB,则把对应背景噪声判别成其他背景噪声,再根据其统计特性进性区分,所得的统计特性为常数,则把对应背景噪声判别成平稳噪声,生成参数2;如果所得的统计特性不为常数,则把对应背景噪声判别成非平稳噪声,生成参数3;
其中,平稳噪声选择最小值统计方法来估计带噪语音信号中噪声信号,非平稳噪声选择最小控制递归平均方法来估计带噪语音信号中的噪声信号,强背景噪声选择改善的最小控制递归平均方法来估计带噪语音信号中的噪声信号;
所述改善的最小控制递归平均方法包括:存在概率p(k,λ)的计算方式和引入偏差补偿因子。


3.根据权利要求2所述的一种单通道实时降噪方法,其特征在于,步骤3中,
改善的最小控制递归平均方法包括:通过两次迭代运算得出语音信号不存在的概率的值;其中,第一次迭代得出粗略的语音活性判决,第二次迭代利用相邻频点间的强相关性进行时频平滑得出精确的语音存在概率;得到噪声信号的功率谱的估计值表达式为:



式中,β为引入的偏差补偿因子,为是利用递归平均方法得到的噪声信号的功率谱估计,其表达式为:



式中,为当前帧噪声信号的功率谱密度,为上一帧噪声信号的功率谱密度,αd(k,λ)为递归平滑因子,|Y(k,λ)|2为带噪语音信号功率谱,k为频率槽指数,λ为帧号;
最小值统计方法包括:首先对带噪语音信号的功率谱|Y(k,λ)|2进行一阶平滑,得到平滑后的带噪语音功率P(k,λ);其次是在固定的窗长内跟踪P(k,λ)各频带的最小值,得到最小值Pmin(k,λ);最后对得到的最小值Pmin(k,λ)进行偏差补偿,得到噪声信号的功率谱,表达式为:



其中,为最小控制递归平均方法的噪声功率谱无偏估计,Bmin(k,λ)为偏差补偿因子;
最小控制递归平均方法包括:首先,利用一阶平滑对带噪语音信号的功率谱|Y(k,λ)|2进行处理,得到带噪语音信号的平滑功率谱S(k,λ);其次,在固定窗长中搜索得到平滑功率谱的最小值Smin(k,λ);再次,利用平滑功率谱S(k,λ)和平滑功率谱的最小值Smin(k,λ)来计算语音信号存在的概率p(k,λ);再次,利用带噪语音信号中语音信号存在的概率函数p(k,λ)计算递归平均因子αd(k,λ);最后,利用递归平均因子更新噪声功率谱密度的估计值,表达式为:



其中,为当前帧噪声信号的功率谱密度,为上一帧噪声信号的功率谱密度,αd(k,λ)为递归平滑因子,|Y(k,λ)|2为带噪语音信号功率谱,k为频率槽指数,λ为帧号。


4.根据权利要求1所述的一种单通道实时降噪方法,其特征在于,步骤3中,所述通过选择的噪声估计方法对预处理后的带噪离散语音信号进行处理,具体包括:
(1)对预处理后的带噪离散语音信号进行滤波处理,获得滤波后信号;
(2)将步骤(1)获得的滤波后信号进行重叠分帧、加窗;
(3)将步骤(2)重叠分帧、加窗后的语音信号进行傅里叶变换,指定任意信号随时间和频率变化的复数幅度;
(4)对每一帧带噪语音信号进行处理,包括:通过选择的噪声估计方法对带噪语音信号中噪声谱的估计;计算获得衰减因子;将衰减因子用于带噪语音信号中,得到降噪处理后的频域语音信号;
(5)将步骤(4)获得的频域语音信号进行短时傅里叶逆变换,将降噪处理后的语音信号由频域转换到时域,获得离散的语音信号;
(6)加窗、重叠相加将步骤(5)短时傅里叶逆变换后获得的离散的语音信号进行拼接,获得降噪后的时域语音信号。


5.根据权利要求4所述的一种单通道实时降噪方法,其特征在于,包括:
步骤1中,信号模型为:y(t)=x(t)+d(t);其中,x(t)是纯净的语音信号,y(t)是观测到的带噪语音信号,d(t)则是噪声信号;模型中x(t)受到加性噪声d(t)干扰,且带噪语音信号y(t)与纯净的语音信号x(t)不相关;x(t)、d(t)以及y(t)都是模拟信号,在时间域和频率域上均连续,进行A/D采样处理,采样周期为T,采样频率为Fs,T=1/Fs,获得离散的信号y(n),x(n)及d(n),n为正整数,y(n)=x(n)+d(n);
步骤2中,对y(n)进行滤波处理,选用的滤波器是高通滤波器,所述高通滤波器通过最佳一致逼近法设计,用h(n)表示,公式如下:yh(n)=h(n)*y(n),其中,yh(n)滤波后的时域离散信号,*为乘法运算符号;
步骤3的(2)中,所使用的窗函数为Kaiser窗函数,表达式为:w2(N)+w2(M+N...

【专利技术属性】
技术研发人员:陈龙黄海隆弢陈玮
申请(专利权)人:声耕智能科技西安研究院有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1