快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端制造方法及图纸

技术编号:26261176 阅读:18 留言:0更新日期:2020-11-06 17:57
一种快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端,其中,所述方法包括:获取输入信号,将所述输入信号由时域信号转化为频域信号;计算所述频域信号的实时功率谱,跟踪所述实时功率谱中的功率最小值;根据所述功率最小值进行噪声估计,得到估计噪声功率谱;根据所述估计噪声功率谱计算增益系数,并根据所述增益系数对所述频域信号增强,得到增强后的频域信号;将增强后的频域信号转化为时域信号,得到输出信号。该方法采用连续谱最小值跟踪方法跟踪实时功率谱的功率最小值,能够快速且准确地抑制语音信号中的噪声。

【技术实现步骤摘要】
快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端
本专利技术涉及语音通信
,具体地涉及一种快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端。
技术介绍
在实时语音通信与通过网络语音协议(VoiceoverInternetProtocol,简称VOIP)传输语音消息的过程中,环境噪声以及周围人的语音干扰会被该设备近端的麦克风拾取到,拾取到的语音通常信噪比(signal-to-noiseratio,简称SNR)较低。若是不对其进行处理就将信号发送出去,其中的噪声会干扰远端对通话内容的理解;同时若对噪声处理不当,则可能对近端语音造成失真,影响语音的可懂度。例如,在人机交互领域,由于环境中的噪声被麦克风拾取到,交互终端在识别控制者说话声音时受到干扰,降低了语音识别的准确率,最终可能造成交互困难。现有技术中提出了多种噪声抑制方法,噪声抑制的主要目的是对带噪语音中的噪声成分进行抑制,尽可能得到较为纯净的语音信号,但目前常见的噪声抑制方法不能快速且准确的抑制带噪语音中的噪声。
技术实现思路
本专利技术解决的技术问题是如何快速且准确的抑制带噪语音中的噪声。为解决上述技术问题,本专利技术实施例提供一种快速计算语音存在概率的噪声抑制方法,包括:获取输入信号,将所述输入信号由时域信号转化为频域信号;计算所述频域信号的实时功率谱,跟踪所述实时功率谱中的功率最小值;根据所述功率最小值进行噪声估计,得到估计噪声功率谱;根据所述估计噪声功率谱计算增益系数,并根据所述增益系数对所述频域信号增强,得到增强后的频域信号;将增强后的频域信号转化为时域信号,得到输出信号。可选的,所述根据所述功率最小值进行噪声估计,得到估计噪声功率谱,包括:计算实时功率与实时功率谱中的功率最小值之间的比值;获取阈值,比较所述比值与所述阈值,以得到语音不存在的先验概率;根据实时功率谱计算后验信噪比,所述后验信噪比为当前帧的实时功率与前一帧的估计噪声功率的比值;使用判决引导法计算先验信噪比;根据所述先验信噪比、后验信噪比和语音不存在的先验概率计算语音存在概率;根据所述语音存在概率计算所述估计噪声功率谱。可选的,所述获取阈值,比较所述比值与所述阈值,以得到语音不存在的先验概率的计算公式如下:其中,Pmin(m,k)表示第m帧、第k个频点的带噪语音功率的最小值;P(m,k)为第m帧、第k个频点的平滑后的实时功率;Srk为所述比值,alpha为预设常数且alpha的取值范围为0~1;Δ为根据噪声分布特性按频点设置的阈值;q(m,k)为第m帧、第k个频点的语音不存在的先验概率。可选的,按照下述公式根据噪声分布特性按频点设置阈值:Δ=a×(tanhw1(x-thres)+b)+c其中,a,b,c为预设常数,thres为根据当前帧语音信号的信噪比设定的预设值,w1为用于控制Δ取值所在曲线的映射曲率的常数,w1的取值范围为0~1。可选的,所述根据所述先验信噪比、后验信噪比和语音不存在的先验概率计算语音存在概率,包括:根据所述先验信噪比与后验信噪比计算似然比,所述似然比表示收到的一帧数据符合带噪语音信号分布的概率和该帧数据符合噪声信号分布的概率的比值;根据所述似然比和语音不存在的先验概率计算语音存在概率。可选的,所述带噪语音信号和噪声信号均满足高斯分布,则所述似然比可以采用以下公式表示:其中,Λ(m,k)表示第m帧、第k个频点的似然比,σ(m,k)表示第m帧、第k个频点的后验信噪比,ρ(m,k)为第m帧、第k个频点的先验信噪比,exp()表示以自然常数e为底的指数函数,其指数为括号内的值。可选的,按照下述公式根据所述似然比和语音不存在的先验概率计算语音存在概率:其中,phat(m,k)为第m帧、第k个频点的语音存在概率,q(m,k)为第m帧、第k个频点的语音不存在的先验概率。可选的,所述根据所述先验信噪比与后验信噪比计算似然比之后,还包括:对所述似然比进行频点间平滑,得到平滑后的似然比;所述根据所述似然比和语音不存在的先验概率计算语音存在概率,包括:根据平滑后的似然比和语音不存在的先验概率计算语音存在概率。可选的,所述根据所述似然比、先验信噪比以及语音不存在的先验概率计算语音存在概率之后,还包括:获取概率阈值,根据所述后验语音存在概率与所述概率阈值之间的关系确定是否更新所述语音存在概率。可选的,所述语音存在概率的平滑值根据以下公式确定:phatsmooth(m,k)=α×phatsmooth(m-1,k)+(1-α)×phat(m,k)其中,phatsmooth(m,k)为第m帧、第k个频点的语音存在概率的平滑值,α为预设常数,α的取值范围为0到1;按照以下公式更新所述语音存在概率:其中,phatmax为概率阈值,其取值为预设常数。可选的,当所述估计噪声功率谱中无前一帧的估计噪声功率时,将当前的实时功率作为前一帧的估计噪声功率,计算所述后验信噪比。可选的,所述根据所述估计噪声功率谱计算增益系数,并根据所述增益系数对所述频域信号增强,得到增强后的频域信号,包括:根据所述估计噪声功率谱计算所述频域信号的后验信噪比,并根据所述频域信号的后验信噪比更新先验信噪比;根据更新的先验信噪比计算语音不存在的先验概率;根据所述后验信噪比、更新的先验信噪比和所述语音不存在的先验概率计算更新的语音存在概率,并根据更新的语音存在概率得到所述增益系数;计算所述频域信号和所述增益系数的乘积,得到增强后的频域信号。可选的,根据更新的先验信噪比计算语音不存在的先验概率可采用以下公式:其中,语音不存在的先验概率为d(m,k),为更新后的先验信噪比,ρmax(m,k)为先验信噪比最大值,ρmin(m,k)为先验信噪比最小值,ρmax(m,k)和ρmin(m,k)的具体数值为预设值。本专利技术实施例还提供一种快速计算语音存在概率的噪声抑制装置,所述装置包括:时频转换模块,用于获取输入信号,将所述输入信号由时域信号转化为频域信号;最小值跟踪模块,用于计算所述频域信号的实时功率谱,跟踪所述实时功率谱中的功率最小值;噪声功率谱计算模块,用于根据所述功率最小值进行噪声估计,得到估计噪声功率谱;语音增强模块,用于根据所述估计噪声功率谱计算增益系数,并根据所述增益系数对所述频域信号增强,得到增强后的频域信号;输出模块,用于将增强后的频域信号转化为时域信号,得到输出信号。本专利技术实施例还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述快速计算语音存在概率的噪声抑制方法的步骤。本专利技术实施例还提供一种终端,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述快速计算语音存在概率的噪声抑制方法的步骤。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例提供的快速计算语音存在概率的噪声抑制方法,较之现本文档来自技高网...

【技术保护点】
1.一种快速计算语音存在概率的噪声抑制方法,其特征在于,所述方法包括:获取输入信号,将所述输入信号由时域信号转化为频域信号;/n计算所述频域信号的实时功率谱,跟踪所述实时功率谱中的功率最小值;/n根据所述功率最小值进行噪声估计,得到估计噪声功率谱;/n根据所述估计噪声功率谱计算增益系数,并根据所述增益系数对所述频域信号增强,得到增强后的频域信号;/n将增强后的频域信号转化为时域信号,得到输出信号。/n

【技术特征摘要】
1.一种快速计算语音存在概率的噪声抑制方法,其特征在于,所述方法包括:获取输入信号,将所述输入信号由时域信号转化为频域信号;
计算所述频域信号的实时功率谱,跟踪所述实时功率谱中的功率最小值;
根据所述功率最小值进行噪声估计,得到估计噪声功率谱;
根据所述估计噪声功率谱计算增益系数,并根据所述增益系数对所述频域信号增强,得到增强后的频域信号;
将增强后的频域信号转化为时域信号,得到输出信号。


2.根据权利要求1所述的方法,其特征在于,所述根据所述功率最小值进行噪声估计,得到估计噪声功率谱,包括:
计算实时功率与实时功率谱中的功率最小值之间的比值;
获取阈值,比较所述比值与所述阈值,以得到语音不存在的先验概率;
根据实时功率谱计算后验信噪比,所述后验信噪比为当前帧的实时功率与前一帧的估计噪声功率的比值;
使用判决引导法计算先验信噪比;
根据所述先验信噪比、后验信噪比和语音不存在的先验概率计算语音存在概率;
根据所述语音存在概率计算所述估计噪声功率谱。


3.根据权利要求2所述的方法,其特征在于,所述获取阈值,比较所述比值与所述阈值,以得到语音不存在的先验概率的计算公式如下:



其中,Pmin(m,k)表示第m帧、第k个频点的带噪语音功率的最小值;P(m,k)为第m帧、第k个频点的平滑后的实时功率;Srk为所述比值,alpha为预设常数且alpha的取值范围为0~1;Δ为根据噪声分布特性按频点设置的阈值;q(m,k)为第m帧、第k个频点的语音不存在的先验概率。


4.根据权利要求3所述的方法,其特征在于,按照下述公式根据噪声分布特性按频点设置阈值:
Δ=a×(tanhw1(x-thres)+b)+c
其中,a,b,c为预设常数,thres为根据当前帧语音信号的信噪比设定的预设值,w1为用于控制Δ取值所在曲线的映射曲率的常数,w1的取值范围为0~1。


5.根据权利要求3所述的方法,其特征在于,所述根据所述先验信噪比、后验信噪比和语音不存在的先验概率计算语音存在概率,包括:
根据所述先验信噪比与后验信噪比计算似然比,所述似然比表示收到的一帧数据符合带噪语音信号分布的概率和该帧数据符合噪声信号分布的概率的比值;
根据所述似然比和语音不存在的先验概率计算语音存在概率。


6.根据权利要求5所述的方法,其特征在于,所述带噪语音信号和噪声信号均满足高斯分布,则所述似然比可以采用以下公式表示:



其中,Λ(m,k)表示第m帧、第k个频点的似然比;σ(m,k)表示第m帧、第k个频点的后验信噪比;ρ(m,k)为第m帧、第k个频点的先验信噪比;exp()表示以自然常数e为底的指数函数,其指数为括号内的值。


7.根据权利要求6所述的方法,其特征在于,按照下述公式根据所述似然比和语音不存在的先验概率计算语音存在概率:



其中,phat(m,k)为第m帧、第k个频点的语音存在概率;q(m,k)为第m帧、第k个频点的语音不存在的先验概率。


8.根据权利要求6所述的方法,其特征在于,所述根据所述先验信噪比与后验信噪比计算似然比之...

【专利技术属性】
技术研发人员:巴莉芳康力
申请(专利权)人:紫光展锐重庆科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1