结合频率跟踪和频谱修正的降噪和单频干扰抑制方法技术

技术编号:29679487 阅读:22 留言:0更新日期:2021-08-13 22:02
结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,包括以下步骤:S1.对输入的带噪语音进行逐帧处理后得到频谱;S2.设置固定窗,逐帧计算每一个频点的噪声功率谱,并求得该帧每一频点语音概率;S3.根据S2得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;S4.根据单频干扰中心频点跟踪算法找出单频干扰中心频点;S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。本发明专利技术通过频率跟踪,确定单频干扰最大的频点,通过频谱修正来抑制单频干扰,从而实现在降噪的同时实现单频干扰抑制。

【技术实现步骤摘要】
结合频率跟踪和频谱修正的降噪和单频干扰抑制方法
本专利技术属于人工智能
,涉及语音识别,具体涉及一种结合频率跟踪和频谱修正的降噪和单频干扰抑制方法。
技术介绍
语音通话场景的需求日益增加,不同的应用场景往往都是伴随着噪声的,在某些会议场景下,还会由于硬件限制、硬件故障等出现单频干扰并严重影响听觉感受。这些语音听觉场景需要对语音的背景噪声有一个较为舒适的滤除,并对单频干扰的抑制有一定需求。因此需要一种方法,其一能对背景噪声进行滤除并提升听觉体验,其二能够通过软件手段对单频干扰进行检测并滤除。
技术实现思路
为克服现有技术存在的缺陷,本专利技术公开了一种结合频率跟踪和频谱修正的降噪和单频干扰抑制方法。本专利技术所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,包括以下步骤:S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;S3.根据S2得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。优选的:所述步骤S2中,噪声功率谱更新方式如下:S21.以第一帧的每个频点的频谱幅度|Y(k,l)|2作为噪声功率谱的初始值;S22.从第二帧开始到固定窗尾,把该帧每个频点的频谱幅度|Y(k,l)|2与该帧的最小功率谱值PSDmin(k,l)的比值和第一阈值比较;若比值大于第一阈值TH1则判断为语音,根据(1)式更新语音概率;p(k,l)=1+α1*(1-p(k,l-1))----(1)若比值不大于第一阈值TH1;根据(2)式更新语音概率;p(k,l)=α1*p(k,l-1)----(2);p(k,l)是第l帧第k个频点的语音概率;p(k,l-1)是第l-1帧第k个频点的语音概率;α1为语音概率更新系数;S23.通过(3)式计算噪声功率谱值;噪声功率谱值λ(k,l)=α3*λ(k,l-1)+(1-α3)*|Y(k,l)|2----(3)其中,α3=α2+(1-α2)*p(k,l)α2为噪声平滑系数的平滑系数;α3为噪声平滑系数;优选的:所述步骤S3具体为:S31.根据公式(4)更新后验信噪比:后验信噪比post_snr(k,l)=α4*|Y(k,l)|2/λ(k,l)----(4)α4为后验信噪比衰减系数;S32.根据公式(5)更新先验信噪比:先验信噪比pri_snr(k,l)=α5*pri_snr(k,l-1)+(1-α5)*post_snr(k,l)---(5)。α5为先验信噪比平滑系数;pri_snr(k,l)和pri_snr(k,l-1)分别表示第l帧和第(l-1)帧第k个频点的先验信噪比;S33.再根据公式(6)求出初步最优幅度谱增益估计gain1(k,l):gain1(k,l)=pri_snr(k,l)/[1+pri_snr(k,l)]----(6)S34.再根据公式(7)求出最终最优幅度谱增益估计gain2(k,l):gain2(k,l)=p(k,l)*gain1(k,l)+(1-p(k,l))*gain_min----(7)p(k,l)是第l帧第k个频点的语音概率;gain_min是增益最小限定值。优选的:所述步骤S4中单频干扰中心频点跟踪的方法如下:S41.将步骤S1得到的频谱划分为若干个频带,对每一频带,重复以下步骤S42-S44,得到各个频带的单频干扰中心频点binm,下标m表示不同频带;划分频带宽度和边界的依据为:根据可能出现的单频干扰中心频点位置,使划分的每一频带尽可能只出现一个单频干扰中心频点;对每一频带,重复以下步骤S42-S44进行最大单频干扰中心频点跟踪:S42.找出该频带内的最大带噪功率谱值的最大频点max_index及其带噪功率谱值psd_max;带噪功率谱最大值计数器数组用max_cal表示;所述带噪功率谱最大值计数器数组max_cal中包括多个带噪功率谱计数器,每一带噪功率谱计数器对应一个频点,且带噪功率谱计数器初始值均为0;设置频率跟踪标志位detect_flag,定义当找到单频干扰中心频点时该值为1,未找到则为零。S43.如当前频率跟踪标志位detect_flag为0,对当前频带的最大带噪功率谱值所在的最大值频点max_index进行逐帧统计,设置帧计数器count初始值为零;帧计数器count逐帧加1,在帧计数器count小于统计长度LENGTH且当前帧的带噪功率谱值psd_max与当前最小噪声功率谱值λmin比值大于第二阈值TH2时,对各帧的每一最大值频点,设定该最大值频点对应的带噪功率谱计数器max_cal(max_index)值加1,当count值等于统计长度LENGTH时,统计各个带噪功率谱计数器中max_cal(max_index)中的最大值;如最大值大于次数门限COUNT_TH,则将该频点置为单频干扰中心频点binm,并将频率跟踪标志位detect_flag置为1;S44.如当前频率跟踪标志位detect_flag为1,判断当前得到的该频带的功率谱值最大的最大值频点是否和已找到的单频干扰中心频点binm相同;如果相同则不作处理;如果不同,则对最大值频点对应的带噪功率谱计数器max_cal(max_index)值减1,直到当max_cal(max_index)=0时,将频率跟踪标志位detect_flag重新置为0,开始重新跟踪单频干扰中心频点;重复以上步骤S42-S44,得到各个频带的单频干扰中心频点记为binm,下标m表示不同频带。优选的:所述步骤S5具体为:对单频干扰中心频点及其邻近频点进行以下操作:S51.对正频率频点部分的修正量如下compensate(binm,l)=α6*λ(binm,l)----(8)λ(binm,l)表示第l帧,频点为binm的噪声功率谱值对负频率频点处的修正量计算如下:compensate(FFTSize-binm,l)=-α6*λ(binm,l)----(9)其中FFTSize为傅里叶变换长度,α6为频谱修正系数;对于正频率频点,修正后频谱YC(binm,l)=Y(binm,l)+compensate(binm,l)Y(binm,l)表示修正前的第l帧,频点为binm的频谱;对于本文档来自技高网...

【技术保护点】
1.结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于,包括以下步骤:/nS1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;/nS2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;/nS3.根据S2 得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;/nS4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;/nS5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;/nS6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。/n

【技术特征摘要】
1.结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于,包括以下步骤:
S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;
S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;
S3.根据S2得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;
S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;
S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;
S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。


2.根据权利要求1所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S2中,噪声功率谱更新方式如下:
S21.以第一帧的每个频点的频谱幅度|Y(k,l)|2作为噪声功率谱的初
始值;
S22.从第二帧开始到固定窗尾,把该帧每个频点的频谱幅度
|Y(k,l)|2与该帧的最小功率谱值PSDmin(k,l)的比值和第一阈值比较;
若比值大于第一阈值TH1则判断为语音,根据(1)式更新语音概率;
p(k,l)=1+α1*(1-p(k,l-1))----(1)
若比值不大于第一阈值TH1;根据(2)式更新语音概率;
p(k,l)=α1*p(k,l-1)----(2);
p(k,l)是第l帧第k个频点的语音概率;
p(k,l-1)是第l-1帧第k个频点的语音概率;
α1为语音概率更新系数;
S23.通过(3)式计算噪声功率谱值;
噪声功率谱值λ(k,l)=α3*λ(k,l-1)+(1-α3)*|Y(k,l)|2----(3)
其中,α3=α2+(1-α2)*p(k,l)
α2为噪声平滑系数的平滑系数;
α3为噪声平滑系数。


3.根据权利要求2所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S3具体为:
S31.根据公式(4)更新后验信噪比:
后验信噪比post_snr(k,l)=α4*|Y(k,l)|2/λ(k,l)----(4)
α4为后验信噪比衰减系数;
S32.根据公式(5)更新先验信噪比:
先验信噪比
pri_snr(k,l)=α5*pri_snr(k,l-1)+(1-α5)*post_snr(k,l)---(5);
α5为先验信噪比平滑系数;
pri_snr(k,l)和pri_snr(k,l-1)分别表示第l帧和第(l-1)帧第k个频点的先验信噪比;
S33.再根据公式(6)求出初步最优幅度谱增益估计gain1(k,l):
gain1(k,l)=pri_snr(k,l)/[1+pri_snr(k,l)]----(6)
S34.再根据公式(7)求出最终最优幅度谱增益估计gain2(k,l):
gain2(k,l)=p(k,l)*gain1(k,l)+(1-p(k,l))*gain_min----(7)
p(k,l)是第l帧第k个频点的语音概率;gain_min是增益最小限定值。


4.根据权利要求1所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S4中单频干扰中心频点跟踪的方法如下:
S41.将步骤S1得到的频谱划分为若干个频带,对每一频带,重复以下步骤S42-S44,得到各个频带的单频干扰中心频点binm,下标m表示不同频带;
划分频带宽度和边界的依据为:根据可能出现的单频干扰中心频点位置,使划分的每一频带尽可能只出现一个单频干扰中心频点;
对每一频带,重复...

【专利技术属性】
技术研发人员:胡岸刘文通高君效
申请(专利权)人:成都启英泰伦科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1