【技术实现步骤摘要】
结合频率跟踪和频谱修正的降噪和单频干扰抑制方法
本专利技术属于人工智能
,涉及语音识别,具体涉及一种结合频率跟踪和频谱修正的降噪和单频干扰抑制方法。
技术介绍
语音通话场景的需求日益增加,不同的应用场景往往都是伴随着噪声的,在某些会议场景下,还会由于硬件限制、硬件故障等出现单频干扰并严重影响听觉感受。这些语音听觉场景需要对语音的背景噪声有一个较为舒适的滤除,并对单频干扰的抑制有一定需求。因此需要一种方法,其一能对背景噪声进行滤除并提升听觉体验,其二能够通过软件手段对单频干扰进行检测并滤除。
技术实现思路
为克服现有技术存在的缺陷,本专利技术公开了一种结合频率跟踪和频谱修正的降噪和单频干扰抑制方法。本专利技术所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,包括以下步骤:S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;S3.根据S2得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。优选的:所述步骤S2中,噪声功率谱更新方式如下:S ...
【技术保护点】
1.结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于,包括以下步骤:/nS1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;/nS2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;/nS3.根据S2 得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;/nS4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;/nS5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;/nS6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。/n
【技术特征摘要】
1.结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于,包括以下步骤:
S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时快速傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;
S2.设置固定窗,对窗内逐帧计算每一个频点的噪声功率谱,并求得该帧每一个频点的语音概率;
S3.根据S2得到的噪声功率谱求得后验信噪比,平滑后得到先验信噪比并求得最优幅度谱增益估计;
S4.根据单频干扰中心频点跟踪算法找出带噪功率谱最强的若干个频点作为单频干扰中心频点;
S5.对单频干扰中心频点及其邻近频点的频谱进行修正得到输出频谱;
S6.对输出频谱进行合窗和反傅里叶变换,得到更新后的频谱。
2.根据权利要求1所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S2中,噪声功率谱更新方式如下:
S21.以第一帧的每个频点的频谱幅度|Y(k,l)|2作为噪声功率谱的初
始值;
S22.从第二帧开始到固定窗尾,把该帧每个频点的频谱幅度
|Y(k,l)|2与该帧的最小功率谱值PSDmin(k,l)的比值和第一阈值比较;
若比值大于第一阈值TH1则判断为语音,根据(1)式更新语音概率;
p(k,l)=1+α1*(1-p(k,l-1))----(1)
若比值不大于第一阈值TH1;根据(2)式更新语音概率;
p(k,l)=α1*p(k,l-1)----(2);
p(k,l)是第l帧第k个频点的语音概率;
p(k,l-1)是第l-1帧第k个频点的语音概率;
α1为语音概率更新系数;
S23.通过(3)式计算噪声功率谱值;
噪声功率谱值λ(k,l)=α3*λ(k,l-1)+(1-α3)*|Y(k,l)|2----(3)
其中,α3=α2+(1-α2)*p(k,l)
α2为噪声平滑系数的平滑系数;
α3为噪声平滑系数。
3.根据权利要求2所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S3具体为:
S31.根据公式(4)更新后验信噪比:
后验信噪比post_snr(k,l)=α4*|Y(k,l)|2/λ(k,l)----(4)
α4为后验信噪比衰减系数;
S32.根据公式(5)更新先验信噪比:
先验信噪比
pri_snr(k,l)=α5*pri_snr(k,l-1)+(1-α5)*post_snr(k,l)---(5);
α5为先验信噪比平滑系数;
pri_snr(k,l)和pri_snr(k,l-1)分别表示第l帧和第(l-1)帧第k个频点的先验信噪比;
S33.再根据公式(6)求出初步最优幅度谱增益估计gain1(k,l):
gain1(k,l)=pri_snr(k,l)/[1+pri_snr(k,l)]----(6)
S34.再根据公式(7)求出最终最优幅度谱增益估计gain2(k,l):
gain2(k,l)=p(k,l)*gain1(k,l)+(1-p(k,l))*gain_min----(7)
p(k,l)是第l帧第k个频点的语音概率;gain_min是增益最小限定值。
4.根据权利要求1所述结合频率跟踪和频谱修正的降噪和单频干扰抑制方法,其特征在于:所述步骤S4中单频干扰中心频点跟踪的方法如下:
S41.将步骤S1得到的频谱划分为若干个频带,对每一频带,重复以下步骤S42-S44,得到各个频带的单频干扰中心频点binm,下标m表示不同频带;
划分频带宽度和边界的依据为:根据可能出现的单频干扰中心频点位置,使划分的每一频带尽可能只出现一个单频干扰中心频点;
对每一频带,重复...
【专利技术属性】
技术研发人员:胡岸,刘文通,高君效,
申请(专利权)人:成都启英泰伦科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。