语音中噪声的消除方法技术

技术编号:3850583 阅读:200 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种用于语音中噪声的消除方法,用于提取出被噪声污染的语音信号,可广泛应用于语音通信、辅助听力、语音识别和声纹认证的前端处理。步骤包括:1)对被污染的含噪语音信号做分帧、加窗处理;2)变换到频率域,得到频域内的语音信号;3)实时估计噪声的统计特征参数;4)依据统计模型方法和估计的噪声统计特性设计增益器;5)对频域的语音信号做增益处理,反变换为时域信号;6)重叠相加得到最终降噪信号。由于本发明专利技术实时估计噪声的统计特征参数,并且利用语音统计模型方法,使得消除大量噪声的同时,又尽可能的避免了对语音信号的损伤,具有更好的消噪效果。

【技术实现步骤摘要】

本专利技术属于信号处理尤其是语音信号处理领域,更具体的说,本专利技术涉 及一种语音信号中的噪声消除方法,也称语音增强方法。
技术介绍
也称语音增强方法,属于一种选择性的处理技 术,其目的在于从受到噪声污染的信号中,提取出纯净的原始语音信号,提高语音的清晰度 和可懂度,可广泛应用于语音侦听、语音通信、语音助听、视频会议等需要改善语音质量的 地方。另外,在语音的其它重要应用上,如语音识别、声纹认证等,通常由于背景噪声的影响 而迟迟不能广泛进入实际应用领域,严重阻碍这些技术的使用,通过合理的使用噪声消除 技术,可将语音信号从被污染的含噪语音信号中尽可能好的提取出来,可大幅改善语音识 别和声纹认证系统的性能。由于语音增强方法在实际中的重要性,一直是国际上的一个热 点研究方向。语音增强技术按拾取语音信号的通道数分类,可分为单通道语音增强技术和多通 道语音增强技术,多通道语音增强系统通常需要2个以上的麦克风,形成麦克风阵列,通过 波束形成、后滤波等处理手段来消除语音信号中的背景噪声,由于其不仅可获取语音信号 的时域信息和频域信息,而且可以获取语音信号的空间信息,通常可以得到更佳的效果。单 通道语音增强系统仅使用一个麦克风,硬件资源要求低,算法复杂度也相应较低,易于实 现,且应用范围更加广泛,本专利技术属于单通道语音增强方法。典型的单通道语音增强系统包括如下步骤1)对含噪的语音信号y做分帧、加窗处理;2)变换到频率域Y(Q);3)估计噪声的统计特征参数;4)增益器设计及含噪信号处理;5)将处理后信号反变换回时域?。6)使用重叠相加法得到增强后信号;步骤3)中估计噪声的统计特征参数方法。可直接选取开始处的静音段作为噪声 帧提取相应的噪声统计特征,也可通过实时的语音活动性检测技术,跟踪当前语音帧是噪 声帧还是语音帧,如果是噪声帧则更新噪声统计特征参数,否则继续跟踪下一帧。得到的噪 声谱用Pnn⑴)表示。步骤4)的增益器设计,众多单通道语音增强方法中,通常最大的差别即在于此, 比较典型的基于匪SE准则的维纳滤波增益器为 这种方法在实际中使用广泛,且在噪声符合平稳条件时可得到较好的结果,然而 该方法还有不足之处。主要包括以下几个方面1)在非平稳噪声环境下,选取开始处的无声段作为噪声帧,通常不能准确得到后继噪声的统计特征,若使用语音活动性检测方法,不 仅实现难度较大,而且在非平稳环境下很难实现准确的检测;2)增益器使用的是线性增益 器,无论在有声段还是在无声段均使用同一比例的增益,显然是不合理的,因为在信噪比较 高情况下,过分去除噪声反而会造成语音信号本身信息的损失,而在信噪比较低情况下又 会残留较多噪声,这也正是线性增益器会造成较强的“音乐噪声”的原因。因此,需要一种 更加合理的噪声特征跟踪算法,和更加合理的增益器。
技术实现思路
本专利技术的目的在于设计一种更加合理的、能够实时跟踪噪声的方法,使得语音增 强系统能够在非平稳的噪声环境下工作,并且设计一种更加有效的增益器,尽可能的避免 损伤语音,且尽可能的消除残留噪声,以弥补线性增益器损伤语音和残留噪声的缺点。本专利技术设计内容包括如下步骤1)对含噪的语音信号y做分帧、加窗处理;2)变换到频率域Y(Q);3)估计噪声的统计特征参数;4)增益器设计及含噪信号处理;5)将处理后信号反变换回时域?。6)使用重叠相加法得到增强后信号;其中,步骤3)估计噪声的统计特征参数包括如下步骤a)计算当前帧信号功率谱,使用前一帧的估计噪声谱,通过平滑方法,估计当前噪 声谱,其跟踪速度可通过平滑系数调节;b)利用a)中得到的信号功率谱和噪声谱,计算先验信噪比;c)使用前一帧的估计信噪比,通过平滑方法,估计当前帧的后验信噪比,其跟踪速 度可通过平滑系数调节;其中,步骤4)增益设计及含噪信号处理步骤包括如下步骤a)选择语音的统计模型,使用参数化方法,为语音数据建模;b)基于准则匪SE,再利用步骤3)中得到的估计噪声谱、先验信噪比、后验信噪比 得到增益器G(Q); c)利用公式 得到估计的语音谱;由于本专利技术实时跟踪噪声谱、先验信噪比、后验信噪比的变化,所以能够更加准确 的获得当前信号帧的噪声统计特征,适用于更加复杂的非平稳噪声的环境,且使用了基于 统计的方法对语音数据进行建模,获得非线性的增益器参数,能够在去除更多噪声的同时 而避免过多的损伤语音。附图说明图1是本专利技术实现的语音增强系统的方框图; 具体实施例方式下面结合附图和具体实施方式,对本专利技术做进一步详细描述。对当前帧的语音信号x(t) = s(t)+n(t)做加窗处理,并做FFT变换,得到信号频 域形式 (3)其中,窗函数h(t)可以为hamming窗或harming窗;帧长可选择10 口 30ms。使用前一帧估计的信息,噪声谱Np (k),和信号谱,估计当前帧噪声谱 计算当前帧的先验信噪比 (5)利用前一帧的后验信噪比,计算当前帧的后验信噪比 (6)当前噪声统计信息估计完成后,即可提供给增益器使用。本专利技术的增益器设计属于参数化的最优估计问题。需估计的信号频域形式为 (7)为简便记,下面隐含频率表示k,上式右侧可展开为 (8)依据贝叶斯理论,可得到 其中p( □)代表概率密度函数。若以超高斯模型对语音数据进行建模,可以选用 拉普拉斯概率密度函数或伽马概率密度函数,分别如下 (11)这里的o 3表示语音信号的方差,以拉普拉斯概率函数为例,设 (12)其中n为信号的后验信噪比,根据最优匪SE准则,使得五卩-幻最小,可得 权利要求,用于提取出被噪声污染的语音信号,包括如下步骤1)对被污染的含噪语音信号做分帧、加窗处理;2)变换到频率域,得到频域内的语音信号;3)实时估计噪声的统计特征参数;4)依据统计模型方法和估计的噪声统计特性设计增益器;5)对频域的语音信号做增益处理,反变换为时域信号;6)通过重叠相加法得到完整的语音信号。2.根据权力要求1中实时估计噪声的统计特征参数,其特征在于步骤3),包括1)计算本帧语音信号的频谱;2)根据前一帧估计的噪声谱,计算先验信噪比;3)根据计算的先验信噪比和前一帧估计的噪声谱,做平滑处理,估计当前帧的噪声谱 和后验信噪比;4)将估计的参数传给增益器。3.根据权力要求1中所述的依据统计模型方法和估计的噪声统计特性设计增益器,其 特征在于步骤4,包括1)选取统计模型方法,和最优准则设计,设计出增益器;2)通过权力要求1中的步骤3)所估计的统计特征参数,对频域内的语音信号做增益处 理,得到消噪后的频域内语音信号;全文摘要本专利技术是一种用于,用于提取出被噪声污染的语音信号,可广泛应用于语音通信、辅助听力、语音识别和声纹认证的前端处理。步骤包括1)对被污染的含噪语音信号做分帧、加窗处理;2)变换到频率域,得到频域内的语音信号;3)实时估计噪声的统计特征参数;4)依据统计模型方法和估计的噪声统计特性设计增益器;5)对频域的语音信号做增益处理,反变换为时域信号;6)重叠相加得到最终降噪信号。由于本专利技术实时估计噪声的统计特征参数,并且利用语音统计模型方法,使得消除大量噪声的同时,又尽可能的避免了对语音信号的损伤,具有更好的消噪效果。文档编号G10L21/02GK101853665SQ20091008708公开日2010年10月6日 申请日期本文档来自技高网
...

【技术保护点】
语音中噪声的消除方法,用于提取出被噪声污染的语音信号,包括如下步骤:1)对被污染的含噪语音信号做分帧、加窗处理;2)变换到频率域,得到频域内的语音信号;3)实时估计噪声的统计特征参数;4)依据统计模型方法和估计的噪声统计特性设计增益器;5)对频域的语音信号做增益处理,反变换为时域信号;6)通过重叠相加法得到完整的语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:博石金北京信息技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1