语音降噪的方法和装置、计算设备和计算机可读存储介质制造方法及图纸

技术编号:21955302 阅读:28 留言:0更新日期:2019-08-24 19:08
本发明专利技术公开了一种语音降噪的方法和装置、计算设备和计算机可读存储介质。该方法包括:获取带噪语音信号,所述带噪语音信号包括纯净语音信号和噪声信号;估计所述带噪语音信号的后验信噪比和先验信噪比;基于所估计的后验信噪比和所估计的先验信噪比在Bark域中确定语音/噪声似然比;基于所确定的语音/噪声似然比估计先验语音存在概率;基于所估计的后验信噪比、所估计的先验信噪比以及所估计的先验语音存在概率来确定增益,所述增益为用于将所述带噪语音信号变换成所述纯净语音信号的估计的频域传递函数;并且基于所述增益从所述带噪语音信号导出所述纯净语音信号的所述估计。该方法可以提升判断语音是否出现的准确率。

Method and Device of Speech Noise Reduction, Computing Equipment and Computer Readable Storage Media

【技术实现步骤摘要】
语音降噪的方法和装置、计算设备和计算机可读存储介质
本专利技术涉及语音处理
,具体来说涉及一种语音降噪方法、语音降噪装置、计算设备和计算机可读存储介质。
技术介绍
在传统的语音降噪技术中通常存在两种处理方式。一种方式是在每个频点上都估计一个先验语音存在概率。在这种情况下,对于识别器而言在时间上和频率上的维纳增益波动越小,一般识别率越高;如果维纳增益波动比较大,反而会引入一些音乐噪声,可能导致识别率变差。另一种方式是使用全局的先验语音存在概率。这种方式比起前者而言在求取维纳增益时更加鲁棒。然而,仅依赖全部频点上的先验信噪比来估计先验语音存在概率,可能不能很好地区分包含语音和噪声两者的帧和只含有噪声的帧。
技术实现思路
提供一种可以缓解、减轻或甚至消除上述问题中的一个或多个的机制将是有利的。根据本专利技术的第一方面,提供了一种计算机实现的语音降噪方法,包括:获取带噪语音信号,所述带噪语音信号包括纯净语音信号和噪声信号;估计所述带噪语音信号的后验信噪比和先验信噪比;基于所估计的后验信噪比和所估计的先验信噪比在Bark域中确定语音/噪声似然比;基于所确定的语音/噪声似然比估计先验语音存在概率;基于所估计的后验信噪比、所估计的先验信噪比以及所估计的先验语音存在概率来确定增益,所述增益为用于将所述带噪语音信号变换成所述纯净语音信号的估计的频域传递函数;并且基于所述增益从所述带噪语音信号导出所述纯净语音信号的所述估计。在一些示例性实施例中,所述估计所述带噪语音信号的先验信噪比和后验信噪比包括:执行第一噪声估计,其中得到所述噪声信号的方差的第一估计;利用所述噪声信号的方差的所述第一估计来估计所述后验信噪比;并且利用所估计的后验信噪比来估计所述先验信噪比。在一些示例性实施例中,所述执行第一噪声估计包括:对所述带噪语音信号的能量谱在频域和时域上进行平滑;对经平滑的所述能量谱执行最小跟踪估计;并且取决于经平滑的所述能量谱与该经平滑的所述能量谱的最小跟踪估计的比值,利用所述带噪语音信号的上一帧中的所述噪声信号的方差的所述第一估计和所述带噪语音信号的当前帧的所述能量谱来选择性地更新所述带噪语音信号的当前帧中的所述噪声信号的方差的所述第一估计。在一些示例性实施例中,所述选择性地更新包括:响应于所述比值大于或等于第一阈值而执行所述更新;并且响应于所述比值小于所述第一阈值而不执行所述更新。在一些示例性实施例中,所述在Bark域中确定语音/噪声似然比包括:基于高斯概率密度假设,将所述语音/噪声似然比计算为,其中为所述带噪语音信号的第帧在第个频点上的所述语音/噪声似然比,为所述第帧在所述第个频点上的所估计的先验信噪比,并且为所述第帧在所述第个频点上的所估计的后验信噪比;并且通过将和从线性频域转换到Bark域而将变换为,其中b为Bark域中的频点。在一些示例性实施例中,从线性频域到Bark域的所述转换基于以下等式:,其中为所述线性频域中的频率。在一些示例性实施例中,所述估计先验语音存在概率包括:在对数域中将平滑为,其中为平滑因子;并且通过在Bark域的全带中映射而得到所估计的所述先验语音存在概率。在一些示例性实施例中,所述映射为,其中为所估计的先验语音存在概率。在一些示例性实施例中,所述方法还包括:独立于所述第一噪声估计执行第二噪声估计,其中得到所述噪声信号的方差的第二估计;并且取决于所述噪声信号的方差的所述第一估计在预定频率范围内的量值之和,利用所述噪声信号的方差的所述第二估计来选择性地重新估计所述后验信噪比和所述先验信噪比。所述确定增益包括:响应于所述重新估计被执行而基于所重新估计的后验信噪比、所重新估计的先验信噪比以及所估计的先验语音存在概率来确定所述增益。在一些示例性实施例中,所述执行第二噪声估计包括:取决于所估计的先验语音存在概率,利用所述带噪语音信号的上一帧中的所述噪声信号的方差的所述第二估计和所述带噪语音信号的当前帧的能量谱来选择性地更新所述当前帧中的所述噪声信号的方差的所述第二估计。在一些示例性实施例中,所述选择性地更新包括:响应于所估计的先验语音存在概率大于或等于第二阈值而执行所述更新;并且响应于所估计的先验语音存在概率小于所述第二阈值而不执行所述更新。在一些示例性实施例中,所述选择性地重新估计所述先验信噪比和所述后验信噪比包括:响应于所述噪声信号的方差的所述第一估计在所述预定频率范围内的所述量值之和大于或等于第三阈值而执行所述重新估计;并且响应于所述噪声信号的方差的所述第一估计在所述预定频率范围内的所述量值之和小于所述第三阈值而不执行所述重新估计。根据本专利技术的另一方面,提供了一种语音降噪装置,包括:信号获取模块,被配置成获取带噪语音信号,所述带噪语音信号包括纯净语音信号和噪声信号;信噪比估计模块,被配置成估计所述带噪语音信号的先验信噪比和后验信噪比;似然比确定模块,被配置成基于所估计的先验信噪比和所估计的后验信噪比在Bark域中确定语音/噪声似然比;概率估计模块,被配置成基于所确定的语音/噪声似然比估计先验语音存在概率;增益确定模块,被配置成基于所估计的先验信噪比、所估计的后验信噪比以及所估计的先验语音存在概率来确定增益,所述增益为用于将所述带噪语音信号变换成所述纯净语音信号的估计的频域传递函数;以及语音信号导出模块,被配置成基于所述增益从所述带噪语音信号导出所述纯净语音信号的所述估计。在一些示例性实施例中,所述信噪比估计模块被配置成通过以下操作来估计所述带噪语音信号的先验信噪比和后验信噪比:执行第一噪声估计,其中得到所述噪声信号的方差的第一估计;利用所述噪声信号的方差的所述第一估计来估计所述后验信噪比;并且利用所估计的后验信噪比来估计所述先验信噪比。在一些示例性实施例中,所述信噪比估计模块被配置成通过以下操作来执行第一噪声估计:对所述带噪语音信号的能量谱在频域和时域上进行平滑;对经平滑的所述能量谱执行最小跟踪估计;并且取决于经平滑的所述能量谱与该经平滑的所述能量谱的最小跟踪估计的比值,利用所述带噪语音信号的上一帧中的所述噪声信号的方差的所述第一估计和所述带噪语音信号的当前帧的所述能量谱来选择性地更新所述带噪语音信号的当前帧中的所述噪声信号的方差的所述第一估计。在一些示例性实施例中,所述信噪比估计模块被配置成响应于所述比值大于或等于第一阈值而执行所述更新,并且响应于所述比值小于所述第一阈值而不执行所述更新。在一些示例性实施例中,所述似然比确定模块被配置成通过以下操作来在Bark域中确定语音/噪声似然比:基于高斯概率密度假设,将所述语音/噪声似然比计算为,其中为所述带噪语音信号的第帧在第个频点上的所述语音/噪声似然比,为所述第帧在所述第个频点上的所估计的先验信噪比,并且为所述第帧在所述第个频点上的所估计的后验信噪比;并且通过将和从线性频域转换到Bark域而将变换为,其中b为Bark域中的频点。在一些示例性实施例中,所述概率估计模块被配置成通过以下操作来估计先验语音存在概率:在对数域中将平滑为,其中为平滑因子;并且通过在Bark域的全带中映射而得到所估计的所述先验语音存在概率。在一些示例性实施例中,所述信噪比估计模块还被配置成独立于所述第一噪声估计执行第二噪声估计,其中得到所述噪声信号的方差的第二估计;并且取决于所本文档来自技高网...

【技术保护点】
1.一种计算机实现的语音降噪方法,包括:获取带噪语音信号,所述带噪语音信号包括纯净语音信号和噪声信号;估计所述带噪语音信号的后验信噪比和先验信噪比;基于所估计的后验信噪比和所估计的先验信噪比在Bark域中确定语音/噪声似然比;基于所确定的语音/噪声似然比估计先验语音存在概率;基于所估计的后验信噪比、所估计的先验信噪比以及所估计的先验语音存在概率来确定增益,所述增益为用于将所述带噪语音信号变换成所述纯净语音信号的估计的频域传递函数;并且基于所述增益从所述带噪语音信号导出所述纯净语音信号的所述估计。

【技术特征摘要】
1.一种计算机实现的语音降噪方法,包括:获取带噪语音信号,所述带噪语音信号包括纯净语音信号和噪声信号;估计所述带噪语音信号的后验信噪比和先验信噪比;基于所估计的后验信噪比和所估计的先验信噪比在Bark域中确定语音/噪声似然比;基于所确定的语音/噪声似然比估计先验语音存在概率;基于所估计的后验信噪比、所估计的先验信噪比以及所估计的先验语音存在概率来确定增益,所述增益为用于将所述带噪语音信号变换成所述纯净语音信号的估计的频域传递函数;并且基于所述增益从所述带噪语音信号导出所述纯净语音信号的所述估计。2.如权利要求1所述的方法,其中所述估计所述带噪语音信号的先验信噪比和后验信噪比包括:执行第一噪声估计,其中得到所述噪声信号的方差的第一估计;利用所述噪声信号的方差的所述第一估计来估计所述后验信噪比;并且利用所估计的后验信噪比来估计所述先验信噪比。3.如权利要求2所述的方法,其中所述执行第一噪声估计包括:对所述带噪语音信号的能量谱在频域和时域上进行平滑;对经平滑的所述能量谱执行最小跟踪估计;并且取决于经平滑的所述能量谱与该经平滑的所述能量谱的最小跟踪估计的比值,利用所述带噪语音信号的上一帧中的所述噪声信号的方差的所述第一估计和所述带噪语音信号的当前帧的所述能量谱来选择性地更新所述带噪语音信号的当前帧中的所述噪声信号的方差的所述第一估计。4.如权利要求3所述的方法,其中所述选择性地更新包括:响应于所述比值大于或等于第一阈值而执行所述更新;并且响应于所述比值小于所述第一阈值而不执行所述更新。5.如权利要求2所述的方法,其中所述在Bark域中确定语音/噪声似然比包括:基于高斯概率密度假设,将所述语音/噪声似然比计算为,其中为所述带噪语音信号的第帧在第个频点上的所述语音/噪声似然比,为所述第帧在所述第个频点上的所估计的先验信噪比,并且为所述第帧在所述第个频点上的所估计的后验信噪比;并且通过将和从线性频域转换到Bark域而将变换为,其中b为Bark域中的频点。6.如权利要求5所述的方法,其中从线性频域到Bark域的所述转换基于以下等式:,其中为所述线性频域中的频率。7.如权利要求5所述的方法,其中所述估计先验语音存在概率包括:在对数域中将平滑为,其中为平滑因子;并且通过在Bark域的全带中映射而得到所估计的所述先验语音存在概率。8.如权利要求7所述的方法,其中所述映射为,其中为所估计的先验语音存在概率。9.如权利要求2所述的方法,还包括:独立于所述第一噪声...

【专利技术属性】
技术研发人员:纪璇于蒙
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1