基于瞬态噪声抑制的音频处理方法、装置、设备及介质制造方法及图纸

技术编号：26480643 阅读：27 留言：0更新日期：2020-11-25 19:26

本发明专利技术涉及人工智能技术领域，尤其涉及基于瞬态噪声抑制的音频处理方法、装置、设备及存储介质。本发明专利技术的音频处理方法根据当前帧音频信号的最大值和帧能量值计算特征值，根据特征值的平滑值和门阔增益因子计算门阔值，基于特征值和门阔值判断当前帧音频信号是否含有瞬态噪声，当判断结果为是时，获取当前帧之前的指定个数帧的最大值的峰值，根据峰值、当前帧音频信号的最大值以及扩展因子计算抑制增益，通过上述方式，特征值很好的匹配了瞬态噪声的特点，能够准确跟踪瞬态噪声，提高瞬态噪声的抑制效果，并且，计算抑制增益时所用峰值和最大值均为时域信号特征，避免对音频产生损伤，抑制瞬态噪声的同时，音频信号得到很好的保真。

全部详细技术资料下载

【技术实现步骤摘要】
基于瞬态噪声抑制的音频处理方法、装置、设备及介质
本专利技术涉及音频处理
，还涉及人工智能领域，尤其涉及基于瞬态噪声抑制的音频处理方法、装置、设备及介质。
技术介绍
噪声抑制在电话、voip、移动音视频通话和办公会议设备等通话场景中应用普遍，对噪声抑制来说，代表了音频前后处理的典型应用，亦决定着一款通话产品性能的成功基础。噪声抑制需要面对各种不同通话场景，应对各种不同的噪声源，现有技术中的噪声抑制方法，对平稳噪声有较好的效果，典型的如谷歌webrtc中的噪声抑制算法，但此类算法对非平稳噪声的抑制效果很差，尤其是瞬态噪声，几乎没有任何抑制效果。瞬态噪声包括敲击键盘声，手机磕碰声，手机磨擦衣服的声音等等。当这些没有经过抑制的瞬态噪声参与到通话中时，通话体验非常差，还可能出现后片理中的agc放大，造成刺耳的尖锐声，对人耳听力产生较大损伤。现有技术中应用人工智能进行噪声抑制在非平衡噪声及瞬态噪声的效果上有一定的效果，但上述方法存在的问题是对语音损伤非常大，音频剪切严重。因此，有必要提供一种新的基于瞬态噪声抑制的音频处理方法。
技术实现思路
本专利技术的目的在于提供一种基于瞬态噪声抑制的音频处理方法、装置、设备及介质，解决现有技术中瞬态噪声抑制效果不佳以及由于进行瞬态噪声抑制导致的音频损伤的技术问题。本专利技术的技术方案如下：提供一种基于瞬态噪声抑制的音频处理方法，包括：获取当前帧音频信号的最大值和帧能量值，根据所述最大值和所述帧能量值获取当前帧音频信号的特征值；<...

【技术保护点】
1.一种基于瞬态噪声抑制的音频处理方法，其特征在于，包括：/n获取当前帧音频信号的最大值和帧能量值，根据所述最大值和所述帧能量值获取当前帧音频信号的特征值；/n根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值，根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值；/n基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声，当判断结果为是时，获取当前帧之前的指定个数帧的最大值的峰值，根据所述峰值、当前帧音频信号的最大值以及预设的扩展因子计算当前帧音频信号的抑制增益；/n将所述抑制增益施加至所述当前帧音频信号，以获取瞬态噪声抑制的音频输出信号。/n

【技术特征摘要】
1.一种基于瞬态噪声抑制的音频处理方法，其特征在于，包括：
获取当前帧音频信号的最大值和帧能量值，根据所述最大值和所述帧能量值获取当前帧音频信号的特征值；
根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值，根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值；
基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声，当判断结果为是时，获取当前帧之前的指定个数帧的最大值的峰值，根据所述峰值、当前帧音频信号的最大值以及预设的扩展因子计算当前帧音频信号的抑制增益；
将所述抑制增益施加至所述当前帧音频信号，以获取瞬态噪声抑制的音频输出信号。

2.根据权利要求1所述的基于瞬态噪声抑制的音频处理方法，其特征在于，所述特征值为所述最大值和所述帧能量值的比值。

3.根据权利要求1或2所述的基于瞬态噪声抑制的语音增强方法，其特征在于，所述门阔值为所述当前帧音频信号的特征值的平滑值和所述门阔增益因子的乘积，所述门阔增益因子为1～2。

4.根据权利要求3所述的基于瞬态噪声抑制的音频处理方法，其特征在于，当所述特征值大于所述门阔值时，判断当前帧音频信号含有瞬态噪声；
所述抑制增益为所述峰值与所述扩展因子的乘积再除以所述当前帧音频信号的最大值。

5.根据权利要求4所述的基于瞬态噪声抑制的音频处理方法，其特征在于，所述将所述抑制增益施加至所述当前帧音频信号，以获取瞬态噪声抑制的音频输出信号之前，还包括：
当所述特征值小于或等于所述门阔值时，判断当前帧音频信号不含有瞬态噪声，将第一预设值作为抑制增益。

6.根据权利要求1所述的基于瞬态噪声抑制的音频处理方法，其特征在于，所述根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值，包括：
获取上一帧音频信号的特征值的平滑值；
计算当前帧音频信号的特征值与第一平滑因子的第一乘积；
计算1减去第一...

【专利技术属性】
技术研发人员：付姝华，汪斌，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人