基于瞬态噪声抑制的音频处理方法、装置、设备及介质制造方法及图纸

技术编号:26480643 阅读:27 留言:0更新日期:2020-11-25 19:26
本发明专利技术涉及人工智能技术领域,尤其涉及基于瞬态噪声抑制的音频处理方法、装置、设备及存储介质。本发明专利技术的音频处理方法根据当前帧音频信号的最大值和帧能量值计算特征值,根据特征值的平滑值和门阔增益因子计算门阔值,基于特征值和门阔值判断当前帧音频信号是否含有瞬态噪声,当判断结果为是时,获取当前帧之前的指定个数帧的最大值的峰值,根据峰值、当前帧音频信号的最大值以及扩展因子计算抑制增益,通过上述方式,特征值很好的匹配了瞬态噪声的特点,能够准确跟踪瞬态噪声,提高瞬态噪声的抑制效果,并且,计算抑制增益时所用峰值和最大值均为时域信号特征,避免对音频产生损伤,抑制瞬态噪声的同时,音频信号得到很好的保真。

【技术实现步骤摘要】
基于瞬态噪声抑制的音频处理方法、装置、设备及介质
本专利技术涉及音频处理
,还涉及人工智能领域,尤其涉及基于瞬态噪声抑制的音频处理方法、装置、设备及介质。
技术介绍
噪声抑制在电话、voip、移动音视频通话和办公会议设备等通话场景中应用普遍,对噪声抑制来说,代表了音频前后处理的典型应用,亦决定着一款通话产品性能的成功基础。噪声抑制需要面对各种不同通话场景,应对各种不同的噪声源,现有技术中的噪声抑制方法,对平稳噪声有较好的效果,典型的如谷歌webrtc中的噪声抑制算法,但此类算法对非平稳噪声的抑制效果很差,尤其是瞬态噪声,几乎没有任何抑制效果。瞬态噪声包括敲击键盘声,手机磕碰声,手机磨擦衣服的声音等等。当这些没有经过抑制的瞬态噪声参与到通话中时,通话体验非常差,还可能出现后片理中的agc放大,造成刺耳的尖锐声,对人耳听力产生较大损伤。现有技术中应用人工智能进行噪声抑制在非平衡噪声及瞬态噪声的效果上有一定的效果,但上述方法存在的问题是对语音损伤非常大,音频剪切严重。因此,有必要提供一种新的基于瞬态噪声抑制的音频处理方法。
技术实现思路
本专利技术的目的在于提供一种基于瞬态噪声抑制的音频处理方法、装置、设备及介质,解决现有技术中瞬态噪声抑制效果不佳以及由于进行瞬态噪声抑制导致的音频损伤的技术问题。本专利技术的技术方案如下:提供一种基于瞬态噪声抑制的音频处理方法,包括:获取当前帧音频信号的最大值和帧能量值,根据所述最大值和所述帧能量值获取当前帧音频信号的特征值;<br>根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值,根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值;基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声,当判断结果为是时,获取当前帧之前的指定个数帧的最大值的峰值,根据所述峰值、当前帧音频信号的最大值以及预设的扩展因子计算当前帧音频信号的抑制增益;将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号。优选地,所述特征值为所述最大值和所述帧能量值的比值。优选地,所述门阔值为所述当前帧音频信号的特征值的平滑值和所述门阔增益因子的乘积,所述门阔增益因子为1~2。优选地,当所述特征值大于所述门阔值时,判断当前帧音频信号含有瞬态噪声;所述抑制增益为所述峰值与所述扩展因子的乘积再除以所述当前帧音频信号的最大值。优选地,所述将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号之前,还包括:当所述特征值小于或等于所述门阔值时,判断当前帧音频信号不含有瞬态噪声,将第一预设值作为抑制增益。优选地,所述根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值,包括:获取上一帧音频信号的特征值的平滑值;计算当前帧音频信号的特征值与第一平滑因子的第一乘积;计算1减去第一平滑因子的差值以及上一帧音频信号的特征值的平滑值与所述差值的第二乘积;将第一乘积和第二乘积进行累加得到当前帧音频信号的特征值的平滑值;所述基于瞬态噪声抑制的音频处理方法还包括:将所述当前帧音频信号的所述特征值和所述门阔值上传至区块链中,以使得所述区块链对所述特征值和所述门阔值进行加密存储。优选地,所述将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号,包括:根据前一帧音频信号的抑制增益、当前帧音频信号的抑制增益以及预设的第二平滑因子计算当前帧音频信号的抑制增益的平滑值;将当前帧音频信号乘以当前帧音频信号的抑制增益的平滑值,得到瞬态噪声抑制的音频输出信号。优选地,所述将当前帧音频信号乘以当前帧音频信号的抑制增益的平滑值,得到瞬态噪声抑制的音频输出信号,包括:将所述当前帧音频信号的每个采样点的幅度值分别乘以当前帧音频信号的抑制增益的平滑值,得到瞬态噪声抑制的音频输出信号。本专利技术的另一技术方案如下:提供一种基于瞬态噪声抑制的音频处理装置,所述装置包括:瞬态噪声跟踪模块,用于获取当前帧音频信号的最大值和帧能量值,根据所述最大值和所述帧能量值获取当前帧音频信号的特征值;第一计算模块,用于根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值,根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值;第二计算模块,用于基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声,当判断结果为是时,获取当前帧音频信号的抑制增益;增益处理模块,用于将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号。本专利技术的另一技术方案如下:提供一种电子设备,所述电子设备包括处理器、以及与所述处理器耦接的存储器,所述存储器存储有用于实现上述的基于瞬态噪声抑制的音频处理方法的程序指令;所述处理器用于执行所述存储器存储的所述程序指令以进行基于瞬态噪声抑制的音频处理。本专利技术的另一技术方案如下:提供一种存储介质,所述存储介质内存储有能够实现上述的基于瞬态噪声抑制的音频处理方法的程序指令。本专利技术的有益效果在于:本专利技术的基于瞬态噪声抑制的音频处理方法、装置、设备及存储介质,根据当前帧音频信号的最大值和帧能量值计算当前帧音频信号的特征值,根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值,基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声,当判断结果为是时,获取当前帧之前的指定个数帧的最大值的峰值,根据所述峰值、当前帧音频信号的最大值以及预设的扩展因子计算当前帧音频信号的抑制增益,通过上述方式,特征值很好的匹配了瞬态噪声的特点,能够准确跟踪瞬态噪声,提高瞬态噪声的抑制效果,并且,计算抑制增益时所用峰值和最大值均为时域信号特征,整个处理流程仅涉及时域数据,避免对音频产生损伤,抑制瞬态噪声的同时,音频信号得到很好的保真。【附图说明】图1为本专利技术第一实施例的基于瞬态噪声抑制的音频处理方法的流程示意图;图2为本专利技术第二实施例的基于瞬态噪声抑制的音频处理方法的流程示意图;图3为本专利技术第三实施例的基于瞬态噪声抑制的音频处理装置的结构示意图;图4为本专利技术第四实施例的基于瞬态噪声抑制的音频处理装置的结构示意图;图5为本专利技术第五实施例的存储介质的结构示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特本文档来自技高网...

【技术保护点】
1.一种基于瞬态噪声抑制的音频处理方法,其特征在于,包括:/n获取当前帧音频信号的最大值和帧能量值,根据所述最大值和所述帧能量值获取当前帧音频信号的特征值;/n根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值,根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值;/n基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声,当判断结果为是时,获取当前帧之前的指定个数帧的最大值的峰值,根据所述峰值、当前帧音频信号的最大值以及预设的扩展因子计算当前帧音频信号的抑制增益;/n将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号。/n

【技术特征摘要】
1.一种基于瞬态噪声抑制的音频处理方法,其特征在于,包括:
获取当前帧音频信号的最大值和帧能量值,根据所述最大值和所述帧能量值获取当前帧音频信号的特征值;
根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值,根据所述特征值的平滑值和预设的门阔增益因子计算所述当前帧音频信号的门阔值;
基于所述特征值和所述门阔值判断当前帧音频信号是否含有瞬态噪声,当判断结果为是时,获取当前帧之前的指定个数帧的最大值的峰值,根据所述峰值、当前帧音频信号的最大值以及预设的扩展因子计算当前帧音频信号的抑制增益;
将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号。


2.根据权利要求1所述的基于瞬态噪声抑制的音频处理方法,其特征在于,所述特征值为所述最大值和所述帧能量值的比值。


3.根据权利要求1或2所述的基于瞬态噪声抑制的语音增强方法,其特征在于,所述门阔值为所述当前帧音频信号的特征值的平滑值和所述门阔增益因子的乘积,所述门阔增益因子为1~2。


4.根据权利要求3所述的基于瞬态噪声抑制的音频处理方法,其特征在于,当所述特征值大于所述门阔值时,判断当前帧音频信号含有瞬态噪声;
所述抑制增益为所述峰值与所述扩展因子的乘积再除以所述当前帧音频信号的最大值。


5.根据权利要求4所述的基于瞬态噪声抑制的音频处理方法,其特征在于,所述将所述抑制增益施加至所述当前帧音频信号,以获取瞬态噪声抑制的音频输出信号之前,还包括:
当所述特征值小于或等于所述门阔值时,判断当前帧音频信号不含有瞬态噪声,将第一预设值作为抑制增益。


6.根据权利要求1所述的基于瞬态噪声抑制的音频处理方法,其特征在于,所述根据所述特征值和预设的第一平滑因子计算所述当前帧音频信号的特征值的平滑值,包括:
获取上一帧音频信号的特征值的平滑值;
计算当前帧音频信号的特征值与第一平滑因子的第一乘积;
计算1减去第一...

【专利技术属性】
技术研发人员:付姝华汪斌
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1