一种音频信号处理方法、装置、设备及介质制造方法及图纸

技术编号:38350954 阅读:14 留言:0更新日期:2023-08-05 17:24
本申请实施例公开一种音频信号处理方法包括:获取第一音频数据,所述第一音频数据包括多个第一音频数据片段,所述第一音频片段包括多个第一音频数据帧,预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧,基于所述多个第一音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值,基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧,对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据。进行响度增益操作得到目标音频数据。进行响度增益操作得到目标音频数据。

【技术实现步骤摘要】
一种音频信号处理方法、装置、设备及介质


[0001]本申请实施例涉及音频或语音、视频软件的音频信号处理
,尤其涉及一种音频信号处理方法、装置、设备及介质。

技术介绍

[0002]音频信号处理方法的
中,通用降噪是较为重要的一部分。通用降噪的作用目标是去除录制或者说话声中的一些低频的杂声,在语音、视频软件的剪辑中,通用降噪常用于帮助剪辑者对音频进行初步的处理,提升音频的信噪比。
[0003]在常见的音频工作站,会提供一种噪声估计模块让用户选择一段音频片段作为整个音频的预噪声估计片段,但是用户无法很精准的把握噪声的片段,需要多次反复监听才可以确认,同时通用降噪后的音频常常会产生音质音量下降的问题,传统做法是使用特定增益提高整段音频信号的音量,这导致可能会出现失真问题。因此目前音频信号处理方法中噪声估计的选择和降噪后的增益处理都是不够完善的。

技术实现思路

[0004]针对上述相关技术中存在的问题,本申请实施例提供了一种音频信号处理方法,可以兼顾噪声片段的自适应选择和自动增益,大大提升音频信号处理的通用降噪质量。
[0005]第一方面,本申请实施例提供了音频信号处理方法,可包括:获取第一音频数据,所述第一音频数据包括多个第一音频数据片段,所述第一音频片段包括多个第一音频数据帧;预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧;基于所述多个第二音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值;基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧;对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据。
[0006]进一步地,所述预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧,包括:对所述多个第一音频数据片段进行傅里叶变换后进行频率切割得到多个第二音频数据片段。
[0007]进一步地,所述基于所述多个第二音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值,包括:基于所述多个第一音频数据片段一一对应的多个功率谱进行大小排序;基于排序的多个功率谱和无声条件确定所述预估噪声片段;基于所述预估噪声片段计算得到所述噪声阈值。
[0008]进一步地,所述基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧,包括:比较所述每一第二音频数据帧和所述噪声阈值计算得到掩蔽矩阵;基于所述多个第二音频数据片段计算得到平滑滤波器;结合掩蔽矩阵和平滑滤波器处理所述多个第二音
频数据片段并进行逆傅里叶变换后得到所述多个所述第三音频片段。
[0009]进一步地,所述对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据,包括:计算所述每一第三音频数据帧的响度值和一一对应的所述每一第一音频数据帧的响度值的差值;基于每一所述差值比较计算一一对应的所述每一第三音频数据帧的响度增益;基于所述每一响度增益和所述每一第三音频数据帧计算得到目标音频数据。
[0010]进一步地,所述基于所述预估噪声片段计算得到所述噪声阈值,包括:计算所述噪声预估片段的平均值和方差;确定所述平均值加上所述方差乘以平衡常数的积的和为所述噪声阈值。
[0011]进一步地,所述基于每一所述差值比较计算一一对应的所述每一第三音频数据帧的响度增益,还包括:计算所述多个差值的最小值和平均值,若所述任一差值大于所述平均值,则赋予所述平均值为该差值对应的所述第三音频数据帧的响度增益;若所述任一差值小于所述平均值,则赋予所述最小值为该差值对应的所述第三音频数据帧的响度增益。
[0012]第二方面,本申请实施例还提供了一种音频信号处理装置,可包括:
[0013]获取模块,用于获取第一音频数据,所述第一音频数据包括多个第一音频数据片段,所述第一音频片段包括多个第一音频数据帧;预处理模块,用于预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧;噪声预估模块,用于基于所述多个第一音频数据片段一一对应的多个功率谱和无声条件确定预估噪声片段和噪声阈值;降噪处理模块,用于基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值计算得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧;以及响度增益操作模块,用于对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据。
[0014]第三方面,本申请实施例还提供了一种计算机设备,其中,包括:存储器以及处理器,所述存储器用于存储并支持处理器执行第一方面中任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
[0015]第四方面,本申请实施例还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,其中,所述程序代码使所述处理器执行所述第一方面的任一所述方法。
[0016]本申请实施例中,由于获取第一音频数据,所述第一音频数据包括多个第一音频数据片段,所述第一音频片段包括多个第一音频数据帧,预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧,通过基于所述多个第一音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值,实现了第一音频数据的预估噪声片段的自适应选择,避免用户反复监听选择导致的过程繁杂和预估失误,同时基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧,通过对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据,即对每一第三音频片段的每一第三音频数据帧分别进行响度增益操作,避免对整段音频数据赋予同样增益系数导致的失真,实现了音频数据的分帧自动增益。从而在音频信号处理的通用降噪中实现了高信噪比,使得音频信号降噪前后响度保真,保证了处理后音频信号的质量。
附图说明
[0017]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0018]图1为本申请实施例提供的一种音频信号处理方法的一个流程示意图;
[0019]图2(a)为本申请实施例提供的原始音频样本的频谱图;
[0020]图2(b)为本申请实施例提供的预处理后的音频样本的频谱图;
[0021]图3为本申请另一实施例提供的一种音频信号处理方法的一个流程示意图;
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,包括:获取第一音频数据,所述第一音频数据包括多个第一音频数据片段,所述第一音频片段包括多个第一音频数据帧;预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧;基于所述多个第二音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值;基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧;对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据。2.根据权利要求1所述的方法,其特征在于,所述预处理所述多个第一音频数据片段得到多个第二音频数据片段,所述第二音频片段包括多个第二音频数据帧,包括:对所述多个第一音频数据片段进行傅里叶变换后进行频率切割得到多个第二音频数据片段。3.根据权利要求1所述的方法,其特征在于,所述基于所述多个第二音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值,包括:基于所述多个第一音频数据片段一一对应的多个功率谱进行大小排序;基于排序的多个功率谱和无声条件确定所述预估噪声片段;基于所述预估噪声片段计算得到所述噪声阈值。4.根据权利要求1所述的方法,其特征在于,所述基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段,所述第三音频片段包括多个第三音频数据帧,包括:比较所述每一第二音频数据帧和所述噪声阈值计算得到掩蔽矩阵;基于所述多个第二音频数据片段计算得到平滑滤波器;结合掩蔽矩阵和平滑滤波器处理所述多个第二音频数据片段并进行逆傅里叶变换后得到所述多个所述第三音频片段。5.根据权利要求1所述的方法,其特征在于,所述对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据,包括:计算所述每一第三音频数据帧的响度值...

【专利技术属性】
技术研发人员:戚成杰
申请(专利权)人:深圳万兴软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1