音频噪声检测方法、计算机设备和计算机程序产品技术

技术编号：33955781 阅读：25 留言：0更新日期：2022-06-29 23:28

本申请涉及一种音频噪声检测方法、计算机设备和计算机程序产品。所述方法包括：获取待检测的音频信号的多个音频帧；确定多个音频帧中每个音频帧的频域能量信息；基于音频帧的频域能量信息，获取多个音频帧中目标音频帧与目标音频帧的相邻音频帧之间的频域能量变化量；获取目标音频帧对应的目标变化量阈值；目标变化量阈值基于目标音频帧的音频帧类型确定；若频域能量变化量大于目标变化量阈值，则确定目标音频帧存在噪声信号，本申请可以利用噪声在频域上能量快速变化的特征进行噪声信号识别，并且，可以结合音频帧类型动态调整阈值，能够适应不同的识别场景，避免错检噪声信号，实现了音频噪声高效准确的识别。了音频噪声高效准确的识别。了音频噪声高效准确的识别。

Audio noise detection methods, computer equipment and computer program products

全部详细技术资料下载

【技术实现步骤摘要】
音频噪声检测方法、计算机设备和计算机程序产品

[0001]本申请涉及音频
，特别是涉及一种音频噪声检测方法、计算机设备和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展，音乐应用或聊天应用日益普及，用户可以自发进行音频录制。由于用户录音习惯等，录制的音频文件中容易出现噪声，如用户摩擦耳机或录制麦克风会产生噪声(该噪声也被称为click)，从而造成人声信号失真。
[0003]相关技术中，可以基于音频时域信号的幅值或能量，与某个阈值进行对比，对音频中的噪声进行识别，以便优化音频文件质量。但是该方式往往会出现错检或漏检的情况，存在噪声识别准确率低的问题。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高噪声识别准确率的音频噪声检测方法、计算机设备和计算机程序产品。
[0005]第一方面，本申请提供了一种音频噪声检测方法。所述方法包括：
[0006]获取待检测的音频信号的多个音频帧；
[0007]确定所述多个音频帧中每个音频帧的频域能量信息；
[0008]基于所述音频帧的频域能量信息，获取所述多个音频帧中目标音频帧与所述目标音频帧的相邻音频帧之间的频域能量变化量，所述目标音频帧为所述多个音频帧中的一音频帧；
[0009]获取所述目标音频帧对应的目标变化量阈值；所述目标变化量阈值基于所述目标音频帧的音频帧类型确定；
[0010]若所述频域能量变化量大于所述目标变化量阈值，则确定所述目标音频帧存在噪声信号。
>[0011]在其中一个实施例中，所述获取所述目标音频帧对应的目标变化量阈值的步骤包括：
[0012]获取目标音频帧的音频帧类型；
[0013]若所述目标音频帧的音频帧类型为边界音频帧或静音音频帧，则调高预设的初始能量变化阈值，得到目标能量变化阈值；其中，所述边界音频帧是所述多个音频帧中人声音频帧与非人声音频帧的切换边界处的音频帧；
[0014]若所述目标音频帧的音频帧类型非边界音频帧或静音音频帧，则将所述初始能量变化阈值作为目标能量变化阈值。
[0015]在其中一个实施例中，所述获取目标音频帧的音频帧类型，包括：
[0016]获取目标音频帧的信号功率；
[0017]若所述信号功率小于预设的信号功率阈值，则确定所述目标音频帧的音频帧类型
为边界音频帧或静音音频帧；
[0018]若所述信号功率大于或等于所述信号功率阈值，则确定所述目标音频帧的音频帧类型非边界音频帧或静音音频帧。
[0019]在其中一个实施例中，所述音频帧的频域能量信息包括所述音频帧中多个频率点对应的幅值，所述基于所述音频帧的频域能量信息，获取目标音频帧与所述目标音频帧的相邻音频帧之间的频域能量变化量，包括：
[0020]获取目标音频帧中第一频率点的数量；所述第一频率点为所述目标音频帧中幅值变化量超过幅值变化量阈值的频率点，所述幅值变化量为所述目标音频帧与相邻音频帧中对应频率点的幅值之间的变化量；
[0021]获取所述目标音频帧中第二频率点的数量；所述第二频率点为所述目标音频帧中的幅值大于零的频率点；
[0022]基于所述第一频率点的数量和所述第二频率点的数量，确定所述目标音频帧与所述目标音频帧的相邻音频帧之间的频域能量变化量。
[0023]在其中一个实施例中，在所述获取目标音频帧中第一频率点的数量之前，还包括：
[0024]针对目标音频帧中的每个频率点，从相邻音频帧中确定出所述频率点的参考频率点，所述参考频率点的频率点序号与所述频率点的频率点序号相匹配；
[0025]获取所述频率点与所述频率点的参考频率点之间的幅值变化量，并将幅值变化量超过幅值变化量阈值的频率点确定为第一频率点。
[0026]在其中一个实施例中，所述基于所述第一频率点的数量和所述第二频率点的数量，确定所述目标音频帧与所述目标音频帧的相邻音频帧之间的频域能量变化量，包括：
[0027]获取所述第二频率点的数量和所述第一频率点的数量之间的比值；
[0028]基于所述比值确定所述目标音频帧与所述相邻音频帧之间的频域能量变化量。
[0029]在其中一个实施例中，所述确定所述多个音频帧中每个音频帧的频域能量信息，包括：
[0030]根据所述音频帧的频谱数据，获取所述音频帧的幅度谱；
[0031]基于所述幅度谱确定所述音频帧的频域能量信息。
[0032]在其中一个实施例中，所述获取待检测的音频信号的多个音频帧，包括：
[0033]在采集音频信号的过程中，将当前采集的音频信号作为待检测的音频信号；
[0034]在所述若所述频域能量变化量大于所述目标变化量阈值，则确定所述目标音频帧存在噪声信号之后，还包括：
[0035]生成噪声提示信息，并在采集音频信号的过程中输出所述噪声提示信息。
[0036]第二方面，本申请还提供了一种计算机设备，包括存储器和处理器。所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上任一项所述的方法的步骤。
[0037]第三方面，本申请还提供了一种计算机程序产品，包括计算机程序。所述计算机程序被处理器执行时实现如上任一项所述的方法的步骤。
[0038]上述音频噪声检测方法、计算机设备和计算机程序产品可以获取待检测的音频信号的多个音频帧，确定多个音频帧中每个音频帧的频域能量信息；基于音频帧的频域能量信息，获取多个音频帧中目标音频帧与目标音频帧的相邻音频帧之间的频域能量变化量，并获取目标音频帧对应的目标变化量阈值，其中，目标变化量阈值基于目标音频帧的音频
帧类型确定，进而若频域能量变化量大于目标变化量阈值，则确定目标音频帧存在噪声信号。本实施例中，可以利用噪声在频域上能量快速变化的特征进行噪声信号识别，并且，可以结合音频帧类型动态调整阈值，能够适应不同的识别场景，避免错检噪声信号，实现了音频噪声高效准确的识别。
附图说明
[0039]图1为一个实施例中音频噪声检测方法的流程示意图；
[0040]图2为一个实施例中语音信号的频谱图；
[0041]图3为一个实施例中获取音频帧类型的步骤的流程示意图；
[0042]图4为一个实施例中语音信号的处理结果示意图；
[0043]图5为一个实施例中确定频域能量变化量的步骤的流程示意图；
[0044]图6为另一个实施例中音频噪声检测方法的流程示意图；
[0045]图7为一个实施例中音频噪声检测装置的结构框图；
[0046]图8为一个实施例中计算机设备的内部结构图；
[0047]图9为另一个实施例中计算机设备的内部结构图。
具体实施方式
[0048]为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。
[0049本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频噪声检测方法，其特征在于，所述方法包括：获取待检测的音频信号的多个音频帧；确定所述多个音频帧中每个音频帧的频域能量信息；基于所述音频帧的频域能量信息，获取所述多个音频帧中目标音频帧与所述目标音频帧的相邻音频帧之间的频域能量变化量，所述目标音频帧为所述多个音频帧中的一音频帧；获取所述目标音频帧对应的目标变化量阈值；所述目标变化量阈值基于所述目标音频帧的音频帧类型确定；若所述频域能量变化量大于所述目标变化量阈值，则确定所述目标音频帧存在噪声信号。2.根据权利要求1所述的方法，其特征在于，所述获取所述目标音频帧对应的目标变化量阈值，包括：获取目标音频帧的音频帧类型；若所述目标音频帧的音频帧类型为边界音频帧或静音音频帧，则调高预设的初始能量变化阈值，得到目标能量变化阈值；其中，所述边界音频帧是所述多个音频帧中人声音频帧与非人声音频帧的切换边界处的音频帧；若所述目标音频帧的音频帧类型非边界音频帧或静音音频帧，则将所述初始能量变化阈值作为目标能量变化阈值。3.根据权利要求2所述的方法，其特征在于，所述获取目标音频帧的音频帧类型，包括：获取目标音频帧的信号功率；若所述信号功率小于预设的信号功率阈值，则确定所述目标音频帧的音频帧类型为边界音频帧或静音音频帧；若所述信号功率大于或等于所述信号功率阈值，则确定所述目标音频帧的音频帧类型非边界音频帧或静音音频帧。4.根据权利要求1所述的方法，其特征在于，所述音频帧的频域能量信息包括所述音频帧中多个频率点对应的幅值，所述基于所述音频帧的频域能量信息，获取所述多个音频帧中目标音频帧与所述目标音频帧的相邻音频帧之间的频域能量变化量，包括：获取目标音频帧中第一频率点的数量；所述第一频率点为所述目标音频帧中幅值变化量超过幅值变化量阈值的频率点，所述幅值变化量为所述目标音频帧与相邻音频帧中对应频率点的幅值之间的变化量；获取所述目标音频帧中第二频率点的数量；所述第二频率点为所述...

【专利技术属性】
技术研发人员：李博文，
申请(专利权)人：腾讯音乐娱乐科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人