一种基于稀疏分解的音频噪声实时检测方法技术

技术编号:10753763 阅读:128 留言:0更新日期:2014-12-11 11:19
本发明专利技术提供一种基于稀疏分解的音频噪声实时检测方法,用于对音频流进行实时噪声检测,主要包括以下步骤:首先接收前N帧音频帧,构建初始原子库;然后对第N帧之后的每一音频帧进行静音判断、第一次稀疏分解、第二次稀疏分解,并采用帧计数器对音频帧进行循环计数,每当帧计数器计数到达N后,进行一次噪声判定,同时将帧计数器置零。本发明专利技术能够检测音频中各种类型的噪声,如白噪声、粉红噪声、高频信道噪声等,当信号和噪声同时存在时,也能够检测出信号被噪声所覆盖而导致音频内容模糊不清,无法正常收听的情况;同时,该检测方法算法简单、处理快速,能够广泛应用于音频信号的实时监测,如广播、电视信号监测。

【技术实现步骤摘要】
一种基于稀疏分解的音频噪声实时检测方法
本专利技术属于数字音频处理
,具体地说是一种基于稀疏分解的音频噪声检测方法。该方法可应用于对音频信号进行自动实时监测。
技术介绍
当前,音频广播已成为最为普及的大众宣传和娱乐媒体。由于广播系统本身的复杂性,以及在发射、传输和接收各环节会受到外界因素的影响,广播中时常会出现播出异常或故障。因此,正常安全的播出一直以来都是广播电台业务的一个基本目标,而达到该目标的一个重要手段就是对播出音频的质量进行有效的监控。目前国内电台广播监控已由传统的人工方式过渡到了计算机辅助完成,并初步实现了一些简单异常事件的监测自动化。在音频质量监测中,噪声检测是一个重要内容,即检测当前播出的音频是否被噪声覆盖或已完全是噪声。与其他电平、相位等信号参数的检测相比,噪声检测更为直接地指示出当前音频是否有异常。一旦检测出是噪声,可以进行及时的报警和排查故障,避免重大播出事故的发生。目前,在音频噪声相关的报道中,以音频去噪或增强的研究居多。音频去噪或增强以提高信号-噪声比为目标,往往着眼于尽可能地提取信号而抑制噪声,故这类方法一般不能直接用于噪声检测。另外,文献中也报道了对音频及噪声分类识别的研究。分类识别方法一般先提取音频特征,如过零率、音高、梅尔频率倒谱系数(MFCC),线性预测编码(LPC)等,用音频特征去训练一定的数学模型,如高斯混合模型(GMM)、隐马尔科夫(HMM)模型、神经网络(NN)模型等,最后用分类器,如K最邻近结点算法(KNN)和支持向量机(SVM)等进行分类。这些方法一般只针对白噪声,且复杂度比较高。事实上,广播音频噪声涉及的种类很广,除了白噪声外,还有受环境因素影响而出现的各类噪声,如粉红噪声、高频信道噪声等;噪声也不一定单独存在,它可能与信号混合在一起且将信号覆盖,导致音频内容模糊不清,无法正常收听。另外,广播监测应用还有实时性的要求。基于这些考虑,至今文献中尚未见适合于广播电台应用的音频噪声实时检测方法的报道。近年来,稀疏分解方法已成为信号表示的一个新的研究热点。其基本思想是用冗余函数系统(原子库)取代传统的正交基函数,并从中找到具有最佳线性组合的M项原子来表示一个信号。稀疏分解方法已被应用到音视频信号的去噪中,但在噪声检测方面的应用还未见报道。
技术实现思路
本专利技术的目的在于针对
技术介绍
存在的问题,提供一种对音频流的噪声检测方法。本专利技术的技术方案是:一种基于稀疏分解的音频噪声实时检测方法,包括以下步骤:S1.构建初始原子库:S11.初始化原子库D1和D2为空,并设定原子库的大小(原子库中包含的原子数目)为N,N为1秒内音频帧总帧数;S12.对接收到的前N帧音频帧,将每一帧数据排列成一列矢量,归一化后作为一个原子同时加入到原子库D1和D2中,从而完成初始原子库的构建;对第N帧之后的每一帧音频帧,进行如下处理:S2.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;S3.静音判断:计算当前音频帧的能量,即计算帧内各音频样本值的平方和;若帧能量小于设定的静音门限,则转到步骤S6;S4.第一次稀疏分解:S41.稀疏分解:在原子库D1下,对当前音频帧y进行稀疏分解,即求解如下最优化问题:且满足||x||0≤L1(1)其中,||·||2和||·||0分别表示2范数和0范数算子,L1为设定的第一次稀疏分解的稀疏度,1≤L1≤3;S42.计算余量信号R1:R1将在步骤S5作为第二次稀疏分解的输入信号;S43.更新原子库D1:将y归一化后,加入到D1中并删除D1中与当前帧时间相隔最远的音频帧所对应的原子;S5.第二次稀疏分解:S51.稀疏分解:在原子库D2下,对余量信号R1进行稀疏分解,即求解如下最优化问题:且满足||x||0≤L2(3)其中,L2为设定的第二次稀疏分解的稀疏度,5≤L2≤10;S52.计算余量信号R2:S53.计算余量成分t:S54.更新原子库D2:将R1归一化后,加入到D2中并删除D2中与当前帧时间相隔最远的音频帧所对应的原子;S6.若帧计数器的当前计数值小于N,则转到步骤S2,接收处理下一音频帧;否则转到步骤S7进行噪声判定,同时将帧计数器置零;S7.噪声判定:设参与噪声判定的音频帧数目为M,M≥N,设当前音频帧为第k帧,计算第k-M+1帧到第k帧的余量成分与其最大值的平均偏差:其中,ti表示第i帧的余量成分,对静音帧,余量成分设为0;tmax表示ti(i=k-M+1,k-M+2,…,k)的最大值;若平均偏差d小于设定的阈值Td(0.15≤Td≤0.2),则判定当前音频为噪声,否则为非噪声;本专利技术的有益效果:本专利技术提供一种基于稀疏分解的音频噪声实时检测方法,适用于检测音频中各种类型的噪声,如白噪声、粉红噪声、高频信道噪声等,当信号和噪声同时存在时,也能够检测出信号被噪声所覆盖而导致音频内容模糊不清,无法正常收听的情况;同时,该检测方法算法简单、处理快速,能够广泛应用于音频信号的实时监测,如广播、电视信号监测。附图说明图1为本专利技术方法的流程示意图。图2为本专利技术实施例测试音频时域波形图。图3为本专利技术实施例中第9~10秒内的音频帧余量成分分布图。图4为本专利技术实施例中各次噪声判定的音频帧余量成分的平均偏差分布图。具体实施方式本实施例以一段实际广播的“购车广告”音频作为输入。该音频段的采样率为48KHz,时间长度为20秒,其中前8秒为人声加背景音乐的正常音频,从第9秒开始受到环境干扰,音频中产生很强的干扰噪声,使得人声内容变得模糊不清,无法正常收听。干扰噪声共持续6秒钟,在整个音频的第15秒,信号完全中断,音频变为白噪声。整个测试音频的时域波形图如图2所示。将音频数据按512个采样点的长度等分为各音频帧,其总帧数为1875帧,对音频进行噪声检测的具体步骤如下:S1.构建初始原子库:S11.初始化原子库D1和D2为空,并设定原子库中包含的原子数目为N=94,该值为1秒内的音频帧总帧数;S12.对接收到的前94帧音频帧,将每一帧数据排列成一列矢量,归一化后作为一个原子同时加入到原子库D1和D2中,从而完成初始原子库的构建;从95帧开始,对每一帧音频帧进行后续处理;下面以第937帧为例进行说明,在第936帧音频帧处理结束时,帧计数器的计数值为93;S2.接收音频帧:接收第937帧音频,将其每个样本值转化为0~1间的浮点数(即除以32768)后排列成一列矢量y=(-0.0233,0.0076,0.0155,…,0.0546)T;帧计数器加1,即计数值由93增至94;S3.静音判断:计算y各元素的平方和,得到当前音频帧的能量为1.1696;由于帧能量大于设定的静音门限0.25,则继续执行后续步骤;S4.第一次稀疏分解:S41.稀疏分解:在原子库D1下,对y进行稀疏分解,即求解如下最优化问题:且满足||x||0≤L1(1)其中,||·||2和||·||0分别表示2范数和0范数算子,L1设定为1;得到只含有1个非0元素-0.1841,其位置为62;S42.计算余量信号R1:计算得到R1=(-0.0165,0.0161,0.0229,…,0.0546)T,将其作为第二次稀疏分解的输入信号;S43.更新原子库D1:将y归一化后,本文档来自技高网
...
一种基于稀疏分解的音频噪声实时检测方法

【技术保护点】
一种基于稀疏分解的音频噪声实时检测方法,包括以下步骤: S1.构建初始原子库: S11.初始化原子库D1和D2为空,并设定原子库的大小为N,N为1秒内音频帧总帧数; S12.对接收到的前N帧音频帧,将每一帧数据排列成一列矢量,归一化后作为一个原子同时加入到原子库D1和D2中,从而完成初始原子库的构建; 对第N帧之后的每一帧音频帧,进行如下处理: S2.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1; S3.静音判断:计算当前音频帧的能量;若帧能量小于设定的静音门限,则转到步骤S6; S4.第一次稀疏分解: S41.稀疏分解:在原子库D1下,对当前音频帧y进行稀疏分解,即求解如下最优化问题: 且满足||x||0≤L1其中,||·||2和||·||0分别表示2范数和0范数算子,L1为设定的第一次稀疏分解的稀疏度,1≤L1≤3; S42.计算余量信号R1: R1将在步骤S5作为第二次稀疏分解的输入信号; S43.更新原子库D1:将y归一化后,加入到D1中并删除D1中与当前帧时间相隔最远的音频帧所对应的原子; S5.第二次稀疏分解: S51.稀疏分解:在原子库D2下,对余量信号R1进行稀疏分解,即求解如下最优化问题: 且满足||x||0≤L2其中,L2为设定的第二次稀疏分解的稀疏度,5≤L2≤10; S52.计算余量信号R2: S53.计算余量成分t: S54.更新原子库D2:将R1归一化后,加入到D2中并删除D2中与当前帧时间相隔最远的音频帧所对应的原子; S6.若帧计数器的当前计数值小于N,则转到步骤S2,接收处理下一音频帧;否则转到步骤S7进行噪声判定,同时将帧计数器置零; S7.噪声判定:设参与噪声判定的音频帧数目为M,M≥N,设当前音频帧为第k帧,计算第k‑M+1帧到第k帧的余量成分与其最大值的平均偏差: 其中,ti表示第i帧的余量成分,对静音帧,余量成分设为0; tmax表示ti的最大值,其中i=k‑M+1,k‑M+2,…,k;若平均偏差d小于设定的阈值Td,则判定当前音频为噪声,否则为非噪声。...

【技术特征摘要】
1.一种基于稀疏分解的音频噪声实时检测方法,包括以下步骤:S1.构建初始原子库:S11.初始化原子库D1和D2为空,并设定原子库的大小为N,N为1秒内音频帧总帧数;S12.对接收到的前N帧音频帧,将每一帧数据排列成一列矢量,归一化后作为一个原子同时加入到原子库D1和D2中,从而完成初始原子库的构建;对第N帧之后的每一帧音频帧,进行如下处理:S2.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;S3.静音判断:计算当前音频帧的能量;若帧能量小于设定的静音门限,则转到步骤S6;S4.第一次稀疏分解:S41.稀疏分解:在原子库D1下,对当前音频帧y进行稀疏分解,即求解如下最优化问题:且满足||x||0≤L1其中,||·||2和||·||0分别表示2范数和0范数算子,L1为设定的第一次稀疏分解的稀疏度,1≤L1≤3;S42.计算余量信号R1:R1将在步骤S5作为第二次稀疏分解的输入信号;S43.更新原子库D1:将y归一化后,加入到D1中并删除D1中与当前帧时间相隔最远的音频帧所对应的原子;S5.第二次稀疏分解:S51.稀疏分解:在原子库D2下,对余量信...

【专利技术属性】
技术研发人员:甘涛何艳敏黄晓革兰刚周南
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1