一种基于相关分析的音频噪声实时检测方法技术

技术编号:10742308 阅读:138 留言:0更新日期:2014-12-10 15:34
本发明专利技术提供一种基于相关分析的音频噪声实时检测方法,用于对音频流进行实时噪声检测,首先接收音频帧,并采用帧计数器对接收到的音频帧进行循环计数;每当帧计数器计数到达Nf后,进行削弱信号成分、相关性分析和噪声判定,同时将帧计数器置零。本发明专利技术适用于检测音频中各种类型的噪声,如白噪声、粉红噪声、高频信道噪声等,当信号和噪声同时存在时,也能够检测出信号被噪声所覆盖而导致音频内容模糊不清,无法正常收听的情况;同时,该检测方法算法简单、处理快速,能够广泛应用于音频信号的实时监测,如广播、电视信号监测。

【技术实现步骤摘要】
一种基于相关分析的音频噪声实时检测方法
本专利技术属于数字音频处理
,具体地说是一种基于相关分析的音频噪声检测方法,该方法可应用于对音频信号进行自动实时监测。
技术介绍
当前,音频广播已成为最为普及的大众宣传和娱乐媒体。由于广播系统本身的复杂性,以及在发射、传输和接收各环节会受到外界因素的影响,广播中时常会出现播出异常或故障。因此,正常安全的播出一直以来都是广播电台业务的一个基本目标,而达到该目标的一个重要手段就是对播出音频的质量进行有效的监控。目前国内电台广播监控已由传统的人工方式过渡到了计算机辅助完成,并初步实现了一些简单异常事件的监测自动化。在音频质量监测中,噪声检测是一个重要内容,即检测当前播出的音频是否被噪声覆盖或已完全是噪声。与其他电平、相位等信号参数的检测相比,噪声检测更为直接地指示出当前音频是否有异常。一旦检测出是噪声,可以进行及时的报警和排查故障,避免重大播出事故的发生。目前,在音频噪声相关的报道中,以音频去噪或增强的研究居多。音频去噪或增强以提高信号-噪声比为目标,往往着眼于尽可能地提取信号而抑制噪声,故这类方法一般不能直接用于噪声检测。另外,文献中也报道了对音频及噪声分类识别的研究。分类识别方法一般先提取音频特征,如过零率、音高、梅尔频率倒谱系数(MFCC),线性预测编码(LPC)等,用音频特征去训练一定的数学模型,如高斯混合模型(GMM)、隐马尔科夫(HMM)模型、神经网络(NN)模型等,最后用分类器,如K最邻近结点算法(KNN)和支持向量机(SVM)等进行分类。这些方法一般只针对白噪声,且复杂度比较高。事实上,广播音频噪声涉及的种类很广,除了白噪声外,还有受环境因素影响而出现的各类噪声,如粉红噪声、高频信道噪声等;噪声也不一定单独存在,它可能与信号混合在一起且将信号覆盖,导致音频内容模糊不清,无法正常收听。另外,广播监测应用还有实时性的要求。基于这些考虑,至今文献中尚未见适合于广播电台应用的音频噪声实时检测方法的报道。
技术实现思路
本专利技术的目的在于针对
技术介绍
存在的问题,提供一种对音频流的噪声检测方法,本专利技术的技术方案是:一种基于相关分析的音频噪声实时检测方法,包括如下步骤:S1.接收音频帧:S11.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;S12.计算当前音频帧的帧能量,即计算帧内各音频样本值的平方和。若帧能量小于设定的静音门限,则将该帧各样本值设置为0;否则将各样本值减去样本均值,并对减去均值后的数据作归一化处理;S13.将处理后的帧数据保存在数据矩阵A中,设A=[a1,a2,a3,…],其中A的每一列ai表示第i帧的数据;S2.若帧计数器的当前计数值小于Nf(Nf为1秒内音频帧总帧数),则转到步骤S1,接收处理下一音频帧;否则转到步骤S3,同时将帧计数器置零;S3.削弱信号成分:S31.对A进行奇异值分解如下:A=UΣVT(1)其中U和V分别为左、右奇异向量矩阵,Σ=diag(λ1,λ2,λ3,…,λn)为对角矩阵,其对角元素λi为的A奇异值,设奇异值从上到下按大小降序排列,即λ1≥λ2≥λ3≥…≥λn;S32.对矩阵Σ,扫描其从λn到λ2的n-1个对角元素,计算每个对角元素与其前一个元素的递减量,若递减量大于1,则提前结束扫描;S33.扫描结束后,将Σ的对角元素中没有被扫描到的所有元素设置为0;S34.将Σ带入公式(1)对A进行更新;S4.相关性分析:S41.对A中的每个列向量作归一化处理;S42.从A的第1列到第Nf-1列,计算每一列与其后一列矢量的内积pi(i=1,2,3,…Nf-1);S43.计算pi的绝对值扫描每个若则设置为的最大值;将最终的作为音频帧的相关量保存下来为后续的噪声判定使用;S5.噪声判定:设进行判定的音频帧数目为M,M≥Nf,计算当前音频帧及其前M-1帧所对应的相关量的均值和方差;若相关量的均值小于设定的阈值Tmean(0.12≤Tmean≤0.15)且方差小于Tmean的平方,则判定当前信号为噪声,否则为非噪声;本专利技术的有益效果:本专利技术提供一种音频噪声实时检测方法,适用于检测音频中各种类型的噪声,如白噪声、粉红噪声、高频信道噪声等,当信号和噪声同时存在时,也能够检测出信号被噪声所覆盖而导致音频内容模糊不清,无法正常收听的情况;同时,该检测方法算法简单、处理快速,能够广泛应用于音频信号的实时监测,如广播、电视信号监测。附图说明图1为本专利技术方法的流程示意图。图2为本专利技术实施例测试音频时域波形图。图3为本专利技术实施例中第11~12秒内音频帧相关量分布图。图4为本专利技术实施例中各次噪声判定的音频帧相关量均值和方差分布图。具体实施方式本实施例以一段实际广播的“天气预报”音频作为输入。该音频段的采样率为48KHz,时间长度为20秒,该段音频包含正常音频和3种不同的噪声,其中前5秒为无广播信号时的白噪声,从第6秒开始为人声加背景音乐的正常音频,持续5秒后,在第11秒受到环境干扰,音频中产生很强的干扰噪声,使得人声内容变得模糊不清,无法正常收听。干扰噪声一直持续到音频段结束,并在第17秒时发生了变化。整个测试音频的时域波形图如图2所示。将音频数据按512个采样点的长度等分为各音频帧,其总帧数为1875帧,下面以第1125帧为例进行说明,在第1124帧处理结束时,帧计数器的计数值为93;对该音频帧进行噪声检测的具体步骤如下:S1.接收音频帧:S11.接收第1125帧音频,将其每个样本值转化为0~1间的浮点数(即除以32768)后排列成一列矢量y=(0.1552,0.2177,-0.1027,…,-0.1453)T;帧计数器加1,即计数值由93增至94;S12.计算y各元素的平方和,得到当前音频帧的能量为16.1403。由于帧能量大于设定的静音门限0.25,将各样本值减去样本均值0.0083,并对减去均值后的数据作归一化处理,得到a94=(0.0366,0.0522,-0.0277,…,-0.0383)T;S13.将a94加入到数据矩阵A中;S2.判断累计帧数:由于帧计数器的当前计数值94等于1秒时间内的总帧数,则转到步骤S3,同时将帧计数器置零;S3.削弱信号成分:S31.对A进行奇异值分解如下:A=UΣVT(1)其中U和V分别为左、右奇异向量矩阵,Σ=diag(1.7917,1.6269,1.5953,…,0.4298)为对角矩阵,其对角元素为的A奇异值;S32.对矩阵Σ,扫描其从最后一个元素0.4298到第二个元素1.6269的93个对角元素,计算每个对角元素相对于其前一个元素的递减量,由于递减量都不大于1,则扫描到第二个元素结束;S33.将Σ的对角元素中没有被扫描到的第一个元素设置为0;S34.将改变后的Σ带入公式(1)对A进行更新。S4.相关性分析:S41.对A中的每个列向量作归一化处理;S42.从A的第1列到第93列,计算每一列与其后一列矢量的内积,得到内积p=(0.0552,0.0574,-0.0497,…,0.0076);S43.计算p的绝对值pa=(0.0552,0.0574,0.0497,…,0.0076),由于pa元素都不为0,则直接将其作为音频帧的相关量保存下来为后续的噪本文档来自技高网
...
一种基于相关分析的音频噪声实时检测方法

【技术保护点】
一种基于相关分析的音频噪声实时检测方法,包括以下步骤:S1.接收音频帧:S11.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;S12.计算当前音频帧的帧能量,若帧能量小于设定的静音门限,则将该帧各样本值设置为0;否则将各样本值减去样本均值,并对减去均值后的数据作归一化处理;S13.将处理后的帧数据保存在数据矩阵A中,设A=[a1,a2,a3,…],其中A的每一列ai表示第i帧的数据;S2.若帧计数器的当前计数值小于Nf,Nf为1秒内音频帧总帧数,则转到步骤S1,接收处理下一音频帧;否则转到步骤S3,同时将帧计数器置零;S3.削弱信号成分:S31.对A进行奇异值分解如下:A=UΣVT   (1)其中U和V分别为左、右奇异向量矩阵,Σ=diag(λ1,λ2,λ3,…,λn)为对角矩阵,其对角元素λi为的A奇异值,设奇异值从上到下按大小降序排列,即λ1≥λ2≥λ3≥…≥λn;S32.对矩阵Σ,扫描其从λn到λ2的n‑1个对角元素,计算每个对角元素与其前一个元素的递减量,若递减量大于1,则提前结束扫描;S33.扫描结束后,将Σ的对角元素中没有被扫描到的所有元素设置为0;S34.将Σ带入公式(1)对A进行更新;S4.相关性分析:S41.对A中的每个列向量作归一化处理;S42.从A的第1列到第Nf‑1列,计算每一列与其后一列矢量的内积pi(i=1,2,3,…Nf‑1);S43.计算pi的绝对值扫描每个若则设置为的最大值;将最终的作为音频帧的相关量保存下来为后续的噪声判定使用;S5.噪声判定:设进行判定的音频帧数目为M,M≥Nf,计算当前音频帧及其前M‑1帧所对应的相关量的均值和方差;若相关量的均值小于设定的阈值Tmean且方差小于Tmean的平方,则判定当前信号为噪声,否则为非噪声。...

【技术特征摘要】
1.一种基于相关分析的音频噪声实时检测方法,包括以下步骤:S1.接收音频帧:S11.接收一帧音频帧,将其样本数据排列成一列矢量;设定初始值为0的帧计数器,每接收一音频帧,帧计数器加1;S12.计算当前音频帧的帧能量,若帧能量小于设定的静音门限,则将该帧各样本值设置为0;否则将各样本值减去样本均值,并对减去均值后的数据作归一化处理;S13.将处理后的帧数据保存在数据矩阵A中,设A=[a1,a2,a3,…],其中A的每一列ai表示第i帧的数据;S2.若帧计数器的当前计数值小于Nf,Nf为1秒内音频帧总帧数,则转到步骤S1,接收处理下一音频帧;否则转到步骤S3,同时将帧计数器置零;S3.削弱信号成分:S31.对A进行奇异值分解如下:A=UΣVT(1)其中U和V分别为左、右奇异向量矩阵,Σ=diag(λ1,λ2,λ3,…,λn)为对角矩阵,其对角元素λi为的A奇异值,设奇异值从上到下按大小降序排列,即λ1≥λ2≥λ3≥…≥λn;S32.对矩阵Σ,...

【专利技术属性】
技术研发人员:甘涛何艳敏黄晓革兰刚周南
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1