当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于BP网络的噪声分类方法技术

技术编号:23402030 阅读:58 留言:0更新日期:2020-02-22 14:05
一种基于BP网络的噪声分类方法:对输入的噪声信号进行预处理;对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;利用每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数及梅尔频率倒谱系数的一阶差分;计算每一帧噪声信号的伽玛通频率倒谱系数;将每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数组合作为该帧噪声信号的联合特征,将全部帧噪声信号的联合特征中的一部分作为训练数据,另一部分作为测试数据;分别训练一级BP网络和二级BP网络;将一级BP网络和二级BP网络联合进行测试,得到最终的噪声信号分类结果。本发明专利技术有着更高的噪声分类准确率。

A noise classification method based on BP network

【技术实现步骤摘要】
一种基于BP网络的噪声分类方法
本专利技术涉及一种噪声分类方法。特别是涉及一种基于BP网络的噪声分类方法。
技术介绍
在语音信号的处理过程中,噪声污染的问题不可避免。随着数字语音信号在科研和生活中的广泛应用,噪声对数字语音信号的影响愈专利技术显,如何有效地抑制噪声,提高语音信号的质量和可懂度成为众多学者研究的热点。而在语音增强技术中,一大研究难点则是噪声的来源众多。不同噪声的统计特性不尽相同,因此在实际应用中,为了达到更好的信号处理效果,需根据应用场合,对不同噪声特性的噪声进行区别处理。一般来说,解决噪声分类问题的关键技术点主要有两个,一是要提取何种特征用于噪声类型的区分;二是对提取的特征运用何种分类技术。对于第一个关键技术点,目前常用的噪声特征有自适应子波特征、短时自相关函数(ShortAuto-correlationFunction,SACF)、bark域能量分布、梅尔倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)、一阶差分梅尔倒谱系数(first-orderMFCC,ΔMFCC)、离散傅里叶系数、线性预测编码系数以及伽马通滤波器系数等。对于噪声分类方法,目前常用的技术包括基于隐马尔科夫模型(HiddenMarkovModel,HMM)的噪声分类算法、基于混合高斯模型(GaussianMixtureModel,GMM)的噪声分类算法、基于支持向量机(SupportVectorMachine,SVM)的噪声分类算法以及基于神经网络的噪声分类算法等。然而目前所提出噪声分类方法存在分类准确低的情况。由于噪声分类的准确性能会直接影响信号处理的性能,那么提出一种高准确的噪声分类方法则成为了信号处理领域的一个新挑战。
技术实现思路
本专利技术所要解决的技术问题是,提供一种具有更高分类准确率的基于BP网络的噪声分类方法。本专利技术所采用的技术方案是:一种基于BP网络的噪声分类方法,包括如下步骤:1)对输入的噪声信号进行预处理,包括分帧以及加窗处理;2)对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;3)利用所述的每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数及梅尔频率倒谱系数的一阶差分;4)计算每一帧噪声信号的伽玛通频率倒谱系数;5)将每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数组合作为该帧噪声信号的联合特征,将全部帧噪声信号的联合特征中的一部分作为训练数据,另一部分作为测试数据;6)训练一级BP网络;7)训练二级BP网络;8)将一级BP网络和二级BP网络联合进行测试,得到最终的噪声信号分类结果。步骤2)是采用如下公式对每一帧噪声信号进行傅里叶变换:X(i,k)=FFT[xi(n)]其中,X(i,k)是第i帧信号在第k条谱线处的功率谱,FFT表示傅里叶变换,xi(n)表示第i帧信号,n表示序列索引号。步骤3)包括:(3.1)对每一帧噪声信号的功率谱计算谱线能量:E(i,k)=[X(i,k)]2其中,E(i,k)表示第i帧数据在第k条谱线的谱线能量;X(i,k)是第i帧信号在第k条谱线处的功率谱;(3.2)计算每一帧噪声信号通过梅尔滤波器的能量其中,S(i,m)表示第i帧信号通过第m个梅尔滤波器的能量,M是梅尔滤波器的总数,Hm(k)表示第m个梅尔滤波器在第k条谱线处的频域响应,N是谱线的总数;(3.3)计算梅尔频率倒谱系数:其中,mfcc(i,n)为第i帧噪声信号在第k条谱线处的梅尔频率倒谱系数;(3.4)计算梅尔频率倒谱系数的一阶差分:Δmfcc(i,k)=2mfcc(i-2,k)-mfcc(i-1,k)+mfcc(i+1,k)+2mfcc(i+2,k)其中,Δmfcc(i,k)表示第i帧信号在第k条谱线处的梅尔频率倒谱系数的一阶差分,mfcc(i-2,k)、mfcc(i-1,k)、mfcc(i+1,k)和mfcc(i+2,k)分别表示第i-2帧信号、i-1帧信号、i+1帧信号和i+2帧信号在第k条谱线处的梅尔频率倒谱系数。步骤4)包括:(4.1)通过所得到的谱线能量,计算通过伽玛通滤波器的能量:其中,R(i,p)表示第i帧噪声信号通过第p个伽玛通滤波器的能量,P是伽玛通滤波器的总数,Hp(k)表示第p个伽玛通滤波器在第k条谱线的频域响应,N是谱线的总数,e(f)表示指数压缩值;(4.2)计算伽玛通频率倒谱系数:其中,gfcc(i,k)表示第i帧信号在第k条谱线处的伽玛通频率倒谱系数。步骤6)所述的训练一级BP网络,是将所述的训练数据输入到一级BP网络中进行网络训练,经一级BP网络训练后得到每一帧噪声信号所属的大类类别,并保存已训练好的一级BP网络的网络权重。步骤7)所述的训练二级BP网络,是将经一级BP网络训练得到的每一大类中的每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数进行组合输入到相应类别的二级BP网络中进行网络训练,经二级BP网络训练后得到每一大类中的每一帧噪声信号的识别结果,并保存已训练好的二级BP网络的网络权重。步骤8)是根据保存的一级BP网络的网络权重和二级BP网络的网络权重,将所述的测试数据输入到由一级BP网络和二级BP网络相串联构成的联合网络中进行测试,得到对测试数据中每一帧噪声信号的识别结果。本专利技术的一种基于BP网络的噪声分类方法,采用两级BP网络的形式对对噪声信号的噪声类别进行识别,采用该种网络结构的噪声分类方法相比于只采用单级BP网络的噪声分类方法来说有着更高的噪声分类准确率。同时,本专利技术提出的方案适用性广,可实验性较强,对于噪声分类有一定的借鉴意义。附图说明图1是本专利技术一种基于BP网络的噪声分类方法的流程图。具体实施方式下面结合实施例和附图对本专利技术的一种基于BP网络的噪声分类方法做出详细说明。如图1所示,本专利技术的一种基于BP网络的噪声分类方法,包括如下步骤:1)对输入的噪声信号进行预处理,包括分帧以及加窗处理;2)对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;具体是采用如下公式对每一帧噪声信号进行傅里叶变换:X(i,k)=FFT[xi(n)]其中,X(i,k)是第i帧信号在第k条谱线处的功率谱,FFT表示傅里叶变换,xi(n)表示第i帧信号,n表示序列索引号。3)利用所述的每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数(MFCC)及梅尔频率倒谱系数的一阶差分(ΔMFCC);具体包括:(3.1)对每一帧噪声信号的功率谱计算谱线能量:E(i,k)=[X(i,k)]2其中,E(i,k)表示第i帧数据在第k条谱线的谱线能量;X(i,k)是第i帧信号在本文档来自技高网
...

【技术保护点】
1.一种基于BP网络的噪声分类方法,其特征在于,包括如下步骤:/n1)对输入的噪声信号进行预处理,包括分帧以及加窗处理;/n2)对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;/n3)利用所述的每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数及梅尔频率倒谱系数的一阶差分;/n4)计算每一帧噪声信号的伽玛通频率倒谱系数;/n5)将每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数组合作为该帧噪声信号的联合特征,将全部帧噪声信号的联合特征中的一部分作为训练数据,另一部分作为测试数据;/n6)训练一级BP网络;/n7)训练二级BP网络;/n8)将一级BP网络和二级BP网络联合进行测试,得到最终的噪声信号分类结果。/n

【技术特征摘要】
1.一种基于BP网络的噪声分类方法,其特征在于,包括如下步骤:
1)对输入的噪声信号进行预处理,包括分帧以及加窗处理;
2)对预处理后的每一帧噪声信号分别进行傅里叶变换得到噪声信号功率谱;
3)利用所述的每一帧噪声信号功率谱分别计算每一帧噪声信号的梅尔频率倒谱系数及梅尔频率倒谱系数的一阶差分;
4)计算每一帧噪声信号的伽玛通频率倒谱系数;
5)将每一帧噪声信号的梅尔频率倒谱系数、梅尔频率倒谱系数的一阶差分和伽玛通频率倒谱系数组合作为该帧噪声信号的联合特征,将全部帧噪声信号的联合特征中的一部分作为训练数据,另一部分作为测试数据;
6)训练一级BP网络;
7)训练二级BP网络;
8)将一级BP网络和二级BP网络联合进行测试,得到最终的噪声信号分类结果。


2.根据权利要求1所述的一种基于BP网络的噪声分类方法,其特征在于,步骤2)是采用如下公式对每一帧噪声信号进行傅里叶变换:
X(i,k)=FFT[xi(n)]
其中,X(i,k)是第i帧信号在第k条谱线处的功率谱,FFT表示傅里叶变换,xi(n)表示第i帧信号,n表示序列索引号。


3.根据权利要求1所述的一种基于BP网络的噪声分类方法,其特征在于,步骤3)包括:
(3.1)对每一帧噪声信号的功率谱计算谱线能量:
E(i,k)=[X(i,k)]2
其中,E(i,k)表示第i帧数据在第k条谱线的谱线能量;X(i,k)是第i帧信号在第k条谱线处的功率谱;
(3.2)计算每一帧噪声信号通过梅尔滤波器的能量



其中,S(i,m)表示第i帧信号通过第m个梅尔滤波器的能量,M是梅尔滤波器的总数,Hm(k)表示第m个梅尔滤波器在第k条谱线处的频域响应,N是谱线的总数;
(3.3)计算梅尔频率倒谱系数:



其中,mfcc(i,n)为第i帧噪声信号在第k条谱线处的梅尔频率倒谱系数;
(3.4)计算梅尔频率倒谱系数的一阶差分:
△mfcc(i,k)=2mfcc(i-2,k)-mfcc(...

【专利技术属性】
技术研发人员:张涛耿彦章邵洋洋
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1