一种音频去噪方法和系统技术方案

技术编号:9976363 阅读:158 留言:0更新日期:2014-04-28 13:24
本发明专利技术公开一种音频去噪方法和系统。所述方法将音频有效数据检测与音频去噪相结合。一方面,通过Mel频率参数音频有效数据检测法,获取噪声谱估计的初始值、估计信噪比、并去除非音频有效数据段的噪声;另一方面,通过估计的信噪比及噪声瞬间变化趋势,确定当前瞬间谱减方程,去除音频有效数据段的噪声,从而达到在提升去噪后的性信噪比及减少“音乐噪声”方面的优化实现。

【技术实现步骤摘要】
一种音频去噪方法和系统
本专利技术涉及音频编解码领域,尤其涉及一种音频去噪方法和系统。
技术介绍
作为音频编解码的原始音频信息,其在许多场合下采集中都会不可避免地混入噪声,这常常使解码端的音频质量受到严重损伤。所以,通常需要音频去噪方法来提升音频听觉质量。目前,常用的音频音频去噪方法有谱减法、维纳滤波法、听觉掩蔽法等。其中,维纳滤波法、听觉掩蔽法等算法计算量较大,制约了其在音频编解码音频去噪环节的应用。而谱减法计算量小,便于快速处理,去噪后的性信噪也比较高,所以被广泛采用。但谱减法会产生“音乐噪声”的问题。
技术实现思路
本专利技术实施例的目的在于提出一种音频去噪方法,旨在解决现有技术音频音频去噪方法中的谱减法会产生“音乐噪声”的问题。本专利技术实施例是这样实现的,一种音频去噪方法,其特征在于,所述方法包括以下步骤,计算音频数据中所有帧的Mel频域参数;计算所有频域帧的幅值及相角;设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧;进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧;计算信噪比参数;进行音频去噪处理获取所述去噪帧幅值的修正值;利用所述幅值的修正值及所述相角进行快速傅里叶反变换。进一步地,步骤“计算音频数据中所有帧的Mel频域参数”之前还包括步骤:对音频数据进行预处理;步骤“利用所述幅值的修正值及所述相角进行快速傅里叶反变换”之后还包括步骤:对所述音频数据进行逆预处理。本专利技术实施例的另一目的在于提出一种音频去噪系统,,所述系统包括Mel频域参数计算模块、幅值及相角计算模块、第一设置模块、音频有效数据检测装置、信噪比参数计算模块、音频去噪处理模块、快速傅里叶反变换模块,Mel频域参数计算模块,用于计算所有帧的Mel频域参数;幅值及相角计算模块,用于计算所有频域帧的幅值及相角;第一设置模块,用于设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧;音频有效数据检测装置,用于进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧;信噪比参数计算模块,用于计算信噪比参数;音频去噪处理模块,用于进行音频去噪处理获取所述去噪帧幅值的修正值;快速傅里叶反变换模块,用于利用幅值的修正值及相角进行快速傅里叶反变换。进一步地,所述系统还包括音频数据预处理模块、逆预处理模块,音频数据预处理模块,用于对音频数据进行预处理;逆预处理模块,用于对音频数据进行逆预处理。本专利技术的有益效果本专利技术提出一种音频去噪方法和系统。所述方法将音频有效数据检测与音频去噪相结合。一方面,通过Mel频率参数音频有效数据检测法,获取噪声谱估计的初始值、估计信噪比、并去除非音频有效数据段的噪声;另一方面,通过估计的信噪比及噪声瞬间变化趋势,确定当前瞬间谱减方程,去除音频有效数据段的噪声,从而达到在提升去噪后的性信噪比及减少“音乐噪声”方面的优化实现。附图说明图1是本专利技术优选实施例的一种音频去噪方法流程图;图2是图1中步骤S14所包含的方法流程图;图3是图2中步骤S144所包含的方法流程图;图4是图3中步骤S1442所包含的方法流程图;图5是图1中步骤S16所包含的方法流程图;图6是本专利技术优选实施例的一种音频去噪系统结构图;图7是图6中Mel频域参数计算模块的结构图;图8是图6中音频有效数据检测装置的结构图;图9是图8中音频有效数据段检测模块的结构图;图10是图9中连续帧数统计模块的结构图;图11是图6中音频去噪处理模块的结构图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本专利技术进行进一步详细说明,为了便于说明,仅示出了与本专利技术实施例相关的部分。应当理解,此处所描写的具体实施例,仅仅用于解释本专利技术,并不用以限制本专利技术。本专利技术实施例提出一种音频去噪方法和系统。所述方法将音频有效数据检测与音频去噪相结合。一方面,通过Mel频率参数音频有效数据检测法,获取噪声谱估计的初始值、估计信噪比、并去除非音频有效数据段的噪声;另一方面,通过估计的信噪比及噪声瞬间变化趋势,确定当前瞬间谱减方程,去除音频有效数据段的噪声,从而达到在提升去噪后的性信噪比及减少“音乐噪声”方面的优化实现。实施例1图1是本专利技术优选实施例的一种音频去噪方法流程图;所述方法包括以下步骤:S10:对音频数据进行预处理;即依次进行常规的预加重滤波、分帧、加窗处理,其中,预加重滤波器及窗口函数可选业内通用的任何一种方法。S11:计算音频数据中所有帧的Mel频域参数。第t帧音频xt(n)的Mel频域参数MFCCt的计算方法包括以下步骤:S111:进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k);其中,1≤n≤N,N为帧长;1≤k≤N。其中,xt(n)表示第t帧音频的第n个分量;Xt(k)表示第t帧音频对应频域帧的第k个分量;快速傅里叶变换的方法为本领域的公知常识,在此不再赘述。S112:将频域帧Xt(k)用一组三角滤波器进行滤波。其中,该组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下:其中,Hm(k)为第m个三角滤波器的频率响应;fm为第m个滤波器的中心频率;Mel(fm)为fm对应的Mel频率,Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数。S113:求出每个滤波器的输出对数能量;其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量。S114:获取Mel频域参数S12:计算所有频域帧的幅值及相角。幅值及相角的计算方法为本领域的公知常识,在此不再赘述。S13:设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧。所有的数据即音频数据;声音信息中一般存在长时间静音段,而人在讲话的时候,也会出现字、词、句之间的停顿。不包含话音间隔及静音数据的为音频有效数据。其中,T≥10。S14:进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧。所述“进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧”具体包括以下步骤(图2是图1中步骤S14所包含的方法流程图):S141:计算第一判定阈值。S142:判断下一帧是否存在,若不存在,则结束;否则进入步骤S143;S143:将下一帧设置为当前音频有效数据待判定帧。S144:利用Mel频域参数法进行当前音频有效数据段检测。所述“利用Mel频域参数法进行当前音频有效数据段检测”具体包括以下步骤(图3是图2中步骤S144所包含的方法流程图):S1441:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,若是则进入步骤S1442,否则,进入步骤S1445。S1442:设置临时音频有效数据的起始帧为当前音频有效数据待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数;其中,所述“统计待判定帧的频域参数大于第一判定阈值的连续帧数”具体包本文档来自技高网...
一种音频去噪方法和系统

【技术保护点】

【技术特征摘要】
1.一种音频去噪方法,其特征在于,所述方法包括以下步骤,计算音频数据中所有帧的Mel频域参数;计算所有频域帧的幅值及相角;设置当前音频有效数据待判定帧为第T帧,设置当前去噪帧为第一帧;进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧;计算信噪比参数;进行音频去噪处理获取所述去噪帧幅值的修正值;利用所述幅值的修正值及所述相角进行快速傅里叶反变换;所述“进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧”具体包括以下步骤:S141:计算第一判定阈值;S142:判断下一帧是否存在,若不存在,则结束;否则进入步骤S143;S143:将下一帧设置为当前音频有效数据待判定帧;S144:利用Mel频域参数法进行当前音频有效数据段检测;所述“S144:利用Mel频域参数法进行当前音频有效数据段检测”具体包括以下步骤:S1441:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,若是则进入步骤S1442,否则,进入步骤S1445,S1442:设置临时音频有效数据的起始帧为当前音频有效数据待判定帧,然后统计待判定帧的频域参数大于第一判定阈值的连续帧数;S1443:判断是否所述连续帧数大于第二判定阈值,若是则进入步骤S1444,否则,进入步骤S1445,S1444:确认当前音频有效数据的起始帧即为临时音频有效数据的起始帧的前一帧,当前音频有效数据的结束帧即为临时音频有效数据的结束帧,然后进入步骤“计算信噪比参数”;S1445:判定下一帧是否存在,若存在,则令下一帧为当前音频有效数据待判定帧,然后重新进入步骤S1441;否则进入步骤S1446;S1446:确认临时音频有效数据的起始帧到当前音频有效数据待判定帧均为非音频有效数据,然后进入步骤“进行音频去噪处理获取所述去噪帧幅值的修正值”。2.如权利要求1所述的音频去噪方法,其特征在于,步骤“计算音频数据中所有帧的Mel频域参数”之前还包括步骤:对音频数据进行预处理;步骤“利用所述幅值的修正值及所述相角进行快速傅里叶反变换”之后还包括步骤:对所述音频数据进行逆预处理。3.如权利要求2所述的音频去噪方法,其特征在于,所述“对音频数据进行预处理”为依次进行常规的预加重滤波、分帧、加窗处理;所述“对所述音频数据进行逆预处理”为依次进行去窗操作、合并帧、去加重操作。4.如权利要求1所述的音频去噪方法,其特征在于,所述“计算音频数据中所有帧的Mel频域参数”包括以下步骤,进行快速傅里叶变换,获取第t帧音频xt(n)经过傅里叶变换后的频域帧Xt(k);将频域帧Xt(k)用一组三角滤波器进行滤波;求出每个滤波器的输出对数能量;获取Mel频域参数MFCCt;其中,1≤n≤N,N为帧长,1≤k≤N;xt(n)表示第t帧音频的第n个分量;Xt(k)表示第t帧音频对应频域帧的第k个分量。5.如权利要求4所述的音频去噪方法,其特征在于,所述一组三角滤波器组滤波器由M个中心频率在Mel频率上均匀分布的滤波器组成,其定义如下:其中,Hm(k)为第m个三角滤波器的频率响应;fm为第m个滤波器的中心频率;Mel(fm)为fm对应的Mel频率;Mel(fm)=1125ln(1+fm/700),1≤m≤M,M为滤波器个数;所述”求出每个滤波器的输出对数能量”具体为:其中,Yt(m)表示Xt(k)经过第m个滤波器的输出对数能量;所述Mel频域参数6.如权利要求1所述的音频去噪方法,其特征在于,步骤S1442中,所述“统计待判定帧的频域参数大于第一判定阈值的连续帧数”具体包括以下步骤:S14421:令连续帧数等于1;S14422:判定下一帧是否存在,若是则进入S14423;如果不存在,则进入步骤S1443;S14423:将下一帧设为当前音频有效数据待判定帧;S14424:判断是否当前音频有效数据待判定帧的频域参数大于第一判定阈值,如果是则连续帧数加1,然后重新进入S14422;否则进入步骤S14425;S14425:设置临时音频有效数据的结束帧为当前音频有效数据待判定帧,进入步骤S1443。7.如权利要求1所述的音频去噪方法,其特征在于,所述“计算信噪比参数”具体为:snrp=const1-log(ex/en),其中,ex=sum((xt(n)-en)2|xt(n)已进行过判断且为有效音频并且1≤n≤N),snrp为信噪比参数,ex、en为中间变量;其中sum(变量|条件)表示对满足条件的变量求和;const1为第一常量,const1≥4,log为以10为底的对数计算。8.如权利要求1所述的音频去噪方法,其特征在于,所述“进行音频去噪处理获取所述去噪帧幅值的修正值”具体包括以下步骤:S161:如果当前去噪帧为非音频有效数据,则进入S162;否则进入S163,S162:令当前去噪帧一直到当前音频有效数据的起始帧的前一帧中每一帧的音频数据幅值的修正值Ztm为0,然后,设置当前去噪帧为当前音频有效数据的起始帧,再进入S163,S163:计算当前去噪帧幅值的修正值,S164:判断是否当前去噪帧为当前音频有效数据的结束帧,若是则进入步骤S165;否则设置当前去噪帧的下一帧为当前去噪帧,然后进入步骤S163,S165:设置当前音频有效数据待判定帧为当前音频有效数据的结束帧,然后进入步骤“进行Mel频率参数音频有效数据检测,获取音频有效数据的起始帧和结束帧”。9.如权利要求8所述的音频去噪方法,其特征在于,所述“计算当前去噪帧幅值的修正值”具体为:其中,nop1、nop2、nop3分别为第一噪声参数、第二噪声参数、第三噪声参数;Zt为当前去噪帧的幅值;Ztm为当前去噪帧的幅值的修正值;为当前去噪帧的前i帧的噪声参数;nop2=k1+k2*(noiset-2+noiset-3)/noiset-1;nop3=k1*noiset-1+k2*(noiset-2+noiset-3);const2为第二常量,const2<0.08;k1、k2为调节因子,0<k2<k1<1;条件1:集合1与集合2的方差小于等于第三判定阈值并且为第一段音频去噪处理;条件2:集合1与集合2的方差大于第三判定阈值并且为第一段音频去噪处理;其中,集合1为前T帧音频中,相邻两帧的相关系数;集合2为T+1、T+2、...、当前音频有效数据起始帧的前一帧音频中,相邻两帧的相关系数。10.一种音频去噪系统,其特征在于,所述系统包括Mel频域参数计算模块、幅值及相角计算模...

【专利技术属性】
技术研发人员:洪婷
申请(专利权)人:深圳百科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1