基于仿生小波变换的语音增强方法技术

技术编号:27747256 阅读:12 留言:0更新日期:2021-03-19 13:42
本发明专利技术的一种基于仿生小波变换的语音增强方法,采用构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪等步骤,能够有效的降低噪声对语音信号的干扰,提高语音信号的信噪比,具有科学合理、结构简单、去噪效果好、适用范围广等优点。

【技术实现步骤摘要】
基于仿生小波变换的语音增强方法
本专利技术属于语音信号处理
,涉及一种基于仿生小波变换的语音增强方法。
技术介绍
语音增强算法基本划分为四类方法,即参数方法、非参数方法、统计方法和其他方法。参数方法多利用语音生成模型的方式进行去噪,例如AR模型,提取模型其中的参数如基音周期、系数等,且往往会采用迭代方法。假如实际噪音或语音条件与模型存在的差距较大或模型参数的提取相对困难,那么这种方法很可能没有效果。非参数方法则不用从带噪语音信号中提取模型参数,因而约束条件比较少,所以非参数方法的使用范围较大,也因为限制比较少,可利用统计信息几乎没有,去噪效果通常不是最优化的。统计方法是基于语音和噪音统计特性的方法,通常需构建模型库,并需在训练过程中获得初始统计参数,同时它与语音识别系统紧密关联。其它方法,如小波滤波去噪法。使用传统的语音增强算法对环境噪声进行去噪处理时,谱减法适用的信噪比范围相对较小,同时信噪比较低时对语音的可懂度损伤较大,且频谱相减会产生“音乐噪声”;维纳滤波法,对带噪语音增强后信噪比提高通常不明显;谐波增强方法,仅适用于平稳白噪声的去除,当噪声强度较大时,基音周期无法准确估计;MMSE估计方法去噪,该方法的计算量相对较大,且语音频谱先验分布的求取在一定程度上由统计结果的代表性和重现性来决定。小波变换其自身拥有多分辨率分析、多尺度分析、低SNR下仍有效去除噪声、对非平稳信号处理效果相对较好等优点,成为语音增强算法研究热点之一。目前,随着对小波变换语音增强算法的不断研究,小波变换仍还存在着某些缺陷:一是不能较好地反应人耳对信号幅度和频率的听觉特性;二是当语音信号与噪声信号于频谱上相互重叠时,噪声信号不一定会被全部分离出,且语音信号有时也会误被分离出;三是软阈值法过度光滑易让信号失真和硬阈值法去噪效果欠佳。传统小波变换阈值去噪法,小波变换不能很好地反应人耳对信号幅度和频率的听觉特性;其次,软硬阈值算法中存在固定值偏移、函数不连续、无固定偏差、阈值处收缩效果不明显等特点,以及噪声阈值估计问题,假如阈值估计的较小,去噪算法很大程度上会失效,增强的语音信号中噪声大多会保留;阈值估计的较大,那么语音信号会被错当作噪声处理掉,重构信号时将出现的失真现象等缺点。而且当噪声与语音信号在频谱上相互重叠时,小波变换后噪声信号不一定会被全部分离出,语音信号也不一定会被全部保留。
技术实现思路
本专利技术的目的是,为了降低噪声对语音信号的干扰,提高语音信号的信噪比,提出一种基于仿生小波变换的语音增强方法,实现语音信号的增强。本专利技术的目的是由以下技术方案来实现的:一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,1)所述构建仿生小波变换阈值函数为解决阈值函数,包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度,为此,采用硬阈值函数及软硬阈值折衷函数构造了一种新阈值函数,表达式为:式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷;①新阈值函数具有连续性当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷;②新阈值函数的渐进线为当|wj,k|≥λ时,新阈值函数当|wj,k|≥λ时,则由式(4)和(5)可知,而的阈值函数的数学表达形式为奇函数,所以,仍等于1,因此新阈值函数是以为渐近线的,即随着wj,k的增大,是无限趋近于|wj,k|,因而弥补了估计小波系数与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷;2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果,在人工蜂群算法过程中,种群大小为SN,最大迭代次数为MaxCycle,控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,SN),在搜寻过程中,首先进行初始化种群:式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i,适应度值的表达式为:其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比SNR:式中,N表示语音信号长度;y(t)和分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:式中,fitnessi表示第i个解对应的适应度值,当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源,xi,j=xminj+rand(0,1)(xmaxj-xminj)(10)式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程;人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:人工蜂群算法实现步骤为:(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数(MaxCycle)以及控制参数limit:(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(MaxCycle),并且标本文档来自技高网
...

【技术保护点】
1.一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,/n1)所述构建仿生小波变换阈值函数/n为解决阈值函数,包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数

【技术特征摘要】
1.一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,
1)所述构建仿生小波变换阈值函数
为解决阈值函数,包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度,为此,采用硬阈值函数及软硬阈值折衷函数构造一种新阈值函数,表达式为:



式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷;
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时



当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时



因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷;
②新阈值函数的渐进线为
当|wj,k|≥λ时,新阈值函数



当|wj,k|≥λ时,则



由式(4)和(5)可知,而的阈值函数的数学表达形式为奇函数,所以,仍等于1,因此新阈值函数是以为渐近线的,即随着wj,k的增大,是无限趋近于|wj,k|,因而弥补了估计小波系数与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷;
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果,
在人工蜂群算法过程中,种群大小为SN,最大迭代次数(MaxCycle),控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,SN),在搜寻过程中,首先进行初始化种群:



式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i,
适应度值的表达式为:



其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比SNR:



式中,N表示语音信号长度;y(t)和分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:



式中,fitnessi表示第i个解对应的适应度值,
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时...

【专利技术属性】
技术研发人员:张世强王鸿飞李俐欣张婷娟黄雷
申请(专利权)人:国网黑龙江省电力有限公司伊春供电公司国家电网有限公司东北电力大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1