【技术实现步骤摘要】
语音降噪算法
:本专利技术涉及一种算法,特别是涉及一种语音降噪算法。
技术介绍
:无论身处何处,我们都被噪声所包围,噪声可以是平稳的,即不随时间而改变,如电脑风扇噪声;噪声也可以是非平稳的,比如餐馆里面的北京噪声,很多人说话的同时还夹杂着厨房里传出来的声音,这种餐馆噪声的频域以及时域特征随着周围餐桌上人们的对话以及服务员与顾客交流内容的改变而改变。
技术实现思路
:本专利技术所要解决的技术问题是:克服现有技术的不足,提供一种能够提高噪声估计的准确度的语音降噪算法。本专利技术为解决技术问题所采取的技术方案是:一种语音降噪算法,包括以下步骤:(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱 ...
【技术保护点】
1.一种语音降噪算法,包括以下步骤:(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
【技术特征摘要】
1.一种语音降噪算法,包括以下步骤:(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:其中Yi2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;(5)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;(6)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:其中ξi(k)为当前帧数据频率分量k...
【专利技术属性】
技术研发人员:禹深义,娄进凯,张勤磊,胥杨,李万顺,高峻峰,丁辉,付琰,于江菊,
申请(专利权)人:浙江凯池电子科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。