当前位置: 首页 > 专利查询>东华大学专利>正文

一种基于恒定常数频域变换下的语音增强方法技术

技术编号:24858692 阅读:110 留言:0更新日期:2020-07-10 19:10
本发明专利技术提供了一种基于恒定常数频域变换下的语音增强方法,属于在恒定常数Q频域转换下基于非负矩阵分解(NMF)算法的语音增强技术。主要涉及的步骤就是通过恒定常数Q频域转换提取语音频域参数,然后使用NMF算法训练语音字典进行降噪。CQT变换有效的降低了FFT变换在低频时的周期截断问题,同时使用NMF算法训练字典,有效的提高了语音在低频时的分辨率,使增强后的语音有更好的听觉效果。

【技术实现步骤摘要】
一种基于恒定常数频域变换下的语音增强方法
本专利技术涉及语音信号处理中的去噪技术,更具体地涉及一种在恒定Q频域转换下基于非负矩阵分解(NonnegativeMatrixFactorization,NMF)算法的语音增强技术。本专利技术涉及恒定常数变换(ConstantQTransform,CQT)以及非负矩阵分解(NonnegativeMatrixFactorization,NMF)算法等语音增强的方法。
技术介绍
由于现在语音背景复杂,且人们对语音质量的要求越来越高。因此对语音信号的抗噪研究越来越重要。目前国内外有关抗噪声技术的研究成果大体分为三类解决方法:第一类是采用语音增强算法,提高语音识别系统前端预处理的抗噪声能力,提高输入信号的信噪比。第二类是寻找稳健的语音特征作为特征参数。第三类是基于模型参数自适应的噪声补偿算法。语音增强主要包括较为经典的谱减法,此类语音增强方法将估计的对象放在短时谱幅度上。基于稀疏分解的语音增强方法近几年的研究日渐增多,其中基于NMF算法训练字典得到广泛的应用。传统的语音特征参数的提取是通过短时傅里叶变换本文档来自技高网...

【技术保护点】
1.一种基于恒定常数频域变换下的语音增强方法,其特征在于,通过恒定常数Q变换提取语音特征频域参数,然后使用NMF算法训练纯语音和噪音字典进行语音增强,包括以下步骤:/n步骤1、分别提取纯净语音和噪音的信号特征;/n步骤2、对所提取的信号特征进行恒定常数Q变换,恒定常数Q变换通过采用不同的窗口宽度获得不同的频率解析度,得到各个半音的频率振幅,由此分别获得纯净语音的频域参数矩阵及噪音的频域参数幅度矩阵;/n步骤3、通过NMF算法对纯净语音的频域参数矩阵进行非负分解得到纯净语音冗余字典W

【技术特征摘要】
1.一种基于恒定常数频域变换下的语音增强方法,其特征在于,通过恒定常数Q变换提取语音特征频域参数,然后使用NMF算法训练纯语音和噪音字典进行语音增强,包括以下步骤:
步骤1、分别提取纯净语音和噪音的信号特征;
步骤2、对所提取的信号特征进行恒定常数Q变换,恒定常数Q变换通过采用不同的窗口宽度获得不同的频率解析度,得到各个半音的频率振幅,由此分别获得纯净语音的频域参数矩阵及噪音的频域参数幅度矩阵;
步骤3、通过NMF算法对纯净语音的频域参数矩阵进行非负分解得到纯净语音冗余字典Ws、Hs;通过NMF算法对噪音的频域参数矩阵进行非负分解得到噪音冗余字典Wn、Hn;其中,纯净语音冗余字典Ws及噪音冗余字典Wn为W矩阵字典,纯净语音冗余字典Hs及噪音冗余字典Hn为H矩阵字典,非负矩阵分解是将m行n列的矩阵Vm×n分解成Wm×k和Hk×n,其更新规则如下:






式(1)、(2)中,中(i,j分别表示W更新的第i行和第j列,其中j的范围是k),HK中(k表示H的行数),V表示纯净语音或噪音的频域参数幅度矩阵,Wk(...

【专利技术属性】
技术研发人员:徐珑婷魏郅林季云云张光林贾逢德
申请(专利权)人:东华大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1