The invention discloses a speech enhancement system and method based on multi-subband short-time fractional Fourier spectrum random rearrangement robust principal component analysis MFrSRRPCA algorithm. Its implementation steps are: time-frequency analysis module generates time-frequency information of noisy speech; time-frequency subband division module divides time-frequency amplitude spectrum of noisy speech into multiple noisy subbands; each time-frequency amplitude spectrum enhancement module randomly disturbs. Corresponding to the order of each frame spectrum element in the noisy subband, according to the noise intensity estimation in the corresponding subband, the corresponding enhancement subband is generated by using robust principal component analysis (RPCA); the time-frequency subband reorganization module composes all enhancement subbands into enhanced time-frequency amplitude spectrum; and the time-domain speech reconstruction module reconstructs enhanced time-frequency amplitude spectrum into enhanced speech. The invention can improve the quality and intelligibility of noisy speech, and can be used for speech enhancement and noise reduction of speech receiving system.
【技术实现步骤摘要】
基于MFrSRRPCA算法的语音增强系统及方法
本专利技术属于信号处理领域,更进一步涉及语音信号处理
中的一种基于多子带短时分数阶傅里叶谱随机重排鲁棒主成分分析MFrSRRPCA(Multi-bandShort-time-fractional-Fourier-spectrogram-random-rearrangedRobustPrincipalComponentAnalysis)算法的语音增强系统及方法。本专利技术不仅可用于语音接收系统中的语音增强与降噪,还能用作语音检测识别系统的预处理前端,提升语音检测识别的性能。
技术介绍
传统语音增强通常以谱减法和维纳滤波器等算法为基础,而由谱减法所得的增强语音中常常会引入大量音乐噪声,维纳滤波器却预先假设语音与噪声服从高斯分布,因此,传统语音增强方法的应用往往存在着诸多限制。近年来,随着信号处理技术的发展,语音增强技术经历了迅猛的发展。鲁棒主成分分析作为一种矩阵低秩稀疏分解算法,近年来被引入到了语音增强领域之中,该算法打破了传统语音增强方法的限制,尤其在低信噪比条件下,取得了更为良好的效果。然而,以鲁棒主成分分析为 ...
【技术保护点】
1.一种基于多子带短时分数阶傅里叶谱随机重排鲁棒主成分分析MFrSRRPCA算法的语音增强系统,包括时频分析模块、时域语音重构模块,其特征在于,还包括时频子带划分模块、时频子带重组模块、32个时频幅度谱增强模块;所述时频分析模块分别与时域语音重构模块、时频子带划分模块相连,所述时域语音重构模块与时频子带重组模块相连,所述32个时频幅度谱增强模块中的每个模块分别与时频子带划分模块、时频子带重组模块相连;其中:所述时频分析模块,用于将待增强的含噪语音分为多帧短时语音,选取一个未处理帧的短时语音作为当前帧的短时语音,对当前帧的短时语音分别做不同阶次的分数阶傅里叶变换,选取最优阶次 ...
【技术特征摘要】
1.一种基于多子带短时分数阶傅里叶谱随机重排鲁棒主成分分析MFrSRRPCA算法的语音增强系统,包括时频分析模块、时域语音重构模块,其特征在于,还包括时频子带划分模块、时频子带重组模块、32个时频幅度谱增强模块;所述时频分析模块分别与时域语音重构模块、时频子带划分模块相连,所述时域语音重构模块与时频子带重组模块相连,所述32个时频幅度谱增强模块中的每个模块分别与时频子带划分模块、时频子带重组模块相连;其中:所述时频分析模块,用于将待增强的含噪语音分为多帧短时语音,选取一个未处理帧的短时语音作为当前帧的短时语音,对当前帧的短时语音分别做不同阶次的分数阶傅里叶变换,选取最优阶次,保存当前帧的最优分数阶傅里叶相位谱,判断是否选取完所有帧的短时语音,构成含噪语音的短时分数阶傅里叶时频幅度谱;所述时频子带划分模块,用于选取一个整数N作为子带划分的个数,接收时频分析模块生成的含噪语音短时分数阶傅里叶时频幅度谱,将含噪语音短时分数阶傅里叶时频幅度谱划分为N个含噪子带,启用32个时频幅度谱增强模块中所有编号小于等于N的时频幅度谱增强模块,将每个含噪子带输出到对应编号的时频幅度谱增强模块之中;所述时频幅度谱增强模块,用于接收对应编号的含噪子带,随机打乱对应编号的含噪子带中各帧分数阶傅里叶幅度谱元素的排列顺序,估计相应含噪重排子带内的噪声强度,生成对应编号的稀疏子带,恢复对应编号稀疏子带中所有帧分数阶傅里叶幅度谱元素的排列顺序,生成对应编号的增强子带;所述时频子带重组模块,用于接收所有编号小于等于N的时频幅度谱增强模块所生成的增强子带,组成增强短时分数阶傅里叶时频幅度谱;所述时域语音重构模块,用于接收时频分析模块生成的所有帧的最优阶次与最优分数阶傅里叶相位谱,接收时频子带重组模块生成的增强短时分数阶傅里叶时频幅度谱,选取一个未处理帧的增强分数阶傅里叶幅度谱,作为当前帧的增强分数阶傅里叶幅度谱,重构当前帧的短时增强语音,判断是否选取完所有帧的增强分数阶傅里叶幅度谱,将所有帧的短时增强语音重构成完整的增强语音。2.一种基于多子带短时分数阶傅里叶谱随机重排鲁棒主成分分析MFrSRRPCA算法的语音增强方法,其特征在于,使用短时分数阶傅里叶变换对含噪语音进行时频分析,将其结果中的时频幅度谱沿分数阶频率轴划分为若干子带,将每个子带中各帧的分数阶傅里叶幅度谱元素排列顺序分别随机打乱,使用鲁棒主成分分析算法分别将每个子带分解,将所有增强子带重组成增强时频幅度谱;该方法的具体步骤包括如下:(1)生成含噪语音的时频信息:(1a)时频分析模块从[20,50]毫秒的范围内任选一个值作为帧的时长,并在帧长度×[5%,95%]的范围内,选取一个值作为步进长度,将待增强的含噪语音分为多帧短时语音;(1b)时频分析模块在所有帧的短时语音中,按时间顺序依次选取一个未处理帧的短时语音作为当前帧的短时语音;(1c)时频分析模块对当前帧的短时语音分别做不同阶次的分数阶傅里叶变换,获得多个不同阶次的分数阶傅里叶谱,求取每个阶次对应变换谱的幅度与相位分别作为该阶次的分数阶傅里叶幅度谱与分数阶傅里叶相位谱;(1d)时频分析模块将每个阶次的分数阶傅里叶幅度谱作为一个列向量,按阶次的顺序排列,由所有阶次的分数阶傅里叶幅度谱构成阶次-分数阶傅里叶幅度谱矩阵,通过搜索矩阵中的最大值选取最优阶次,将最大值所对应的阶次与分数阶傅里叶幅度谱分别作为当前帧的最优阶次与最优分数阶傅里叶幅度谱,将最优阶次相应的分数阶傅里叶相位谱作为当前帧的最优分数阶傅里叶相位谱,保存当前帧的最优分数阶傅里叶相位谱;(1e)时频分析模块判断是否选取完所有帧的短时语音,若是,执行步骤(1f),否则,执行步骤(1b);(1f)时频分析模块将每帧的最优分数阶傅里叶幅度谱作为一个列向量,按时间顺序排列,由所有帧的最优分数阶傅里叶幅度谱构成含噪语音的短时分数阶傅里叶时频幅度谱,该短时分数阶傅里叶时频幅度谱与(1d)中保存的所有帧的最优阶次及最优分数阶傅里叶相位谱构成完整的含噪语音时频信息;(2)划分出N个含噪子带:(2a)时频子带划分模块在[1,32]的范围内,选取一个整数N作为子带划分的个数;(2b)时频子带划分模块接收时频分析模块生成的含噪语音短时分数阶傅里叶时频幅度谱,沿分数阶频率轴将含噪语音短时分数阶傅里叶时频幅度谱划分为N个含噪子带,并将生成的所有含噪子带按含噪子带起始频率分数阶大小分别编号,各含噪子带所占频点个数大于等于4;(2c)时频子带划分模块启用32个时频幅度谱增强模块中所有编号小于等于N的时频幅度谱增强模块;(2d)将每个含噪子带作为一个时频幅度谱,将每个含噪...
【专利技术属性】
技术研发人员:罗勇江,毛昱,周姝婧,汤建龙,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。