The invention discloses a robust feature extraction method based on low frequency logarithmic spectrum, and extracts characteristic parameters by logarithmic spectrum contour of speech signal. Firstly, logarithmic spectrum is obtained by logarithmic transformation of the amplitude spectrum of speech signal; then, logarithmic spectrum is regarded as time domain signal, and low-pass filtering is carried out by digital filter to obtain low-frequency logarithmic spectrum; finally, exponential transformation, Mel filtering, logarithmic transformation and discrete cosine transformation are carried out for low-frequency logarithmic spectrum of speech signal. And the time domain difference is used to get the characteristic parameters of speech signal. The invention can improve the environmental robustness of speech signal characteristic parameters, reduce the influence of speaker changes on speech recognition system, and has the advantages of less computation and easy real-time implementation.
【技术实现步骤摘要】
一种基于低频对数谱的鲁棒特征提取方法
本专利技术属于语音识别
,具体涉及到对语音信号的对数谱进行低频滤波,减小环境失配对语音识别系统影响的鲁棒特征提取方法。
技术介绍
语音识别系统每个语音单元的声学模型一般用安静环境下若干人的训练语音训练而成,如果训练语音能覆盖实际说话人的发音特性,那么语音识别系统可以取得很高的识别率。然而,不同地区说话人的发音方式有较大的差别,且发音方式的种类太多,难以在声学模型的训练过程中考虑所有发音方式。而且,如果在训练过程中使用过多差别大的训练语音,也会导致系统识别率的下降。因此,说话人的改变是导致语音识别系统在实际环境中识别性能下降的重要因素。目前,语音识别系统一般以美尔频率倒谱系数(MFCC:MelFrequencyCepstralCoefficients)为语音的特征参数。MFCC具有高维分量包含的有效信息少,各维分量之间的相关性小的优点。但是,由于语音变异性的影响,在实际环境中提取的MFCC的特性与训练语音可能存在较大的差异,这会导致系统性能的下降,甚至不可用。
技术实现思路
专利技术目的:针对现有技术中存在的问题,为了减小说话人的改变对语音识别系统的影响,在特征提取时,应尽量减少说话人的个性特征,增强语音特征参数的鲁棒性,本专利技术提供一种基于低频对数谱的鲁棒特征提取方法。技术方案:一种基于低频对数谱的鲁棒特征提取方法,首先对输入语音的幅度谱进行对数变换,得到对数谱;然后,将对数谱看作时域信号,用数字滤波器对其进行低通滤波,得到低频对数谱;最后,对语音信号的低频对数谱进行指数变换,Mel滤波,对数变换和离散余弦变换(D ...
【技术保护点】
1.一种基于低频对数谱的鲁棒特征提取方法,其特征在于,首先对输入语音的幅度谱进行对数变换,得到对数谱;然后,将对数谱看作时域信号,用数字滤波器对其进行低通滤波,得到低频对数谱;最后,对语音信号的低频对数谱进行指数变换,Mel滤波,对数变换和离散余弦变换,并进行时域差分,得到语音信号的特征参数。
【技术特征摘要】
1.一种基于低频对数谱的鲁棒特征提取方法,其特征在于,首先对输入语音的幅度谱进行对数变换,得到对数谱;然后,将对数谱看作时域信号,用数字滤波器对其进行低通滤波,得到低频对数谱;最后,对语音信号的低频对数谱进行指数变换,Mel滤波,对数变换和离散余弦变换,并进行时域差分,得到语音信号的特征参数。2.根据权利要求1所述的一种基于低频对数谱的鲁棒特征提取方法,其特征在于,对输入语音加窗,分帧,将输入语音分解为若干帧信号;对每一帧输入语音进行快速傅里叶变换运算,得到每帧信号的幅度谱;对每帧信号的幅度谱进行对数变换,得到语音信号的对数谱。3.根据权利要求1所述的一种基于低频对数谱的鲁棒特征提取方法,其特征在于,将对数谱看作时域信号,用数字滤波器对其进行低通滤波,得到低频对数谱;对每帧信号的低频对数谱进行指数变换,得到语音信号的低频幅度谱;对每帧信号的低频幅度谱进行Mel滤波,得到语音信号的低频Mel谱;对每帧信号的低频Mel谱进行对数变换,得到语音信号的低频Mel对数谱;对每帧信号的低频Mel对数谱进行DCT变换,得到语音信号的静态特征参数;对DCT后的静态倒谱特征作一阶差分和二阶差分,得到动态倒谱参数,静态参数和动态参数共同组成语音的39维倒谱特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。