【技术实现步骤摘要】
语音特征提取的处理方法、装置、计算机设备和存储介质
本专利技术涉及语音识别领域,具体而言,涉及语音特征提取的处理方法、装置、计算机设备和存储介质。
技术介绍
在语音识别的过程中,语音特征提取是非常重要的一个环节,原始语音数据经过梅尔倒谱系数(Mel-scaleFrequencyCepstralCoefficients,简称为MFCC)的特征提取,其过程包括短时傅里叶变换(shorttimeFouriertransform,简称为STFT)、梅尔滤波(Mel-filter)、取log、离散余弦变换(discretecosinetransform,简称为DCT)等步骤,之后将提取的语音特征编码通过神经网络训练识别其信息内容。在此过程中快速傅里叶变换(fastFouriertransform,简称为FFT),是一种实现傅里叶变换的快速算法,实现FFT的方法多样,通常为基2为底的时域抽取蝶形算法(cooley-turkey算法)。FFT可以使离散傅里叶变换(DiscreteFourierTransform,简称为DFT)的时间复杂度 ...
【技术保护点】
1.一种语音特征提取的处理装置,其特征在于,所述装置包括:/n抽取模块,用于将语音信号的实数序列,按奇偶分开为偶数序列和奇数序列,将所述偶数序列和所述奇数序列,分别输入为复数信号的实部和所述复数信号的虚部;/n变换模块,用于将所述复数信号输入预设快速傅里叶FFT框架模型,对所述复数信号进行FFT变换输出所述复数信号的信号频谱,其中,所述预设FFT框架模型包括一级基2^2模块和二级基2^3模块;/n逆变换模块,用于将所述复数信号的信号频谱输入傅里叶逆变换RFFT单元,获取所述语音信号的频谱数据。/n
【技术特征摘要】
1.一种语音特征提取的处理装置,其特征在于,所述装置包括:
抽取模块,用于将语音信号的实数序列,按奇偶分开为偶数序列和奇数序列,将所述偶数序列和所述奇数序列,分别输入为复数信号的实部和所述复数信号的虚部;
变换模块,用于将所述复数信号输入预设快速傅里叶FFT框架模型,对所述复数信号进行FFT变换输出所述复数信号的信号频谱,其中,所述预设FFT框架模型包括一级基2^2模块和二级基2^3模块;
逆变换模块,用于将所述复数信号的信号频谱输入傅里叶逆变换RFFT单元,获取所述语音信号的频谱数据。
2.根据权利要求1所述装置,其特征在于,将语音信号的实数序列,按奇偶分开为偶数序列和奇数序列,将所述偶数序列和所述奇数序列,分别输入为复数信号的实部和所述复数信号的虚部包括以下之一:
获取到512点语音信号的实数序列,按奇偶分开为偶数序列和奇数序列,将所述偶数序列和所述奇数序列,分别输入256点的复数信号实部和虚部;
获取到256点语音信号的实数序列,按奇偶分开为偶数序列和奇数序列,将所述偶数序列和所述奇数序列,分别输入128点的复数信号实部和虚部。
3.根据权利要求1所述装置,其特征在于,所述装置还包括:
提取模块,用于将所述频谱数据输入Mel滤波器,进行倒谱运算,提取所述语音信号的语音包络特征。
4.根据权利要求3所述装置,其特征在于,所述装置还包括:
神经网络识别模块,用于获取所述语音信号的语音包络特征之后,所述语音包络特征进行编码后,输入神经网络训练模型进行语音识别。
5.一种语音特征提取的处理方法,其特征在于,所述方法包括:
将语音信号的实数序列,按奇偶分开为偶数序列和奇数序列,将所述偶数序列和所述奇数序列,分别输...
【专利技术属性】
技术研发人员:曹堉棋,彭博,傅金泉,顾渝骢,高婧洁,曹书红,
申请(专利权)人:杭州智芯科微电子科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。