声学特征提取方法、装置、存储介质及终端设备制造方法及图纸

技术编号:20007133 阅读:35 留言:0更新日期:2019-01-05 18:42
本申请实施例中提供的一种声学特征提取方法、装置、存储介质及终端设备,该方法包括:获取待处理语音信号;对所述待处理语音信号进行分帧处理,得到以帧为单位的连续的语音数据块,其中,每两个相邻帧的语音数据块中,前一帧的语音数据块中的最后一个数据和后一帧的语音数据块中的第一个数据在时域上保持连续;对所述语音数据块进行加窗处理和傅里叶变换处理,以得到语音能量谱;将所述语音能量谱通过梅尔滤波器组,以得到梅尔频谱数据;根据所述梅尔频谱数据确定梅尔频率倒谱系数。通过采用上述技术方案,可以降低提取梅尔频率倒谱系数时对每帧数据的算法的次数,可以降低提取声学特征带来的功耗。

Acoustic feature extraction method, device, storage medium and terminal equipment

An acoustic feature extraction method, device, storage medium and terminal device provided in the embodiment of the present application includes: acquiring speech signal to be processed; subframe processing of the speech signal to be processed to obtain a continuous voice data block in frame units, in which the last of the voice data blocks of the previous frame is the last of the voice data blocks of each two adjacent frames. The data and the first data in the voice data block of the latter frame remain continuous in time domain; the voice energy spectrum is obtained by windowing and Fourier transform processing of the voice data block; the voice energy spectrum is obtained through the Mel filter bank to obtain the Mel spectrum data; and the Mel frequency cepstrum coefficient is determined according to the Mel spectrum data. By adopting the above technical scheme, the number of algorithms for extracting Meier frequency cepstrum coefficients for each frame can be reduced, and the power consumption for extracting acoustic characteristics can be reduced.

【技术实现步骤摘要】
声学特征提取方法、装置、存储介质及终端设备
本申请实施例涉及信号处理
,尤其涉及一种声学特征提取方法、装置、存储介质及终端设备。
技术介绍
随着终端设备的快速发展,越来越多的语音功能应用到终端设备中,例如声纹唤醒和语音识别等等。梅尔频率倒谱系数(MFCC,MelFrequencyCepstrumCoefficient)是基于人耳的听觉而导出的声学特征,广泛应用于语音识别领域应,在进行声纹唤醒或者语音识别时,通常需要从语音数据中提取出梅尔频率倒谱系数作为识别语音的特征。而现有技术中对梅尔频率倒谱系数的提取处理会造成终端设备的较多的功耗,所以需要对梅尔频率倒谱系数的提取方法进行优化。
技术实现思路
本申请实施例提供的一种声学特征提取方法、装置、存储介质及终端设备,可以降低终端设备的功耗。第一方面,本申请实施例提供了一种声学特征提取方法,包括:获取待处理语音信号;对所述待处理语音信号进行分帧处理,得到以帧为单位的连续的语音数据块,其中,每两个相邻帧的语音数据块中,前一帧的语音数据块中的最后一个数据和后一帧的语音数据块中的第一个数据在时域上保持连续;对所述语音数据块进行加窗处理和傅里叶变换本文档来自技高网...

【技术保护点】
1.一种声学特征提取方法,其特征在于,包括:获取待处理语音信号;对所述待处理语音信号进行分帧处理,得到以帧为单位的连续的语音数据块,其中,每两个相邻帧的语音数据块中,前一帧的语音数据块中的最后一个数据和后一帧的语音数据块中的第一个数据在时域上保持连续;对所述语音数据块进行加窗处理和傅里叶变换处理,以得到语音能量谱;将所述语音能量谱通过梅尔滤波器组,以得到梅尔频谱数据;根据所述梅尔频谱数据确定梅尔频率倒谱系数。

【技术特征摘要】
1.一种声学特征提取方法,其特征在于,包括:获取待处理语音信号;对所述待处理语音信号进行分帧处理,得到以帧为单位的连续的语音数据块,其中,每两个相邻帧的语音数据块中,前一帧的语音数据块中的最后一个数据和后一帧的语音数据块中的第一个数据在时域上保持连续;对所述语音数据块进行加窗处理和傅里叶变换处理,以得到语音能量谱;将所述语音能量谱通过梅尔滤波器组,以得到梅尔频谱数据;根据所述梅尔频谱数据确定梅尔频率倒谱系数。2.如权利要求1所述的方法,其特征在于,所述梅尔滤波器组为矩形滤波器组,所述矩形滤波器组中的每个矩形滤波器的中心频率在梅尔频率上依次等间隔排列,每个矩形滤波器的在频域上的宽度和对应的梅尔频率区间对应。3.如权利要求2所述的方法,其特征在于,所述矩形滤波器组的中心频率在频域和梅尔频率的映射关系符合如下公式:其中,所述f为频域上的频率,所述Mel(f)为梅尔频率。4.如权利要求2所述的方法,其特征在于,所述矩形滤波器组的每个矩形滤波器的幅值均相同。5.如权利要求4所述的方法,其特征在于,所述矩形滤波器的幅值为1。6.如权利要求1至5任一项所述的方法,其特征在于,根据所述梅尔频谱数据确定梅尔频率倒谱系数包括:对所述梅尔频谱数据进行离散余弦变换,以确定梅尔频率倒谱系数,其中,每一帧的离散余...

【专利技术属性】
技术研发人员:陈岩
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1