语音特征信息的提取方法及电子设备技术

技术编号:12019167 阅读:75 留言:0更新日期:2015-09-09 16:16
本发明专利技术公开了一种语音特征信息的提取方法及电子设备,获取语音信息;获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;基于所述Mel频谱,获取Mel频率倒谱系数MFCC。

【技术实现步骤摘要】

本专利技术涉及语音
,尤其涉及一种语音特征信息的提取方法及电子设备
技术介绍
随着语音技术的飞速发展,能够通过多种方法来提取语音信息的特征矢量,例如可以通过有线性预测系数(LPC),LPC倒谱系数(LPCC)和Mel频谱系统(Mel-scaleFrequency Cepstral Coefficients,简称MFCC))来提取语音特征矢量,具有较好的识别性能和抗噪能力。但是,现有电子设备在提取语音特征信息时,是根据人耳对不同频率的声波有不同的听觉敏感度,从低频到高频这一段频带内按临界带宽的大小由密到疏安排三角带通滤波器的,然后再对输入信号进行滤波,使得三角带通滤波器组固定分布,且在低频时设置的三角带通滤波器的数量较大,以及在高频时设置的三角带通滤波器的数量较少,而在语音信息中的信息在高频时携带有更多的信息量时,而三角带通滤波器组固定分布,使得高频设置的三角带通滤波器的数量较少,如此,使得现有的电子设备在获取语音特征信息时,存在三角带通滤波器组固定分布,不能根据实际情况自动调整的技术问题。
技术实现思路
本申请实施例通过提供一种语音特征信息的提取方法及电子设备,用以解决现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题。本申请实施例提供了一种语音特征信息的提取方法,应用于电子设备中,所述方法包括:获取语音信息;获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;基于所述Mel频谱,获取Mel频率倒谱系数MFCC。可选的,所述获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数,具体包括:对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息;基于所述频谱信息,确定所述信息分布参数。可选的,所述基于所述频谱信息,确定所述信息分布参数,具体包括:对所述频谱信息进行功率分析,获取所述功率分布参数;基于所述功率分布参数,确定所述信息分布参数。可选的,所述基于所述Mel频谱,获取Mel频率倒谱系数MFCC,具体包括:将所述Mel频谱取对数,获得对数能量谱;将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。可选的,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括:基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。可选的,所述基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,具体包括:基于所述信息分布参数,将所述频率带宽划分为所述N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。本申请一实施例还提供了一种电子设备,所述电子设备包括:语音信息获取单元,用于获取语音信息;信息参数获取单元,用于获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;分布系数确定单元,用于基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;Mel频谱获取单元,用于根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;MFCC获取单元,用于基于所述Mel频谱,获取所述MFCC。可选的,所述电子设备包括频谱信息获取单元,用于对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息;所述信息参数获取单元,具体用于基于所述频谱信息,确定所述信息分布参数。可选的,所述信息参数获取单元,具体用于对所述频谱信息进行功率分析,获取所述功率分布参数,再基于所述功率分布参数,确定所述信息分布参数。可选的,所述基MFCC获取单元,具体用于将所述Mel频谱取对数,获得对数能量谱,再将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。可选的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,并确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,N为不小于2的整数。可选的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,以及确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,其中,所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:其一、由于本申请实施例是获取语音信息在与所述语音信息对应的频谱上的信息分布参数,再基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应,再根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱,以及再基于所述Mel频谱,获取MFCC,由于三角带通滤波器组是根据所述信息分布参数来所述频谱上进行分布的,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,从而解决了现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题,实现了电子设备能够根据实际情况自动调整三角带通滤波器组的分布的技术效果。其二、由于本申请实施例是将所述频率带宽划分为N个频带,再基于所述信息分布参数,确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,而且所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,进而使得根据MFCC值提取的有效语音信息量增大,提高语音识别性能。【附图说明】图1为本申请实施例中语音特征信息的提取方法流程图;图2为本申请实施例中电子设备的结构图。【具体实施方式】本申请实施例通过提供一种语音特征信当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种语音特征信息的提取方法,应用于电子设备中,所述方法包括:获取语音信息;获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;基于所述Mel频谱,获取Mel频率倒谱系数MFCC。

【技术特征摘要】

【专利技术属性】
技术研发人员:廖安华彭刚
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1