一种基于功率谱Gabor特征序列递归模型的语音识别方法技术

技术编号：16103555 阅读：48 留言：0更新日期：2017-08-29 23:17

本发明专利技术公开了一种基于功率谱Gabor特征序列递归模型的语音识别方法，该方法的基本步骤包括：1.对语音输入信号进行预处理；2.分别提取功率谱特征和动态谱Delta特征；3.利用时空Gabor滤波器对频谱特征进行滤波处理，并且通过PCA降维处理得到语音特征序列；4.根据语音特征序列，构造递归图；5.通过对语音递归模型进行距离检测，完成语音识别。本发明专利技术通过对语音信号进行预处理，经过特征提取得到语音特征序列，然后将语音特征序列转化为递归模型进行相似性检测，有效的解决了目前自动语音识别系统在非稳态噪声、低信噪比等复杂情况下识别率不够理想、性能容易恶化的问题，提高了语音识别算法的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于功率谱Gabor特征序列递归模型的语音识别方法
本专利技术属于语音识别
，涉及一种复杂背景下的语音识别方法，具体涉及一种基于功率谱Gabor特征序列递归模型的语音识别方法。
技术介绍
语音作为最自然便捷的交流方式，一直是人机通信和交互领域最重要的研究之一，自动语音识别(ASR)更是实现人机交互尤为关键的技术。经过多年的研究，ASR已经走进我们的生活，语音转录、自动翻译、手机助手等都是典型的代表。但是这些系统大都依赖他们所处的声学环境,鲁棒性不强。现有的语音识别包含两个阶段：其一，语音特征提取研究，其二，分类器设计研究。传统的特征提取方法，如梅尔倒谱系数(MFCC)、感知线性预测(PLP)等在复杂环境下难以提取有效的特征；而且传统的分类算法在识别过程中难以达到理想的效果，如动态时间规整(DTW)距离、支持向量机(SVM)等。因为语音识别的匹配需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同，而且两次发音特征提取后的特征维度也不同，使用传统识别方法难以取得理想的效果。神经网络又受困于需要大样本的标注数据训练，小样本情况下，容易过拟合等问题...
一种基于功率谱Gabor特征序列递归模型的语音识别方法

【技术保护点】
一种基于功率谱Gabor特征序列递归模型的语音识别方法，其特征在于，包括以下步骤：步骤一，语音信号的预处理对获取的语音信号进行端点检测，分离并去除语音信号中的噪声信息，获得语音信号中的有效部分，并求其功率谱；步骤二，提取功率谱Gabor特征序列步骤2.1，根据所述的功率谱，提取所述的有效部分的功率归一化频谱特征；步骤2.2，将所述的功率归一化频谱特征按照帧索引顺序组成一个序列C，然后分别进行一阶差分和二阶差分处理后，分别得到Delta频谱特征和Double Delta频谱特征；步骤2.3，将所述的功率归一化频谱特征、Delta频谱特征以及Double Delta频谱特征组成功率归一化频谱特征集...

【技术特征摘要】
1.一种基于功率谱Gabor特征序列递归模型的语音识别方法，其特征在于，包括以下步骤：步骤一，语音信号的预处理对获取的语音信号进行端点检测，分离并去除语音信号中的噪声信息，获得语音信号中的有效部分，并求其功率谱；步骤二，提取功率谱Gabor特征序列步骤2.1，根据所述的功率谱，提取所述的有效部分的功率归一化频谱特征；步骤2.2，将所述的功率归一化频谱特征按照帧索引顺序组成一个序列C，然后分别进行一阶差分和二阶差分处理后，分别得到Delta频谱特征和DoubleDelta频谱特征；步骤2.3，将所述的功率归一化频谱特征、Delta频谱特征以及DoubleDelta频谱特征组成功率归一化频谱特征集，然后通过时空Gabor滤波，将时间调制滤波器表示为行向量，与功率归一化频谱特征集的每个通道独立地卷积；同样，频域调制滤波器表示为列向量，与功率归一化频谱特征集的每个帧独立地卷积；步骤2.4，针对所述的功率归一化频谱特征集，执行直方图均衡化，然后通过PCA将高维特征投影到低维空间上，得功率谱Gabor特征集，并将功率谱Gabor特征集组成语音特征序列X；步骤三，构建语音特征序列的递归图将语音特征序列X按照如下公式计算其递归图r：r＝θ(ε-||x(ik)-x(im)||),ik,im＝1…n上式中，n是语音特征序列经历的状态数，k、m表示帧索引，x(ik)和x(im)是在ik和im序列位置处观察到的语音特征序列上的值，‖.‖表示Euclidean范数，ε表示临界距离，ε＜1；而θ表示Heaviside函数，其定义如下所示:步骤四，语音信号相似性检测计算所述的递归图r与模板库中每一类信号的递归图ri之间的距离，...

【专利技术属性】
技术研发人员：卜起荣，张晓，冯筠，曹正文，
申请(专利权)人：西北大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人