【技术实现步骤摘要】
一种基于功率谱Gabor特征序列递归模型的语音识别方法
本专利技术属于语音识别
,涉及一种复杂背景下的语音识别方法,具体涉及一种基于功率谱Gabor特征序列递归模型的语音识别方法。
技术介绍
语音作为最自然便捷的交流方式,一直是人机通信和交互领域最重要的研究之一,自动语音识别(ASR)更是实现人机交互尤为关键的技术。经过多年的研究,ASR已经走进我们的生活,语音转录、自动翻译、手机助手等都是典型的代表。但是这些系统大都依赖他们所处的声学环境,鲁棒性不强。现有的语音识别包含两个阶段:其一,语音特征提取研究,其二,分类器设计研究。传统的特征提取方法,如梅尔倒谱系数(MFCC)、感知线性预测(PLP)等在复杂环境下难以提取有效的特征;而且传统的分类算法在识别过程中难以达到理想的效果,如动态时间规整(DTW)距离、支持向量机(SVM)等。因为语音识别的匹配需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同,而且两次发音特征提取后的特征维度也不同,使用传统识别方法难以取得理想的效果。神经网络又受困于需要大样本的标注数据训练,小样本情况下,容易过拟合等问题 ...
【技术保护点】
一种基于功率谱Gabor特征序列递归模型的语音识别方法,其特征在于,包括以下步骤:步骤一,语音信号的预处理对获取的语音信号进行端点检测,分离并去除语音信号中的噪声信息,获得语音信号中的有效部分,并求其功率谱;步骤二,提取功率谱Gabor特征序列步骤2.1,根据所述的功率谱,提取所述的有效部分的功率归一化频谱特征;步骤2.2,将所述的功率归一化频谱特征按照帧索引顺序组成一个序列C,然后分别进行一阶差分和二阶差分处理后,分别得到Delta频谱特征和Double Delta频谱特征;步骤2.3,将所述的功率归一化频谱特征、Delta频谱特征以及Double Delta频谱特征组成 ...
【技术特征摘要】
1.一种基于功率谱Gabor特征序列递归模型的语音识别方法,其特征在于,包括以下步骤:步骤一,语音信号的预处理对获取的语音信号进行端点检测,分离并去除语音信号中的噪声信息,获得语音信号中的有效部分,并求其功率谱;步骤二,提取功率谱Gabor特征序列步骤2.1,根据所述的功率谱,提取所述的有效部分的功率归一化频谱特征;步骤2.2,将所述的功率归一化频谱特征按照帧索引顺序组成一个序列C,然后分别进行一阶差分和二阶差分处理后,分别得到Delta频谱特征和DoubleDelta频谱特征;步骤2.3,将所述的功率归一化频谱特征、Delta频谱特征以及DoubleDelta频谱特征组成功率归一化频谱特征集,然后通过时空Gabor滤波,将时间调制滤波器表示为行向量,与功率归一化频谱特征集的每个通道独立地卷积;同样,频域调制滤波器表示为列向量,与功率归一化频谱特征集的每个帧独立地卷积;步骤2.4,针对所述的功率归一化频谱特征集,执行直方图均衡化,然后通过PCA将高维特征投影到低维空间上,得功率谱Gabor特征集,并将功率谱Gabor特征集组成语音特征序列X;步骤三,构建语音特征序列的递归图将语音特征序列X按照如下公式计算其递归图r:r=θ(ε-||x(ik)-x(im)||),ik,im=1…n上式中,n是语音特征序列经历的状态数,k、m表示帧索引,x(ik)和x(im)是在ik和im序列位置处观察到的语音特征序列上的值,‖.‖表示Euclidean范数,ε表示临界距离,ε<1;而θ表示Heaviside函数,其定义如下所示:步骤四,语音信号相似性检测计算所述的递归图r与模板库中每一类信号的递归图ri之间的距离,...
【专利技术属性】
技术研发人员:卜起荣,张晓,冯筠,曹正文,
申请(专利权)人:西北大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。