一种语音识别方法技术

技术编号：14383226 阅读：171 留言：0更新日期：2017-01-10 10:40

本发明专利技术提供一种语音识别方法，该方法包括特征提取、特征优化和利用分类器进行识别三个步骤，所述特征提取是通过采用多尺度连续小波变换对语音进行时频分析，同时对沿尺度轴方向的小波系数进行高斯混合建模得到特征参数GCWT，然后对嗓音进行识别；所述特征优化是采用动态加权局部线性嵌入方法DWLLE对特征参数GCWT进行降维处理。本发明专利技术提出的特征参数GCWT优于传统的特征参数MFCC，动态加权局部线性嵌入方法DWLLE降维效果优于LLE。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别
，尤其涉及一种语音识别方法。
技术介绍
语音的识别过程主要包括特征提取、特征优化和利用分类器进行识别。在特征提取方面，语音识别系统的性能与识别器所用的特征参数密切相关，常用的特征参数主要有线谱对LSP、相对谱(RASTA)、线性预测倒谱系数LPCC、Mel倒谱MFCC、能量、Fourier倒谱以及相应的动态特征参数等。小波分析能随信号变化快慢自动调整时间分辨力和频率分辨力。小波系数中少量系数包含信号的绝大部分能量，大部分系数在零附近，对信号能量贡献很小，具有重拖尾现象，因此使用能量/熵特征是不科学的。对于连续小波变换来说，信号小波变换系数模的平方反映了信号在时间-尺度(频率)平面的能量密度分布，对语音多尺度连续小波变换系数采用高斯混合模型(GaussianMixtureModel,GMM)建模分析，提出新的特征参数GCWT能够有效地区分语音种类。在特征优化方面，传统的线性降维方法(如主成分分析法(PCA))在把高维数据映射到低维空间时，通常不能保留原高维数据的内在非线性结构和特征。基于流形学习的非线性降维方法局部线性嵌入(Locallylinearembedding，LLE)进行降维时，对稀疏采样和噪音污染的数据比较敏感。本专利技术提出了动态加权局部线性嵌入DWLLE(Dynamicweightedlocallylinearembedding)方法，对样本点近邻点采用核函数动态加权，弱化稀疏采样对降维造成的影响。
技术实现思路
解决的技术问题：针对现有的语音识别方法中特征提取方面具有重拖尾现象以及特征优化方面不能保留原高维数据的...
一种语音识别方法

【技术保护点】
一种语音识别方法，该方法包括特征提取、特征优化和利用分类器进行识别三个步骤，其特征在于：所述特征提取是通过采用多尺度连续小波变换对语音进行时频分析，同时对沿尺度轴方向的小波系数进行高斯混合建模得到特征参数GCWT，然后对嗓音进行识别；所述特征优化是采用动态加权局部线性嵌入方法DWLLE对特征参数GCWT进行降维处理。

【技术特征摘要】
1.一种语音识别方法，该方法包括特征提取、特征优化和利用分类器进行识别三个步骤，其特征在于：所述特征提取是通过采用多尺度连续小波变换对语音进行时频分析，同时对沿尺度轴方向的小波系数进行高斯混合建模得到特征参数GCWT，然后对嗓音进行识别；所述特征优化是采用动态加权局部线性嵌入方法DWLLE对特征参数GCWT进行降维处理。2.根据权利要求1所述的一种语音识别方法，其特征在于：所述特征参数GCWT＝(π1,u1,Σ1,…,πM,uM,ΣM)；其中,π1,u1,Σ1,…,πM,uM,ΣM分别为M个高斯混合模型的权重、期望、方差。3.根据权利要求1所述的一种语音识别方法，其特征在于：所述动态加权局部线性嵌入方法DWLLE的具体步骤为：(1)利用欧氏距离寻找每个样本点的k(k＜n,n为样本点数)个近邻点；(2)计算样本点和近邻点之间的径向基核函数：uij=k(xj,xj)=Φ(xi)·Φ(xj)=exp(||xi-xj||2σ2);]]>其中，...

【专利技术属性】
技术研发人员：常静雅，陶智，张晓俊，赵鹤鸣，顾济华，吴迪，
申请(专利权)人：苏州大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人