基于信噪比加权模板特征匹配的抗噪语音识别方法及装置制造方法及图纸

技术编号：10022345 阅读：360 留言：0更新日期：2014-05-09 04:37

本发明专利技术公开了一种基于信噪比加权模板特征匹配的抗噪语音识别方法，包括以下步骤：步骤一：对输入语音信号进行预处理，求得相位系数；步骤二：计算输入语音的特征，即相位MFCC；步骤三：对基于SNR的模板进行特征匹配。本发明专利技术还公开了一种实现基于信噪比加权模板特征匹配的抗噪语音识别方法的装置，包括：电源模块、显示模块、存储模块、DSP/ARM数字处理模块、麦克风、A/D转换器和USB接口。具有适应范围广、准确性高、成本低、使用便捷和适应性强等优点。

全部详细技术资料下载

【技术实现步骤摘要】
基于信噪比加权模板特征匹配的抗噪语音识别方法及装置
本专利技术涉及一种声音信号处理技术，特别涉及一种基于信噪比加权模板特征匹配的抗噪语音识别方法及装置。
技术介绍
语音识别的应用领域非常广泛，几乎涉及到日常生活的方方面面。如语音拨号系统、订票系统、医疗服务、银行服务、听写机、计算机控制、工业控制、语音通信系统等。语音识别技术在工业、家电、通信、医疗、家庭服务等各个领域深刻改变人类现有的日常生活方式。如今，实际环境对语音识别的声学噪声鲁棒性要求越来越高，因此，提取具有鲁棒性和较强区分能力的特征向量对语音识别系统具有重要的意义。现在用于语音识别的特征都基于语音信号的功率谱，功率谱表示了信号在频域范围的能量分布。当存在外部噪声时，这种能量分布还包含了噪声的能量。这就使得相应的特征向量对外部噪声十分敏感，导致在噪声环境下的语音识别系统性能不佳。解决特征向量对外部噪声敏感的方法主要有两方面，一个是基于特征，一个是基于模型。基于特征的方法是在语音识别系统的前端使生成的特征向量尽量与噪声无关。而基于模型的方法是在语音识别系统的后端，通过测试环境下的少量自适应数据，对模型参数进行调整，逐渐将模型参数变换到实际环境，从而达到提高系统识别率的目的。基于特征的解决方法有谱减法、RASTA处理法等。基于模型的方法有并行模型混合法(PMC)，基于矢量泰勒级数的自适应法(VTS)，信号分解法等。目前，用于语音识别的提取的语音信号特征参数主要有两种：线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)。LPCC特征参数能够有效地表示语音参数并且有着较高的计算速度，但没有考虑人类...
基于信噪比加权模板特征匹配的抗噪语音识别方法及装置

【技术保护点】

【技术特征摘要】
1.一种基于信噪比加权模板特征匹配的抗噪语音识别方法，其特征在于，包括以下步骤：步骤一：对输入语音信号进行预处理，求得相位系数；步骤二：计算输入语音的特征，即相位MFCC；步骤三：对基于SNR的模板进行特征匹配；其特征在于，所述步骤一包括以下步骤：步骤A、将数字化后的语音信号s[n]进行分帧处理，同时采用汉明窗进行加窗，并分为T帧：{s0[n],s1[n],...,st[n],...,sT-1[n]}，其中：st[n]＝{s[Kt],s[Kt+1],...,s[Kt+N-1]}，K为帧移，N为帧长，st[n]为在时刻t的帧信号序列；步骤B、将所得帧信号进行周期延拓，得到自相关函数：由自相关函数的表达式可得出，R[k]是两个N维向量的点积，其中，||x||2＝||x0||2＝||xk||2，表示的是帧能量，θk是向量x0和向量xk在N维空间的夹角；步骤C、将归一化的自相关系数进行反余弦的非线性变化，得到相位系数：P[k]的取值范围是0到π之间，将其归一化到0到1间，得到归一化的相位自相关函数：其中，Pn[k]用于提高在低信噪比情况下的鲁棒性。2.根据权利要求1所述的基于信噪比加权模板特征匹配的抗噪语音识别方法，其特征在于，所述步骤二包括以下步骤：步骤Ⅰ、对Pn[k]进行DFT变换,得到相位功率谱Sp[l]：式中，Sp[l]表示相位功率谱，从式中得到的MEL频率倒谱系数叫做相位MFCC，即：通过Mel频率尺度滤波器组滤波，然后进行对数运算；步骤Ⅱ、当各个频带的信息分离出来后，用离散余弦变换将频域特征变化到时域上，得到相位MFCC参数；所述相位MFCC参数选取L阶静态倒谱系数及其一阶和二阶导数，共3L维。3.根据权利要求1所述的基于信噪比加权模板特征匹配的抗噪语音识别方法，其特征在于，所述步骤三包括以下步骤：步骤①、参考数据库中有j个参考语音数据模板，其中包含3M维的MFCC特征向量和3L维的相位MFCC特征向量；特征向量3M维MFCC...

【专利技术属性】
技术研发人员：宁更新，吴丽菲，宁小娟，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人