【技术实现步骤摘要】
本专利技术涉及一种语音识别方法,具体涉及的是。
技术介绍
语音识别技术是计算机模拟人类的认识过程,把人类的语音信号转变为相应的文本或命令的技术,其根本目的是研究出一种具有人听觉功能的机器,这种机器能够接受人的语音,理解人的意图,并做出相应的反应,从而对人类的发展提供帮助。 由于语音信号多变性,对环境的依赖性很强,这样就会导致所提取的语音特征参数有所差异,因此需要鲁棒性高的语音特征参数,才能提高语音的识别率。传统的语音特征算法主要从时域、频域等角度进行提取,主要有基于声道参数的线性预测倒谱参数及基于梅尔频率的倒谱特征参数等。通过滤波分割的方法,分两个通道处理语音信号,低频部分主要是语音的浊音部分,采用符合人耳听觉特性的巴克滤波器组进行信号重构并提取语音特征,高频部分主要是清音及噪声部分,采用非线性动力学的最大李雅普诺夫指数来描述,最后整合为语音特征序列,进行语音识别。
技术实现思路
为解决上述问题,本专利技术提供,将数字语音样本采用低通滤波器和高通滤波器进行分割,获得低频和高频信息,使处理之后的信号更加符合人类的听觉系统,从而能够提取出性能更优秀的语音特征参数。为实现上述技术目的,实现上述技术效果,本专利技术通过以下技术方案实现 ,将数字语音样本采用低通滤波器和高通滤波器进行分割,低通滤波器滤波后的信号采用基于人耳听觉特性的巴克滤波器组方法提取巴克频率倒谱参数,并进行规整化处理;高通滤波器滤波后的信号采用非线性动力学的最大李雅普诺夫参数来描述,其具体做法如下 a.巴克频率倒谱参数的提取,包括以下步骤 步骤I)选择巴克域子波母函数为#)= e-#,其中C1 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别中的特征参数提取方法,其特征在于将数字语音样本采用低通滤波器和高通滤波器进行分割,低通滤波器滤波后的信号采用基于人耳听觉特性的巴克滤波器组方法提取巴克频率倒谱参数,并进行规整化处理;高通滤波器滤波后的信号采用非线性动力学的最大李雅普诺夫参数来描述,其具体做法如下 a.巴克频率倒谱参数的提取,包括以下步骤 步骤I)选择巴克域子波母函数为:#(b)=eO\其中Cl = 41n2 ; 可得听觉感知域下的函数表达式 4>%{h) = φ ^bl-kAb) =,七1 ; 其中,b代表听觉感知频率,听觉感知频率带宽为[bl,b2];Δ = ( 2-Μ)/(Γ-1)为4(b)的平移步长; 步骤2)再引入特劳恩米勒所给出的线性频率与听觉感知频率之间的函数关系* = 6.7ssmh[(:/-20)/600]; 步骤3)代入上式,就得到线性频率下的听觉感知子波函数的表达式W-2£J)/eOO]-(#,+ΛΙ#)]1 . C2为规整因子,可近似认为常数,取0. 2 ; 步骤4)将语音能量计算出以后通过巴克滤波器组BWJk) 1S S24,随后通过能量对数的离散余弦变换提取出巴克频率倒谱参数; b.最大李雅普诺...
【专利技术属性】
技术研发人员:张晓俊,陶智,肖仲喆,吴迪,季晶晶,
申请(专利权)人:苏州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。