当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于GMM噪声估计的模型组合语音识别方法技术

技术编号:12908577 阅读:148 留言:0更新日期:2016-02-24 15:02
本发明专利技术公开一种基于GMM噪声估计的模型组合语音识别方法,用一个含有较少高斯单元的GMM从含噪测试语音中实时估计噪声参数,并监控噪声的变化。噪声参数估计按时间间隔进行,每个时间间隔更新一次噪声参数,静音段也当作含噪语音处理。估得的噪声参数除了用于模型组合,还存储在内部存储器中,用于下一个时间间隔的噪声变化判断。在噪声监控中,首先从存储器中读取上一个时间间隔的噪声参数,然后与纯净语音GMM组合,得到含噪语音GMM,并对当前时间间隔的含噪测试语音进行概率计算,将输出的平均对数似然值与噪声参数估计子模块输出的平均对数似然值进行比较,若似然差大于阈值,则认为噪声发生了变化,否则就认为噪声不变。

【技术实现步骤摘要】

本专利技术涉及一种基于GMM噪声估计的模型组合语音识别方法,具体是用测试环境 下提取的噪声参数调整语音识别系统声学模型的参数,使其与实际环境下提取的含噪语音 特征参数相匹配,提高系统噪声鲁棒性的模型组合方法;属于语音识别

技术介绍
自动语音识别技术可以为电子设备提供方便的输入接口,已广泛应用于移动电 话、平板电脑、导航仪等移动设备。但是在实际应用中,环境噪声等语音变异性是不可避免 地,这通常会导致语音识别系统的性能急剧下降,因此有必要采取措施提高语音识别系统 的环境鲁棒性。鲁棒语音识别算法通常可以划分为两大类,即前端特征域方法和后端模型 域方法。 特征域方法的目的是提高声学特征的噪声鲁棒性,或者对测试环境下提取的含噪 特征进行补偿,使其特性尽量与纯净训练语音接近。特征域方法的优点是与系统后端的具 体识别器无关,且计算量较小,因而可以用于各种实时系统。后端模型域方法对预先训练的 声学模型的参数进行调整,使之与当前测试环境相匹配,用参数调整后的声学模型对测试 语音直接识别,无需对提取的特征参数进行额外处理。模型域方法主要包括模型自适应和 模型组合,前者通过实际环境本文档来自技高网...

【技术保护点】
一种基于GMM噪声估计的模型组合语音识别方法,其特征在于,主要包括如下内容:(1)GMM训练:在训练阶段,用所有基本语音单元的训练语音训练生成一个统一的GMM,该GMM近似表示语音倒谱特征的分布;(2)HMM训练:在训练阶段,用每个基本语音单元的训练语音训练生成该基本语音单元的隐马尔可夫模型,所有基本语音单元的HMM共同组成语音识别系统的声学模型;(3)噪声估计:在测试阶段,用GMM从含噪测试语音中实时提取噪声的均值和方差,并根据平均对数似然值判断噪声是否发声变化;噪声信息按照时间间隔更新,噪声估计的同时判断噪声的变化情况;噪声估计按时间间隔进行,不需要进行语音活动检测,对静音段也当作含噪语音...

【技术特征摘要】

【专利技术属性】
技术研发人员:吕勇
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1