声学建模方法及装置和语音识别方法及装置制造方法及图纸

技术编号：9569701 阅读：92 留言：0更新日期：2014-01-16 03:02

本发明专利技术提供一种用于噪声环境下的语音输入的声学建模方法，包括以下步骤：使用纯噪声段对标准语料集合中的标准语料进行加噪处理以形成加噪语料；以及通过使用所述加噪语料进行声学模型训练，建立加噪语料的声学模型。本发明专利技术还提供一种用于噪声环境下的语音输入的声学建模装置以及用于噪声环境下的语音输入及搜索系统的语音识别方法和装置。本发明专利技术可以提高噪声环境下语音识别的准确度和效率。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提供一种用于噪声环境下的语音输入的声学建模方法，包括以下步骤：使用纯噪声段对标准语料集合中的标准语料进行加噪处理以形成加噪语料；以及通过使用所述加噪语料进行声学模型训练，建立加噪语料的声学模型。本专利技术还提供一种用于噪声环境下的语音输入的声学建模装置以及用于噪声环境下的语音输入及搜索系统的语音识别方法和装置。本专利技术可以提高噪声环境下语音识别的准确度和效率。【专利说明】声学建模方法及装置和语音识别方法及装置
本专利技术涉及一种用于噪声环境下的语音识别技术，特别是涉及用于噪声环境下的语音输入的声学建模方法及装置、语音识别方法及装置。
技术介绍
语音识别系统的性能受许多因素的影响，包括不同的说话人、说话方式、环境噪声、传输信道等等。为了提高语音识别系统的性能，其解决办法按针对语音特征的方法(以下称特征方法)和模型调整的方法(以下称模型方法)分为两类。前者需要寻找更好的、高鲁棒性的特征参数，或是在现有的特征参数基础上加入一些特定的处理方法。后者是利用少量的自适应语料来修正或变换原有的声学模型，从而提高声学模型的自适应性。目前，现有的语音识别系统的适应性较差，主要体现在对环境依赖性强，即在单一噪声环境下采集到的语音数据经过训练后只能在这种环境下应用，否则系统性能将急剧下降。另外，还提出有采用对噪声的特性进行估计，例如噪声谱估计等，去除语音数据的噪声信号的方法。但这种方法对复杂的噪声环境下的语音数据的识别效果不佳。目前，现有的语音识别系统对安静环境下的语音数据的识别性能较佳，但对噪声环境下的语音数据的识别性能则明显下降。对于语音输入...

【技术保护点】
一种用于噪声环境下的语音输入的声学建模方法，包括以下步骤：使用纯噪声段对标准语料集合中的标准语料进行加噪处理以形成加噪语料；以及通过使用所述加噪语料进行声学模型训练，建立加噪语料的声学模型。

【技术特征摘要】

【专利技术属性】
技术研发人员：苏丹，贾磊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人