一种用于鲁棒语音识别的语音特征提取方法技术

技术编号：8453740 阅读：313 留言：0更新日期：2013-03-21 20:29

本发明专利技术公开了一种用于鲁棒语音识别的语音特征提取方法，该方法包括：获取功率谱；采用滤波器组对功率谱进行处理；采用帧平均的方式求取中等时长的功率谱；对功率谱进行不对称滤波处理，同时对功率谱进行掩蔽处理，得到纯净语音功率谱；对纯净语音和带噪语音功率谱的比值进行通道平均处理，以进行平滑；将平滑后的纯净语音和带噪语音的功率谱比值同滤波器组输出的功率谱相乘，得到纯净语音的短时功率谱；对短时功率谱进行能量归一化处理，以消除乘性噪声；功率谱进行等响度加重；功率谱进行指数操作；对功率谱进行傅立叶逆变换；求取信号的倒谱系数；对倒谱系数进行均值归一化处理。本发明专利技术提取的语音信号的特征，速度快，能够实现在线处理；利用本发明专利技术提取的特征训练出的声学模型，具用很好的抗噪效果；本发明专利技术具有非常重大的使用意义。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别领域，尤其涉及一种在语音识别中，能够对平稳和非平稳噪声有明显抑制作用的语音特征提取算法方法。
技术介绍
语音识别系统在复杂环境下识别性能急剧降低是语音识别中最重要的问题之一。例如在马路上手机语音查询地理位置，用户所处的声学环境非常复杂且变化迅速，这对语音识别系统的性能产生了极大的影响。原有的语音识别系统在没有噪声的环境下能取得很好的处理和识别效果，但在现实应用中识别系统的性能会由于时变的不可预测的环境噪音和信道的影响，说话人的差异，谈话内容的变化等因素影响严重下降。所以如何提高语音识别系统在训练和测试环境的不匹配条件下的鲁棒性成为语音识别技术的关键。近年来，在语音识别技术环境鲁棒性这一研究领域人们提出了很多改进技术和算法，并取得了一定的效果。根据语音识别的流程，鲁棒语音识别可以分为四类时频域的抗噪；特征域的噪声补偿；模型域的噪声自适应和解码域的自适应。最早的技术是时频域的抗噪，例如谱减和维纳滤波，还有经典的欧洲电信标准协会的两阶段维纳滤波。特征层面噪声抑制通常是在提取特征的过程中对噪声进行补偿。由于PLP和MFCC特征一直占据鳌头，所以...

【技术保护点】
一种用于鲁棒语音识别的语音特征提取方法，其特征在于，该方法包括：步骤1、获取语音信号的功率谱；步骤2、将所获得的功率谱通过滤波器组处理，获得含噪语音的短时功率谱；步骤3、根据所获得的含噪语音的短时功率谱，采用帧平均的方式求取含噪语音的中等时长功率谱；步骤4、对所获得的含噪语音的中等时长功率谱进行不对称滤波和掩蔽抗噪，以得到纯净语音的中等时长功率谱；步骤5、根据所述纯净语音的中等时长功率谱、含噪语音的中等时长功率谱和含噪语音的短时功率谱获取纯净语音的短时功率谱；步骤6、对纯净语音的短时功率谱进行能量归一化处理，以消除乘性噪音；步骤7、对消除了乘性噪音的纯净语音的短时功率谱进行等响度加重；步骤8、...

【技术特征摘要】

【专利技术属性】
技术研发人员：徐波，范利春，柯登峰，孟猛，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人