【技术实现步骤摘要】
本专利技术涉及语音识别领域,尤其涉及一种在语音识别中,能够对平稳和非平稳噪声有明显抑制作用的语音特征提取算法方法。
技术介绍
语音识别系统在复杂环境下识别性能急剧降低是语音识别中最重要的问题之一。 例如在马路上手机语音查询地理位置,用户所处的声学环境非常复杂且变化迅速,这对语音识别系统的性能产生了极大的影响。原有的语音识别系统在没有噪声的环境下能取得很好的处理和识别效果,但在现实应用中识别系统的性能会由于时变的不可预测的环境噪音和信道的影响,说话人的差异,谈话内容的变化等因素影响严重下降。所以如何提高语音识别系统在训练和测试环境的不匹配条件下的鲁棒性成为语音识别技术的关键。近年来,在语音识别技术环境鲁棒性这一研究领域人们提出了很多改进技术和算法,并取得了一定的效果。根据语音识别的流程,鲁棒语音识别可以分为四类时频域的抗噪;特征域的噪声补偿;模型域的噪声自适应和解码域的自适应。最早的技术是时频域的抗噪,例如谱减和维纳滤波,还有经典的欧洲电信标准协会的两阶段维纳滤波。特征层面噪声抑制通常是在提取特征的过程中对噪声进行补偿。由于PLP和MFCC特征一直占据鳌头, 所以 ...
【技术保护点】
一种用于鲁棒语音识别的语音特征提取方法,其特征在于,该方法包括:步骤1、获取语音信号的功率谱;步骤2、将所获得的功率谱通过滤波器组处理,获得含噪语音的短时功率谱;步骤3、根据所获得的含噪语音的短时功率谱,采用帧平均的方式求取含噪语音的中等时长功率谱;步骤4、对所获得的含噪语音的中等时长功率谱进行不对称滤波和掩蔽抗噪,以得到纯净语音的中等时长功率谱;步骤5、根据所述纯净语音的中等时长功率谱、含噪语音的中等时长功率谱和含噪语音的短时功率谱获取纯净语音的短时功率谱;步骤6、对纯净语音的短时功率谱进行能量归一化处理,以消除乘性噪音;步骤7、对消除了乘性噪音的纯净语音的短时功率谱进行 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:徐波,范利春,柯登峰,孟猛,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。