一种基于弯折倒谱特征的抗噪语音识别方法技术

技术编号：11740211 阅读：171 留言：0更新日期：2015-07-16 00:04

本发明专利技术涉及听觉滤波器的抗噪性能和抗噪语音识别特征提取，属于电子信息技术中的信号处理技术领域，具体涉及一种基于弯折倒谱特征的抗噪语音识别方法。针对现有滤波器带宽不满足非对称性分布，对应的提取特征无法准确表征人耳听觉特性的不足，本发明专利技术的主要目的在于提供一种基于弯折倒谱特征的抗噪语音识别方法，将WFBs（弯折滤波器组）应用于信号频谱的分析中，有效利用带宽的非对称性，充分使用一阶全通变换的弯折因子来控制频带分布，从而在不同听觉尺度上研究听觉特性滤波器的抗噪性能，提高抗噪特征的识别率。

全部详细技术资料下载

【技术实现步骤摘要】
【专利说明】
本专利技术涉及听觉滤波器的抗噪性能和抗噪语音识别特征提取，属于电子信息技术中的信号处理
，具体涉及。
技术介绍
语音识别系统在干净环境下识别性能良好，但在噪声环境下，识别结果则大幅降低。目前，国内外研宄的热点主要集中在抗噪特征的提取和后端抗噪识别网络两大方面。而对于抗噪特征的提取，研宄者们主要采用现有特征的差分改进和多种特征的拼接组合，对提取特征的前端滤波器关注不多。提取特征的前端滤波器，由一组带通滤波器构成，用来模拟人耳的听觉特性，常见的有FIR滤波器、MEL滤波器、Gammatone滤波器等。人耳具有很强的噪音鲁棒性，因此能够更好模拟人耳听觉特性的滤波器将更有利于提取抗噪特征。耳蜗具备频率选择功能，即不同频率映射到基底膜的不同位置，因此常被认为由一组带通滤波器组成。耳蜗的频率选择性表现为：基底膜上的每一个位置对应着一个特征频率，将此频率下的纯音信号输入耳蜗时，基底膜对应位置会发生最大幅度的振动。耳蜗作为一个滤波器组，呈现以下特征：1)滤波器带宽不同：低频处的带宽较窄，而高频处带宽较宽； 2)单个滤波器的频率响应非对称分布：基底膜的每个位置对应一个特征频率，该位置对此频率的响应幅度最大。特征频率的左侧斜率比较平缓，特征频率的右侧斜率较陡；3)单个滤波器的频率响应同刺激声的强度相关：基底膜的振动特性是呈压缩非线性的。 D.S.Kim早期采用窗函数设计法设计16通道的FIR滤波器，用来仿真耳蜗基底膜的作用，达到了良好的识别结果。滤波器的中心频率为f= 165 . 4(1021x-l)，其中f是中心频...
一种<a href="http://www.xjishu.com/zhuanli/21/CN104778948.html" title="一种基于弯折倒谱特征的抗噪语音识别方法原文来自X技术">基于弯折倒谱特征的抗噪语音识别方法</a>

【技术保护点】
一种基于弯折倒谱特征的抗噪语音识别方法，其特征在于，该方法利用弯折滤波器提取语音倒谱特征参数描述声音信号在人耳听觉空间的分布和映射并使用径向基神经网络对非特定人进行识别，包括以下步骤：预处理语料库语音信号，包括预加重、分帧和加窗过程；计算信号功率谱；弯折滤波器下进行信号功率谱映射；对数和离散余弦变化；以及对弯折倒谱特征进行后端径向基函数神经网络识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄丽霞，张雪英，黄少龙，王一平，孙颖，胡杰，李刚，刘雪艳，张晓丹，王亚楠，
申请(专利权)人：太原理工大学，
类型：发明
国别省市：山西;14

全部详细技术资料下载我是这个专利的主人