一种环境自适应的语音混响消除方法和系统技术方案

技术编号：13080257 阅读：53 留言：0更新日期：2016-03-30 13:26

本发明专利技术公开一种环境自适应的语音混响消除方法和系统，该系统包括有混响模型训练装置、RT60获取装置以及音频处理装置；首先，考虑到RT60值的大小可以近似表征房间的混响量的大小及特殊的室内应用环境(RT60的值会在一个较小的范围内)，本发明专利技术中将RT60值按大小分成多个区间，使用区间内的语音特征来训练混响模型，使得数据训练的更加充分，混响模型更有针对性；其次，通过结合当前环境的RT60值所在区间和使用对应区间的混响模型进行解码的方法实现了对不同房间环境的自适应；再者，由于采用深度网络训练模型，在实际应用时就不需要估计混响分量，直接根据模型参数进行解码即可得到混响消除后的语音特征，减少了计算量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及语音混响消除领域技术，尤其是指一种环境自适应的语音混响消除方法和系统。
技术介绍
在室内采集语音信号时，若声源与采集的麦克风距离较远，就会有混响。过大的混响会严重影响语音的清晰度和可懂度。在语音识别和说话人识别系统中，混响的出现将会使训练数据与测试数据不匹配影响系统的性能，严重时还可能导致系统无法正常工作。此时，一种有效的混响的消除方法就变得极其重要了。常用的混响消除算法大多是从语音中估计出混响分量，然后进行混响消除，然而运在实际中是很困难的。文献使用Po lack混响统计模型的单麦克风混响消除系统。该混响消除系统根据混响时间来构造化lack混响统计模型，利用化lack混响统计模型估计出后期混响功率谱，最后采用谱减法去除后期混响，达到语音增强的效果。由于该技术要求已知混响时间先估计出后期混响后采用谱减法求解出没受污染部分的分量，实现混响消除。然而实际应用中很难直接得到准确的混响时间，运导致采用谱减法去除后期混响时常会引入一些人工噪声。在过估计时，会产生音乐噪声;欠估计时会有噪声残留。文献提供了WPE(Weighted Prediction lirror)算法的混响消除方法。该方法采用线性滤波的方法进行混响消除。首先对语音进行短时傅里叶变换 (Sho;rt-time Fourier Transform,STFT);然后在频域通过迭代估计出一组最优的线性滤波器的参数;最后采用线性滤波器对STFT系数进行滤波，得到语音中消除混响后的STFT系数估计，实现对混响的消除。该算法在进行迭代估计时需要进行较多的运...

【技术保护点】
一种环境自适应的语音混响消除方法，其特征在于：包括有以下步骤：步骤100：使用混响模型训练装置训练混响模型，并且将训练得到混响模型的存储于音频处理装置的第二存储器中；步骤200：采用RT60获取装置获取当前环境下的RT60值，并且发送给音频处理装置；步骤300：输入获取到的数字语音信号；步骤400：使用音频处理装置中的第二特征提取模块提取输入语音的MFCC，具体步骤与混响模型训练装置中的特征提取一致；步骤500：将原始的特征经过前5帧后4帧的扩展，形成320维数据，再将320维数据的每一维进行均值方差归一化处理；步骤600：根据获取到的RT60值，读取第一存储器里对应的混响模型；步骤700：根据输入的归一化MFCC特征及混响模型，通过混响模型的参数对输入的语音特征进行映射得到混响消除后的语音特征，也就是将提取的归一化MFCC特征作为输入，根据混响模型的参数得到不带混响的语音特征；步骤800：输出混响消除后的语音特征，该输出可作为鲁棒性语音特征供语音识别或说话人识别使用。

【技术特征摘要】

【专利技术属性】
技术研发人员：卓鹏鹏，李稀敏，肖龙源，
申请(专利权)人：厦门快商通信息技术有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人