【技术实现步骤摘要】
本专利技术涉及,具体涉及到用预先训练的多个环境的语音模型对实际环境下提取的含噪语音特征向量进行补偿,减小环境失配,提高语音识别系统鲁棒性的多环境特征补偿方法;属于语音识别
技术介绍
语音识别技术已经在通信、消费电子、自助服务、智能家居等多个领域得到了广泛应用。然而在实际应用中,由于背景噪声、信道失真、语音自身变异性等因素的存在,测试环境与训练环境无法匹配,往往导致语音识别系统的性能急剧恶化。传统的前端特征补偿和后端模型自适应技术都是基于纯净语音模型的,即将训练 环境中得到的纯净语音模型变换到实际测试环境,用于估计纯净语音特征向量(特征补偿)或直接对含噪测试语音进行识别(模型自适应)。但是,在低信噪比等与纯净语音环境差异较大的测试环境中,通过变换纯净语音模型得到的含噪语音模型不能很好地描述含噪语音的分布,其识别性能与直接用含噪测试语音训练的理想系统有较大差距。多环境技术可以较好地解决环境严重失配的问题,在训练阶段用多个基本训练环境预测实际测试环境,选取与测试环境最匹配的基本训练环境用于模型变换。现有的多环境技术都是在系统的后端进行,即多环境模型自适应,在 ...
【技术保护点】
一种用于语音识别系统的多环境特征补偿方法,其特征在于:包括训练阶段步骤和测试阶段步骤;训练阶段的具体步骤包括:(1)在实际应用环境中采集各种噪声;在训练阶段用多个基本训练环境预测实际测试环境,用多个基本训练环境语音模型取代单一纯净训练语音模型;(2)根据噪声类型和强度对采集的噪声进行聚类,将噪声归类到若干个基本训练环境中;(3)用每个基本训练环境的噪声与训练语音混合,得到该基本训练环境的含噪训练语音;(4)对每个基本训练环境的训练语音进行模型训练,得到该基本训练环境的语音模型,用高斯混合模型对每个基本训练环境进行建语音模型,得到该基本训练环境GMM每个高斯单元的混合系数cm ...
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。