一种基于迁移学习的带噪语音识别方法技术

技术编号:20847121 阅读:47 留言:0更新日期:2019-04-13 09:13
本发明专利技术提出一种基于迁移学习的带噪语音识别方法,所述方法包括判断迁移学习是否适用于带噪语音的声学建模,若是,则建立教师模型和学生模型,并利用教师模型指导学生模型进行训练,本发明专利技术实施例提出的基于迁移学习的带噪语音识别方法,利用教师模型指导学生模型进行训练,能够有效地将教师模型中的后验概率信息迁移至学生模型中,从而提高声学模型在带噪数据集尤其是低信噪比数据集上的鲁棒性。使得系统在带噪语音环境下的识别准确率有了提升。

【技术实现步骤摘要】
一种基于迁移学习的带噪语音识别方法
本专利技术涉及信号处理领域,具体的涉及到一种基于迁移学习的带噪语音识别方法。
技术介绍
随着语音识别技术的发展,噪声成为语音识别系统广泛实用化的关键因素。目前已有的解决噪声环境下语音识别鲁棒性的主要方法有:(1)采用自适应算法训练鲁棒性声学模型;(2)直接利用带噪语音数据训练声学模型;(3)先对带噪语音进行增强处理,然后利用处理后的数据训练声学模型。这三种方法都是在干净语音和带噪语音的平行数据已知的前提下进行的,且在方法上或将干净语音直接作为训练数据,或将其作为降噪处理的参考标准,并未最大限度地挖掘干净语音的知识。中国专利CN201110258884.7一种基于MFCC远距离差值的鲁棒语音识别方法,采用远距离差值作为语音识别特征参数,但该专利不能将老师模型中的后验概率信息迁移至学生模型中,从而提高声学模型在带噪数据集上的鲁棒性。
技术实现思路
基于上述问题,本专利技术的目的旨在至少解决所述技术缺陷之一。提出一种基于迁移学习的带噪语音识别方法,利用教师模型指导学生模型进行训练,能够有效地将教师模型中的后验概率信息迁移至学生模型中,从而提高声学模型在带噪数本文档来自技高网...

【技术保护点】
1.一种基于迁移学习的带噪语音识别方法,其特征在于,所述方法包括判断迁移学习是否适用于带噪语音的声学建模,若是,则建立教师模型和学生模型,并利用教师模型指导学生模型进行训练。

【技术特征摘要】
1.一种基于迁移学习的带噪语音识别方法,其特征在于,所述方法包括判断迁移学习是否适用于带噪语音的声学建模,若是,则建立教师模型和学生模型,并利用教师模型指导学生模型进行训练。2.根据权利要求1所述的基于迁移学习的带噪语音识别方法,其特征在于,所述判断迁移学习是否适用于带噪语音的声学建模的步骤包括:采用MFCC提取干净语音和带噪语音的特征并构成特征向量;计算干净语音特征向量和带噪语音特征向量之间的最大均值差异MMD;判断所述MMD是否小于阈值,若是,则适用于带噪语音的声学建模。3.根据权利要求1所述的基于迁移学习的带噪语音识别方法,其特征在于,所述利用教师模型指导学生模型进行训练的方法包括:采用MFCC提取干净语音和带噪语音的特征并构成特征向量;生成GMM-HMM模型;生成硬标签;训练老师模型;生成软标签;训练学生模型。4.根据权利要求2所述的基于迁移学习的带噪语音识别方法,其特征在于,所述采用MFCC提取干净语音和带噪语音的特征并构成特征向量的步骤包括:对语音进行预加重、分帧和加窗处理后对每一个短时分析窗通过FFT得到对应的频谱,并通过滤波器组得到Mel频谱,并在Mel频谱上进行倒谱分析。5.根...

【专利技术属性】
技术研发人员:潘成华李参宏万莉
申请(专利权)人:江苏网进科技股份有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1