【技术实现步骤摘要】
本专利技术属于语音识别
,具体涉及到用测试环境下的少量自适应语音调整 训练环境下得到的声学模型的参数,使之与实际环境相匹配,提高语音识别系统鲁棒性的 模型自适应方法。
技术介绍
由于环境噪声、说话人的改变等因素的存在,实际环境与训练环境往往存在较大 的差异,这会导致语音识别系统的性能急剧下降。鲁棒语音识别的目的就是减小环境失配 的影响,提高语音识别系统在实际应用中的识别性能。 -般来说,鲁棒语音识别算法可以划分为两类:前端特征域方法和后端模型域方 法。在前端特征补偿中,对测试环境下提取的特征参数进行补偿,使之与预先训练的声学模 型相匹配。在后端,对预先训练的声学模型的参数进行调整,使之与当前环境下的特征参数 相匹配,这类方法称为模型自适应。相对于前端特征补偿,模型自适应能同时减小语音变异 性和环境噪声的影响,因而可以得到更好的补偿效果。 为了解决数据稀疏问题,最大似然线性回归(MLLR:MaximumLikelihoodLinear Regression)算法假设环境失配只影响声学模型每个高斯单元的均值向量,因而只需要将 训练环境声学模型的每个均值向量变换到测试环境,即可得到与当前环境匹配的测试环境 均值向量。在MLLR算法中,属于多个高斯单元的自适应数据被用于估计同一组变换参数, 因而可以提高数据稀疏时参数估计的准确性。 在子带算法中,Mel滤波器组的全部通道被划分为几个子带,假设同一个子带内的 所有通道共享同一个环境变换函数,因此可以进一步增加参数估计的数据量,提高模型自 适应的精度。然而,这种子带假 ...
【技术保护点】
一种用于语音识别系统的中心子带模型自适应方法,其特征在于,具体包括:(1)为了解决模型自适应的数据稀疏问题,进一步增加参数估计的数据量,对频域上相邻Mel通道的自适应数据进行合并,估计同一组变换参数;(2)每个Mel通道保留各自的环境变换关系,以每个Mel通道为中心通道,与其前后各若干个Mel通道共享自适应数据,估计变换参数,估得的变换参数仅用于当前中心Mel通道,其他Mel通道的变换参数需要重新估计;(3)第一个Mel通道仅与其后面的若干个通道共享自适应数据,最后一个Mel通道仅与其前面若干个通道共享自适应数据;(4)Mel滤波器组每个通道的变换参数不需要一一估计,而是将其划分为Nm类,每一类的变换参数通过对Mel滤波器组全部通道的一次子带划分及其子带自适应得到。
【技术特征摘要】
1. 一种用于语音识别系统的中心子带模型自适应方法,其特征在于,具体包括: (1) 为了解决模型自适应的数据稀疏问题,进一步增加参数估计的数据量,对频域上相 邻Mel通道的自适应数据进行合并,估计同一组变换参数; (2) 每个Mel通道保留各自的环境变换关系,以每个Mel通道为中心通道,与其前后各 若干个Mel通道共享自适应数据,估计变换参数,估得的变换参数仅用于当前中心Mel通 道,其他Mel通道的变换参数需要重新估计; (3) 第一个Mel通道仅与其后面的若干个通道共享自适应数据,最后一个Mel通道仅与 其前面若干个通道共享自适应数据; (4) Mel滤波器组每个通道的变换参数不需要一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。