一种基于后验知识监督的噪声鲁棒声学建模方法技术

技术编号：19748227 阅读：33 留言：0更新日期：2018-12-12 05:15

本发明专利技术公开了一种基于后验知识监督的噪声鲁棒声学建模方法，属于语音人机交互技术领域，该方法包括：通过老师模型的训练得出干净语音的后验概率分布；以所述干净语音的后验概率分布为标准来监督学生模型的训练，使学生模型无限逼近老师模型的后验概率分布；其中，所述老师模型为干净语音训练的模型，所述学生模型为带噪语音训练的模型。本发明专利技术示例的建模方法，建立的声学模型具有较强的环境鲁棒性，表现出优越的抗噪性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于后验知识监督的噪声鲁棒声学建模方法
本专利技术属于语音人机交互
，具体的说是一种基于后验知识监督的噪声鲁棒声学建模方法。
技术介绍
近年来，随着语音识别、自然语言处理、深度学习等技术的发展和市场需求的不断深化，语音交互产品的研发与应用逐渐成为一个新的热点；另一方面，由于实际应用场景的复杂性，语音交互系统的运行通常处在一个低信噪比的环境下，由于对噪声的抗干扰能力不足，系统交互过程中经常会出现语音识别准确率低或人机交互混乱等情况，导致服务对象的交互体验感不佳，很大程度上限制了语音交互产品的市场应用及推广。相关研究表明，语音声学模型能否从带噪语音中提取出完整音素信息是决定语音交互系统噪声鲁棒性的关键，声学模型在噪声鲁棒性上的不足主要是模型构建阶段环境噪声导致训练数据与测试数据不匹配而造成的，即提高噪声鲁棒性的目的是要最大限度的降低或消除此类因素的影响。迄今为止，语音识别领域的诸多学者对声学模型噪声鲁棒性开展了广泛研究并提出了多种改进策略，其中应用效果较好的有特征补偿、模型补偿、鲁棒性特征提取和语音增强四种方法。特征与模型补偿是通过自适应算法对声学模型进行优化处理的噪声鲁棒性方法。例如Leggetter等利用最大似然回归(MLLR)算法进行模型自适应；Tran等通过线性分解网络对基于深度神经网络(DNN)的声学模型训练的输入数据进行自适应处理，使声学模型能够较好的匹配带噪语音的数据结构，模型鲁棒性得到提升。鲁棒性特征提取是指从语料中提炼出对于噪声不敏感的特征参数，构建抗噪能力强的特征序列,从而提高声学模型的噪声鲁棒性。倒谱均值归一化法(CMN)和均值...

【技术保护点】
1.一种基于后验知识监督的噪声鲁棒声学建模方法，其特征是，包括：通过老师模型的训练得出干净语音的后验概率分布；以所述干净语音的后验概率分布为标准来监督学生模型的训练，使学生模型无限逼近老师模型的后验概率分布；其中，所述老师模型为干净语音训练的模型，所述学生模型为带噪语音训练的模型。

【技术特征摘要】
1.一种基于后验知识监督的噪声鲁棒声学建模方法，其特征是，包括：通过老师模型的训练得出干净语音的后验概率分布；以所述干净语音的后验概率分布为标准来监督学生模型的训练，使学生模型无限逼近老师模型的后验概率分布；其中，所述老师模型为干净语音训练的模型，所述学生模型为带噪语音训练的模型。2.根据权利要求1所述的基于后验知识监督的噪声鲁棒声学建模方法，其特征是，所述老师模型的训练，包括：对干净语音进行特征Xt提取；对分窗后的特征Xt进行逐帧强制对齐，并得到每一帧语音数据的硬标注；在强制对齐的基础上对每一个硬标注进行时间维度上的起止点标注；将所述起止点标注信息与硬标注数据作为监督信息送入DNN模块进行声学模型的建模训练。3.根据权利要求2所述的基于后验知识监督的噪声鲁棒声学建模方法，其特征是，所述对分窗后的特征进行逐帧强制对齐，通过GMM-HMM模块进行。4.根据权利要求2所述的基于后验知识监督的噪声鲁棒声学建模方法，其特征是，所述声学模型的建模训练，包括：将特征Xt作为模型输入，音素硬标注与标注数据作为监督信息，利用前向算法得出逐帧数据的三因素后验概率分布。5.根据权利要求1所述的基于后验知识监督的噪声鲁棒声学建模方法，其特征是，所述学生模型的训练，包括：对带噪语音进行初步特征Xs提取；提取出的音素特征Xs与老师模型的软标注进行平行对齐，从而得...

【专利技术属性】
技术研发人员：潘子春，李葵，李明，张引强，黄影，赵峰，吴立刚，徐海青，章爱武，陈是同，徐唯耀，秦浩，王文清，郑娟，秦婷，梁翀，浦正国，张天奇，余江斌，韩涛，杨维，张才俊，
申请(专利权)人：国网安徽省电力有限公司信息通信分公司，国网信息通信产业集团有限公司，安徽继远软件有限公司，国家电网有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人