基于垃圾模型的语音识别处理方法及装置制造方法及图纸

技术编号：12520412 阅读：143 留言：0更新日期：2015-12-17 11:16

本申请提出一种基于垃圾模型的语音识别处理方法和装置，其中，该方法包括：获取待处理的音节列表中与每个音节对应的三音子模型；采用预先训练的隐马尔可夫模型，根据所述三音子模型获取与每个音节对应的三音子状态序列；根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，其中，所述多个建模音节的数量与预先设置的垃圾模型数目相同；应用所述多个建模音节生成对应数量的多个垃圾模型。实现了建立与应用需要匹配数量的、基于音节聚类的垃圾模型，从而提高了建模组网的效率和灵活性，以及提高了语音识别处理的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于垃圾模型的语音识别处理方法及装置
本申请涉及语音识别处理
，尤其涉及一种基于垃圾模型的语音识别处理方法及装置。
技术介绍
语音识别的关键词检测系统中，通常会预先设定一个集内词表，对于集内词表外的词，系统要求有拒绝识别的能力。目前通用的做法是把所有训练数据用来训练一个通用的垃圾模型(Universalgarbagemodel)，或者把训练的数据划分为元音(vowel)和辅音(consonant)两类，分别训练两个垃圾模型，用来模拟不同的集外词情况。然而，采用一个或者两个垃圾模型进行语音识别，划分的颗粒度过粗，不能很好的模拟不同的集外词情况，导致识别错误的概率较高，降低了语音识别的准确性。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的第一个目的在于提出一种基于垃圾模型的语音识别处理方法，该方法实现了建立与应用需要匹配数量的、基于音节聚类的垃圾模型，从而提高了建模组网的效率和灵活性，以及提高了语音识别处理的准确性。本申请的第二个目的在于提出一种基于垃圾模型的语音识别处理装置。为达上述目的，本申请第一方面实施例提出了一种基于垃圾模型的语音识别处理方法，包括：获取待处理的音节列表中与每个音节对应的三音子模型；采用预先训练的隐马尔可夫模型，根据所述三音子模型获取与每个音节对应的三音子状态序列；根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，其中，所述多个建模音节的数量与预先设置的垃圾模型数目相同；应用所述多个建模音节生成对应数量的多个垃圾模型，以采用所述多个垃圾模型进行语音识别处理。本申请实施例的基...
基于垃圾模型的语音识别处理方法及装置

【技术保护点】
一种基于垃圾模型的语音识别处理方法，其特征在于，包括以下步骤：获取待处理的音节列表中与每个音节对应的三音子模型；采用预先训练的隐马尔可夫模型，根据所述三音子模型获取与每个音节对应的三音子状态序列；根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，其中，所述多个建模音节的数量与预先设置的垃圾模型数目相同；应用所述多个建模音节生成对应数量的多个垃圾模型，以采用所述多个垃圾模型进行语音识别处理。

【技术特征摘要】
1.一种基于垃圾模型的语音识别处理方法，其特征在于，包括以下步骤：获取待处理的音节列表中与每个音节对应的三音子模型；采用预先训练的隐马尔可夫模型，根据所述三音子模型获取与每个音节对应的三音子状态序列；根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，其中，所述多个建模音节的数量与预先设置的垃圾模型数目相同；应用所述多个建模音节生成对应数量的多个垃圾模型，以采用所述多个垃圾模型进行语音识别处理；所述根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，包括：计算每两个三音子状态序列之间的距离；将所述距离低于预设的门限值的音节从所述音节列表中删除；若判断获知剩余的音节数量与预先设置的垃圾模型数目相同，则停止删除，若判断获知剩余的音节数量大于预先设置的垃圾模型数目，调整所述门限值，继续删除。2.如权利要求1所述的基于垃圾模型的语音识别处理方法，其特征在于，所述三音子模型的类型，从左到右依次包括：静音、元音、辅音；或者，元音、辅音、静音；或者，静音、元音、携音调的辅音；或者，元音、携音调的辅音、静音。3.如权利要求1或2所述的基于垃圾模型的语音识别处理方法，其特征在于，所述应用所述多个建模音节生成对应数量的多个垃圾模型之后，所述方法还包括：采用所述多个垃圾模型生成拒识网络；应用所述拒识网络和预先建立的识别网络建立语音识别网络。4.如权利要求3所述的基于垃圾模型的语音识别处理方法，其特征在于，还包括：采用所述语音识别网络对输入的语音指令进行识别；若判断获知所述拒识网络的识别权重大于所述识别网络，则确定所述语音指令属于集外词，输出拒识响应；若判断获知所述拒识网络的识别权重小于所述识别网络，则确定所述语音指令属于预设的集内词表，输出识别结果。5.一种基于垃圾模...

【专利技术属性】
技术研发人员：穆向禹，彭守业，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人