语音识别方法及其系统技术方案

技术编号:13426305 阅读:69 留言:0更新日期:2016-07-29 14:28
一种为语音信号建立语音模型的方法及其系统,该方法包括:接收训练样本;选定所述训练样本中的一个矢量,并计算所述矢量相对于预设GMM的最大似然值;选择预设数量的GMM,并将这些GMM中包含的PDF的参数建立成高斯参数表,其中GMM的选择是根据其对应的最大似然值进行的;将所述选定的GMM对应的最大似然值分配于HMM中的一个状态,其中,所述最大似然值即为所述矢量为所述HMM状态的概率;以及HMM状态组成序列,生成HMM状态模型,以执行对语音信号的识别。因此,在建立语音模型以进行语音识别时,不需要输入语音信号对应的,可被计算机理解的信息,同时不需要额外的存储空间存储这些信息。从而,在实际应用中,操作更方便,占用的存储空间更少。

【技术实现步骤摘要】
语音识别方法及其系统
本专利技术涉及语音识别技术,尤其涉及一种基于隐马尔可夫模型的语音识别方法及其系统。
技术介绍
现有利用隐马尔可夫模型(HiddenMarkovModel,HMM)进行声音识别的系统,引入了概率统计模型,是一种有效的语音识别的算法,因此,得到了广泛的应用,例如,可用于识别孤立的词或者连续的语言。现有HMM算法生成的语音模型必须配合相应的标签才能实现语音识别的功能。具体的说,通过训练过程生成的语音模型本身不具有可被计算机识别的信息,因此需要通过标签或关键字等信息对其进行标注,以实现语音识别。所以,在实际应用中,就需要用户通过键盘等输入装置将这些标签或关键字信息输入。由此可见,现有HMM算法生成的语音模型,在被用于语音识别系统中时,会造成操作不方便的问题。同时,还需要额外的存储空间用于存储这些输入的标注信息,从而对存储空间的容量有更高的要求。
技术实现思路
本专利技术解决的问题是使得语音信号模型的建立不需要输入标签即可被计算机理解。为解决上述问题,本专利技术提供了一种为语音信号建立识别模型的方法,包括:接收所述语音信号的训练样本;计算所述训练样本中的矢量相对于多个预设高斯本文档来自技高网...

【技术保护点】
一种为语音信号建立识别模型的方法,其特征在于,包括:接收所述语音信号的训练样本;计算所述训练样本中的矢量相对于多个预设高斯混合模型的最大似然值;在所述多个预设高斯混合模型中选择第一组高斯混合模型,其中所述第一组高斯混合模型的选择是根据所述多个预设高斯混合模型对应的最大似然值进行的;将选定的所述第一组高斯混合模型对应的最大似然值分别分配于隐马尔可夫模型中的状态,其中,每个所述最大似然值即为所述矢量为对应状态的概率;以及,将所述训练样本的多个矢量对应的状态组成序列,生成隐马尔可夫状态模型。

【技术特征摘要】
1.一种为语音信号建立识别模型的方法,其特征在于,包括:接收所述语音信号的训练样本;计算所述训练样本中的矢量相对于多个预设高斯混合模型的最大似然值;在所述多个预设高斯混合模型中选择第一组高斯混合模型,其中所述第一组高斯混合模型的选择是根据所述多个预设高斯混合模型对应的最大似然值进行的;将选定的所述第一组高斯混合模型对应的最大似然值分别分配于隐马尔可夫模型中的状态,其中,每个所述最大似然值即为所述矢量为对应状态的概率;以及,将所述训练样本的多个矢量对应的状态组成序列,生成隐马尔可夫状态模型。2.根据权利要求1所述的方法,其特征在于,所述第一组高斯混合模型的数量为N,所述第一组高斯混合模型为所述多个预设高斯混合模型中最大的N个最大似然值对应的高斯混合模型,N为正整数。3.根据权利要求2所述的方法,其特征在于,所述第一组高斯混合模型为所述多个预设高斯混合模型中最大似然值大于预设阈值的所有高斯混合模型。4.根据权利要求1所述的方法,其特征在于,所述多个预设高斯混合模型是通过语音数据库训练而来的。5.根据权利要求1所述的方法,其特征在于,所述方法还进一步包括,将所述第一组高斯混合模型中包含的概率密度函数的参数建立成高斯参数表;以及,对所述高斯参数表进行聚类,将相近似的高斯聚为一类,以生成高斯边界。6.根据权利要求5所述的方法,其特征在于,所述高斯参数表的聚类是通过相邻栏之间的距离进行的。7.根据权利要求5所述的方法,其特征在于,所述方法还进一步包括,从高斯边界表的一类中选择第二组高斯混合模型,并将选定的所述第二组高斯混合模型对应的最大似然值分别分配于隐马尔可夫模型中的状态。8.一种为语音信号建立识别模型的系统,包括:...

【专利技术属性】
技术研发人员:孙廷玮林福辉
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1