上下文相关的汉语语音识别建模方法技术

技术编号：3046269 阅读：239 留言：0更新日期：2012-04-11 18:40

一种上下文相关的汉语语音识别建模方法，基于汉语的语言特点，采用声母右相关和韵母左相关的建模方法，包括步骤：（ａ）将汉语语音的声母与紧邻其右侧的韵母相关，而韵母与紧邻其左侧的声母相关，创建上下文相关的基本建模单元；（ｂ）利用状态聚类法对模型的参数进行训练，以得到初始隐马尔可夫模型（ＨＭＭ）；（ｃ）利用子空间聚类算法对初始隐马尔可夫模型进行压缩，以产生最终模型。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音识别建模方法，特别是能够应用于嵌入式设备的上下文相关的汉语声学建模方法。
技术介绍
语音识别技术是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别技术与语音合成技术相结合可以使人们能够甩掉键盘，通过语音命令进行操作，与机器进行语音交流。近二十年来，随着计算机技术的飞速发展，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。但是，在现阶段，在语音识别技术走向实际应用的过程中，还存在着计算机的计算能力、存储能力和语音识别系统识别率之间的矛盾。怎样在内存有限的嵌入式设备上进行高精度的声学建模是关系到语音识别系统实用化的一个关键性技术问题。中国专利公开CN1264468A揭示了一种将语音输入变换成文字的计算机执行的听写系统。该系统利用文字到语音的结构产生一个给定单词的口语译文，并且这个给定单词口语译文在声音设备上输出，以便语音识别系统的用户知道该语音识别期望一个给定单词将如何发音。中国专利公开CN1288225A揭示了一种语音识别系统和语音识别控制方法。该专利技术的技术方案是在预记录的语音识别表中预先存储作为期望值的操作者的语音。当任意未寄存的端子电子设备连接到控制装置时，控制装置寄存电子设备提供的语音识别表，并在操作者输入语音时，由控制装置把操作者的语音与预寄存的电子设备的语音识别表比较，然后根据操作者的语音与语音识别表的比较结果来控制电子设备的输入/输出。中国专利公开CN1264468A中所揭示的语音识别...

【技术保护点】
一种汉语语音识别建模方法，包括步骤：（ａ）将汉语语音的声母与紧邻其右侧的韵母相关，而韵母与紧邻其左侧的声母相关，创建上下文相关的基本建模单元；（ｂ）利用状态聚类法对模型的参数进行训练，以得到初始隐马尔可夫（ＨＭＭ）模型；和（ｃ）利用子空间聚类算法对初始隐马尔可夫模型进行压缩，以产生最终模型。

【技术特征摘要】
1.一种汉语语音识别建模方法，包括步骤(a)将汉语语音的声母与紧邻其右侧的韵母相关，而韵母与紧邻其左侧的声母相关，创建上下文相关的基本建模单元；(b)利用状态聚类法对模型的参数进行训练，以得到初始隐马尔可夫(HMM)模型；和(c)利用子空间聚类算法对初始隐马尔可夫模型进行压缩，以产生最终模型。2.根据权利要求1所述的其中所述的汉语语音识别建模方法，步骤(b)进一步包括步骤(b1)计算任何两个状态之间进行合并所造成的似然概率的损失；(b2)从步骤b1中计算过的所有可能的状态合并集合中寻找似然概率损失最小的两个状态类的合并；(b3)判断这两个状态类的样本数目是否大于一个固定的阈值；(b4)如果在步骤(b3)中判断样本数目大于一个固定的阈值，将此合并从上述合并的集合中删除；如果这两个状态类中至少有一个状态类的样本数目小于该固定的阈值，则将这两个状态类合并起来生成一个新的状态类，新的状态类的特征空间重新用两个混合的高斯混合模型进行描述；(b5)判断每个状态类的样本数目是否大于另一个固定的阈值，如果大于所述另一个固定阈值，则采用K-Means聚类算法对合并后的各状态输出分布的混合高斯模型进行参数估计；如果至少一个状态的样本数目不大于所述另一个固定阈值，则返回到步骤(b1)。3.根据权利要求2所述的汉语语音识别建模方法，其中所述混合高斯模型的高斯混合数可以被预先设定为一个固定的值，也可以动态确定。4.根据权利要求1所述的汉...

【专利技术属性】
技术研发人员：贾磊，马龙，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人