一种计算机多方言背景的汉语普通话语音识别的建模方法技术

技术编号：3048337 阅读：382 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种计算机多方言背景的汉语普通话语音识别的建模方法，属于计算机语音识别技术领域。本方法先根据标准普通话的训练数据建立基于三音子的标准普通话模型，同时分别根据方言口音普通话１和２的训练数据建立基于单音子的方言口音普通话模型１和２；然后根据标准普通话模型识别方言口音普通话１的测试数据得到的混淆矩阵１将方言口音普通话模型１归并到标准普通话模型中得临时归并模型；最后根据临时归并模型识别方言口音普通话２的测试数据得到的混淆矩阵２将方言口音普通话模型２归并到临时归并模型中得到识别模型。本发明专利技术方法有效地提高了工作效率，明显提高对方言口音普通话的识别率，同时对于标准普通话的识别率也有所提升。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及，属于计算机语音识别

技术介绍
提高稳健性一直是语音识别的重点也是难点，而口音问题正是导致稳健性降低的主要原因之一。对汉语来说，由于方言众多，口音问题显得更加突出，也更具有研究价值。目前的语音识别系统对于标准普通话的识别率很高，但是对于具有方言口音的普通话识别率则很低。对于这个问题，一般的解决方案是采用自适应等方法，但是这样做的前提是有足够多的方言口音普通话数据，而且这种方法会导致标准普通话识别率的显著下降。另一方面，由于方言的种类很多，如果针对每个方言都需要重新训练码本的话，工作效率将很低。
技术实现思路
本专利技术的目的是提出，以便在数据量较小的情况下提高带方言口音普通话的识别率，同时又保证对标准普通话的识别率不会显著下降。本专利技术提出的计算机多方言背景的汉语普通话语音识别的建模方法，包括以下各步骤 (1)根据标准普通话的训练数据建立一个基于三音子的标准普通话模型，根据第一种方言口音普通话的训练数据建立基于单音子的方言口音普通话模型1，根据第二种方言口音普通话的训练数据建立基于单音子的方言口音普通话模型2； ...

【技术保护点】
一种用于多方言背景的汉语普通话语音识别的建模方法，其特征在于该方法包括以下各步骤：　（１）根据标准普通话的训练数据建立一个基于三音子的标准普通话模型，根据第一种方言口音普通话的训练数据建立基于单音子的方言口音普通话模型１，根据第二种方言口音普通话的训练数据建立基于单音子的方言口音普通话模型２；　（２）使用上述标准普通话模型识别第一种方言口音普通话的测试数据，得到混淆矩阵１，根据混淆矩阵１将方言口音普通话模型１归并到标准普通话模型中，得到临时归并模型；　（３）使用上述临时归并模型识别第二种方言口音普通话的测试数据，得到混淆矩阵２，根据混淆矩阵２将方言口音普通话模型２归并到上述临时归并模型中，得到...

【技术特征摘要】
1、一种用于多方言背景的汉语普通话语音识别的建模方法，其特征在于该方法包括以下各步骤(1)根据标准普通话的训练数据建立一个基于三音子的标准普通话模型，根据第一种方言口音普通话的训练数据建立基于单音子的方言口音普通话模型1，根据第二种方言口音普通话的训练数据建立基于单音子的方言口音普通话模型2；(2)使用上述标准普通话模型识别第一种方言口音普通话的测试数据，得到混淆矩阵1，根据混淆矩阵1将方言口音普通话模型1归并到标准普通话模型中，得到临时归并模型；(3)使用上述临时归并模型识别第二种方言口音普通话的测试数据，得到混淆矩阵2，根据混淆矩阵2将方言口音普通话模型2归并到上述临时归并模型中，得到识别模型。2、如权利要求1所述的建模方法，其特征在于步骤(2)和(3)中所述的归并方法为用x表示被识别语音的...

【专利技术属性】
技术研发人员：郑方，肖熙，刘林泉，游展，曹文晓，赤羽诚，陈如新，高桥良和，
申请(专利权)人：清华大学，索尼电脑娱乐公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人