实现多语种混合使用的语音识别方法技术

技术编号：12384166 阅读：74 留言：0更新日期：2015-11-25 15:26

本发明专利技术公开了一种实现多语种混合使用的语音识别方法，涉及语音识别技术领域。包括如下步骤：在云端提供多种语音识别服务器和一个识别文本后处理服务器；用户通过终端把实时语音通过网络同时传送给多个语音识别服务器；多个语音识别服务器同时进行语音识别，然后把各自的识别结果文本发送给识别文本后处理服务器，进行处理；识别文本后处理服务器根据整体语义的解析，提供第一种语言结果中的有效部分M，以及第二种语言结果中的有效部分N，然后将M和N拼接成最终的识别结果，通过网络发送给用户终端；用户终端获取到多种语音混用的正确识别结果。所述方法能够实现对多种混合使用的语音信息进行有效识别，扩大了应用范围。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别方法
，尤其涉及一种实现多语种混合使用的语音识别方法。
技术介绍
现有的语音识别系统都是针对单个语种进行优化设计的，在同一时间内只能实现单种语言（比如，中文普通话或英语）的语音识别，无法满足混合语音用户的使用需求，比如喜欢中英文混读的人群。造成这种现象的原因有很多，例如基本识别单元的选择差异。在语音识别过程中，选择识别单元是语音识别第一步基础。语音识别单元有单词 (句）、音节和音素三种，一般都会根据具体的需求选择不同的识别单元。一般的选择策略如下： 1)单词（句）单元广泛应用于中小词汇语音识别系统，但不适合大词汇系统，原因在于模型库太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。 2)音节单元多见于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，并且汉语虽然有大约1300个音节，但若不考虑声调，约有408个无调音节，数量相对较少。因此，对于中、大词汇量汉语语音识别系统来说，以音节为识别单元是比较常见的。 3)音素单元以前多见于英语和其他字母型语言的语音识别的研究中。基于以上原因，基于单个语音识别引擎很难做到对不同语种的高精度识别，因此无法实现混合语音的识别。
技术实现思路
本专利技术所要解决的技术问题是提供一种，所述方法能够实现对多种混合使用的语音信息进行有效识别，扩大了应用范围。为解决上述技术问题，本专利技术所采取的技术方案是：一种实现多语种混合使用的语音识别方法，其特征在于所述方法包括如下步骤： 1)在云端提供多种语音识别服务器和一个识别文本后处理服务...

【技术保护点】
一种实现多语种混合使用的语音识别方法，其特征在于所述方法包括如下步骤：1)在云端提供多种语音识别服务器和一个识别文本后处理服务器；2)用户通过终端把实时语音通过网络同时传送给多个语音识别服务器；3)多个语音识别服务器同时进行语音识别，然后把各自的识别结果文本发送给识别文本后处理服务器，进行处理；4)识别文本后处理服务器基于N元文法规则建立N‑gram模型库，针对整体语义进行解析，去掉不符合N元文法规则的部分，保留第一种语言结果中的有效部分M，以及第二种语言结果中的有效部分N，以此类推，然后将M和N拼接成最终的识别结果，通过网络发送给用户终端；5)用户终端获取到多种语音混用的正确识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：于拾全，卫亚东，田学红，
申请(专利权)人：东莞市凡豆信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人