一种低资源嵌入式语音识别的拒识方法技术

技术编号：12850132 阅读：93 留言：0更新日期：2016-02-11 15:16

本发明专利技术涉及一种低资源嵌入式语音识别的拒识方法，该方法包括：基于命令词表和垃圾音素列表，分别构建命令词解码网络和垃圾音素解码网络，将垃圾音素解码网络并联到命令词解码网络中，形成完整的解码网路空间；生成语音背景概率得分表。将待识别语音输入解码网络空间进行第一次识别：解码识别，对第一次识别结果中的垃圾因素拒识，再对第一次识别结果中的命令词进行第二次判别：置信度判别，得到最终识别结果。本方法可提高对集外词的拒识率，节省内存占用，满足了低资源条件嵌入式语音识别的应用需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别领域，具体地说，本专利技术涉及一种低资源嵌入式识别的拒识方法。
技术介绍
在语音识别系统的应用中，经常出现集外词，噪声等非正确语音，因此对识别结果的拒识非常重要。一般来说，为保证识别结果有比较高的识别率，系统往往给出尽可能多的候选；如何拒识错误的候选成为关键问题。置信度判别技术就是送个问题的有效解决办法。可靠的置信度计算在很多应用场合十分有效。例如，在噪音或背景音乐环境下，识别结果会出现一些错误，对于送些错误的识别结果，应该分配较低的置信度加W拒识，从而有效地降低虚警。目前，语音识别中有很多置信度计算方法（文献 =Wessel F. Word Posterior Probabilities for Large Vocabulary Continuous Speech Recognition. PH D Dissedation，2002.)。基于声学模型的置信度计算方法就是常用的一种方法，送种方法可W在整个声学空间上计算命令词的置信度，对于命令词语音的每一顿观测序列，首先计算出其后验概率，然后通过计算对数域的算术均值就可W得到整个命令词的置信度（文献巧];刘镜.语音识别中置信度分析的理论和应用.硕±学位论文，2000.)，通过合适的置信度域值，郝些错误的识别结果就可W被拒识。然而，传统的置信度计算方法对计算速度和存储空间都有比较高的要求，致使其在低资源应用上遇到了一定的障碍，很难达到实时识别的要求。伴随着个人移动通信和移动计算的迅猛发展，资源受限的小型手持设备迫切需要带有拒识功能的语音识别技术...

【技术保护点】
一种低资源嵌入式语音识别的拒识方法，包括：基于命令词表，构建命令词的解码网络；基于垃圾音素列表，构建垃圾音素解码网络；将垃圾音素解码网络并联到命令词解码网络中，形成完整的解码网路空间；生成语音背景概率得分表；采用二次判别拒识方法对待识别语音进行识别，其中所述的二次判别拒识方法为：对待识别语音进行第一次识别，对第一次识别结果中的垃圾因素拒识，再对第一次识别结果中的命令词进行第二次判别，得到最终识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：张鹏远，潘接林，颜永红，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人