一种提高语音识别准确率的方法及系统技术方案

技术编号：10182720 阅读：170 留言：0更新日期：2014-07-03 13:23

本发明专利技术公开了一种提高语音识别准确率的方法及装置，其中，该方法包括：根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配，获得新的路径集合；通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正；根据校正后的候选字词的语言模型概率进行语音解码处理。通过采用本发明专利技术公开的方法，提高了对用户特定信息及该信息上下文内容的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种提高语音识别准确率的方法及系统
本专利技术涉及语音信号处理领域，尤其涉及一种提高语音识别准确率的方法及系统。
技术介绍
随着手机等智能终端上语音输入功能和应用的普及，用户在手机等智能终端上使用语音输入的需求越来越多，对用户个性化信息，尤其是通讯录中联系人的识别准确率也提出了更高的要求。而传统连续语音识别系统由于语言模型训练方式及识别方法的局限性，对存在多音字现象的汉语语音信号可能无法提供正确的字词结果，特别是在人名信息识别中，其识别准确率更受到了进一步的限制：首先，中文常见人名数量众多，对此连续语音识别的词典中通常将人名字词作为未登录词处理，导致训练语料中覆盖的人名数量极其有限；其次，中文人名同音字大量存在，常见人名有几十个甚至更多的汉字组合；再次，对每个用户来说，用户特有的个性化通讯录中联系人人名可能还会有一部分非常用人名，即每个个性化的人名列表在训练语料中无法均匀覆盖。基于以上原因，用于连续语音识别的语言模型不能很好的模拟人名字词特别是用户个性化联系人名字词，人名识别效果也往往明显低于其他内容的识别效果，在应用连续语音识别的语音输入法等应用中个性化人名的识...
一种提高语音识别准确率的方法及系统

【技术保护点】
一种提高语音识别准确率的方法，其特征在于，包括：根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配，获得新的路径集合；通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正；根据校正后的候选字词的语言模型概率进行语音解码处理。

【技术特征摘要】
1.一种提高语音识别准确率的方法，其特征在于，包括：根据用户预置信息对通过语音解码获得的路径集合中的候选字词进行匹配，获得新的路径集合；通过以所述用户预置信息为元素构建的分类语言模型对所述新的路径集合中候选字词的语言模型概率进行校正；根据校正后的候选字词的语言模型概率进行语音解码处理；其中，所述获得新的路径集合包括：第一次解码与第二次解码两个过程；第一次解码时，将连续语音信号数字采样为一系列离散能量值存入数据缓存区，提取语音信号中的声学特征序列，并采用快速搜索算法在由简单声学模型和大规模不受限的低阶语言模型构成的搜索空间对提取的简单声学特征进行粗略匹配，过滤不合理的识别结果获取最优路径集合；第二次解码时，首先，读取用户预置信息，该预置信息包括通讯录中的联系人、联系人所在地和/或通过其他软件预留的文字信息；若预置信息为通讯录中的联系人，则将第一次解码得到的路径集合中所有的候选字词转化为拼音，并与用户预留的人名拼音进行模糊匹配，获得新的路径集合；具体的：将人名拼音关键词和路径集合拼音串的匹配，对用户联系人名列表中的每条人名拼音串在所述解码结果拼音串集合中进行子串匹配，确定匹配关系；匹配获得一个新的路径，而新的路径位于匹配成功的候选字词对应起始节点和终止节点之间。2.根据权利要求1所述的方法，其特征在于，以所述用户预留信息为元素构建语言模型的步骤包括：构建与所述用户预留信息的类型相应的语言数据库，并将该用户预留信息加入该语言数据库中；根据该语言数据库检测语言模型训练语料中与所述预留信息的类型相应的字词；将检测到的字词分别标注为独立单元，获得更新后的语言模型训练语料；将该训练语料按照训练算法转换为分类语言模型。3.根据权利要求1所述的方法，其特征在于，所述对所述新的路径集合中语言模型的概率进行校正包括：通过所述分类语言模型查询新的路径集合中候选字词的语言模型概率，并根据该结果对其原始的概率进行校正。4.一种提高语音识别准确率的系统，其特征在于，该系统包括：匹配模块，用于根据用户预置信息对通过语音解码获得的路径集合中的候选字词...

【专利技术属性】
技术研发人员：潘青华，何婷婷，余健，鹿晓亮，王智国，胡国平，胡郁，刘庆峰，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人