语音识别方法、装置及电子设备制造方法及图纸

技术编号：10652427 阅读：154 留言：0更新日期：2014-11-19 14:58

本发明专利技术公开了一种语音识别方法、装置及电子设备，属于音视频处理领域。所述方法包括：从获取到的语音信号中提取音频特征；根据所述音频特征识别出音节混淆网络；根据所述音节混淆网络和预设的标音词表生成词语网格；在所述词语网格中计算最优文字序列作为识别结果。本发明专利技术通过以音节而非词语作为基本识别单位，并根据音节混淆网络和词语网格来识别出最优文字序列，解决了现有语音识别方法在词表发生变化时，需要重新构造解码搜索空间，整个技术方案的灵活性较低的问题；达到了即便词表发生变化，但是作为基本识别单位的音节并不会发生改变，无需重新构造解码搜索空间的效果。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种语音识别方法、装置及电子设备，属于音视频处理领域。所述方法包括：从获取到的语音信号中提取音频特征；根据所述音频特征识别出音节混淆网络；根据所述音节混淆网络和预设的标音词表生成词语网格；在所述词语网格中计算最优文字序列作为识别结果。本专利技术通过以音节而非词语作为基本识别单位，并根据音节混淆网络和词语网格来识别出最优文字序列，解决了现有语音识别方法在词表发生变化时，需要重新构造解码搜索空间，整个技术方案的灵活性较低的问题；达到了即便词表发生变化，但是作为基本识别单位的音节并不会发生改变，无需重新构造解码搜索空间的效果。【专利说明】语音识别方法、装置及电子设备
本专利技术涉及音视频处理领域，特别涉及一种语音识别方法、装置及电子设备。
技术介绍
语音识别是将语音信号识别为对应的文字序列的一种技术，广泛应用于人机交互、首视频检索等等领域。现有的语音识别方法大多以词语或者句子作为基本识别单位，大概包括如下步骤：第一，首先提取语音信号中的音频特征；第二，通过维特比解码计算该音频特征在预设的解码搜索网络中的最优文字序列，并将该最优文字序列作为识别结果。具体来讲，该预设的解码搜索网络中通常包括声学模型、词典和语言模型，声学模型通常为基于单音素或者三音素的隐马尔可夫模型，词典包括词语与音素之间的对应关系，语言模型则包括词语与词语之间组合成文字序列时的概率关系。在音频特征输入解码搜索网络后，通过声学模型可以识别出与该音频特征对应的音素序列，通过该音素序列又可以在词典中查询出若干个候选词语，最后通...

【技术保护点】
一种语音识别方法，其特征在于，所述方法包括：从获取到的语音信号中提取音频特征；根据所述音频特征识别出音节混淆网络；根据所述音节混淆网络和预设的标音词表生成词语网格；在所述词语网格中计算最优文字序列作为识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：李露，卢鲤，张翔，饶丰，岳帅，陈波，马建雄，刘海波，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人