语音识别方法、装置、终端和计算机可读存储介质制造方法及图纸

技术编号：17163359 阅读：41 留言：0更新日期：2018-02-01 21:17

本发明专利技术公开了一种语音识别方法，包括根据采集到的语音的声学特征，计算所述语音与解码网络中的音素序列的声学相似概率；其中所述解码网络包括多组音素序列；每一组音素序列对应一个预设的命令词内容或对应噪音内容；根据所述声学相似概率，获得所述语音与所述音素序列的匹配概率；将所述语音识别为匹配概率最高的音素序列所对应的内容。相应地，本发明专利技术还公开一种语音识别装置、终端和计算机可读存储介质。本发明专利技术实现避免将噪音识别为命令词，且无需在语音识别后计算置信度，达到降低误识别率的效果。

Speech recognition methods, devices, terminals and computer readable storage media

The invention discloses a method of speech recognition, including according to the acoustic characteristics of speech acquisition to the calculation of the voice acoustic phoneme sequence and decoding in the network is similar to the probability; wherein the decoding network comprises a plurality of phoneme sequences; phoneme sequences of each group corresponding to a preset command word content or the corresponding noise according to the content; the acoustic similarity probability, the probability of obtaining matching speech with the phoneme sequence; the speech recognition for matching corresponding phoneme sequences of the highest probability content. Accordingly, the invention also discloses a speech recognition device, a terminal and a computer readable storage medium. The invention avoids the recognition of noise as a command word, and does not need to calculate confidence after speech recognition, so as to reduce the effect of false recognition rate.

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、终端和计算机可读存储介质
本专利技术实施例涉及语音识别技术，尤其涉及一种语音识别方法、装置、终端和计算机可读存储介质。
技术介绍
在语音命令词识别技术中，误识别一直是一个比较难以解决的问题。命令词识别之所以误识别率比较高，是因为现有技术的命令词识别方法普遍是通过构造解码网络来实现，该解码网络中包含多组与预设的命令词对应的音素序列。输入任何语音都会根据该语音从解码网络中搜索出一个最为匹配的音素序列，因此导致误识别。目前解决将噪音识别为命令词的方法是计算识别结果的置信度，当置信度大于预设的阈值时表示识别正确，当置信度小于该阈值时表示没有识别到命令词。由于置信度的计算依赖很多因素，尤其受环境影响会导致置信度的值变化范围很大。在嘈杂环境下，经常会出现正确的识别结果置信度很低但错误的识别结果置信度却很高的情况，使得误识别率依然很高。
技术实现思路
本专利技术提供一种语音命令的识别方法、装置、终端及计算机可读存储介质，以实现避免将噪音识别为命令词，且无需在语音识别后计算置信度，达到降低误识别率的效果。第一方面，本专利技术实施例提供了一种语音识别方法，包括：根据...
语音识别方法、装置、终端和计算机可读存储介质

【技术保护点】
一种语音识别方法，其特征在于，包括：根据采集到的语音的声学特征，计算所述语音与解码网络中的音素序列的声学相似概率；其中，所述解码网络包括多组音素序列，每一组音素序列对应一个预设的命令词内容或对应噪音内容；根据所述声学相似概率，获得所述语音与所述音素序列的匹配概率；将所述语音识别为匹配概率最高的音素序列所对应的内容。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：根据采集到的语音的声学特征，计算所述语音与解码网络中的音素序列的声学相似概率；其中，所述解码网络包括多组音素序列，每一组音素序列对应一个预设的命令词内容或对应噪音内容；根据所述声学相似概率，获得所述语音与所述音素序列的匹配概率；将所述语音识别为匹配概率最高的音素序列所对应的内容。2.如权利要求1所述的语音识别方法，其特征在于，所述解码网络是使用加权有限状态转换器构造的；所述根据所述声学相似概率，获得所述语音与所述音素序列的匹配概率，具体包括：计算所述声学相似概率与所述音素序列的权重的和值，作为所述语音与所述音素序列的匹配概率。3.如权利要求2所述的语音识别方法，其特征在于，还包括：若确认采集到的语音为噪音，且将所述语音识别为预先设定的命令词，则提高所述解码网络中噪音内容对应的音素序列的权重。4.如权利要求1-3任一所述的语音识别方法，其特征在于，所述解码网络还包括与静音内容对应的音素序列。5.如权利要求1-3任一所述的语音识别方法，其特征在于，所述根据采集到的语音的声学特征，计算所述语音与解码网络中的音素序列的声学相似概率，具体包括：获取预先训练的解码网络中音素序列的声学模型；其中，训练噪音内容对应的声学模型所采用的噪音样本包括多个两两之间声学特征差值大于预设的阈值的语音样本；根据采集到的语音的声学特征，采用所述声学模型计算所述语音与解码网络中的音素序列的声学相似概率。6.一种语音识别装置，其特征在于...

【专利技术属性】
技术研发人员：何金来，雷宇，
申请(专利权)人：北京智能管家科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人