一种语音指令范围动态变化的连续语音识别方法技术

技术编号：8367210 阅读：252 留言：0更新日期：2013-02-28 06:33

一种语音指令范围动态变化的连续语音识别方法，（1）输入语音指令集，并按规则将语音指令集分组，分别构建解码网络；（2）输入语音，提取声学特征，基于解码网络进行解码，在解码的同时允许根据当前的运行情况动态地增删解码网络；（3）判断接收到的语音是否为有效语音，并给出反馈是否为有效反馈；（4）依据命令做出相应的操作；（5）是否仍有语音输入，若是转入（2），否则结束。本发明专利技术允许用户连续输入语音，且允许系统在识别过程中依据系统运行状态动态地增加和删除语音指令，实时调整解码网络并参与解码，在提高识别效率的同时，也大大的改善了识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音指令识别方法，尤其是一种对语音指令范围可变的连续语音识别方法。
技术介绍
与机器进行交流，让其明白你在说什么，是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术作为解决人机交互的重要途径，在近年来得到了越来越多的应用。如基于计算机平台的、大词汇量连续语音识别系统，主要应用于与电话网或互联网相结合的语音信息查询服务系统；在小型化、便携式语音产品中的应用，如智能玩具、家电遥控等方面。语音指令的识别应用场景有两种，一种是对固定不变的指令内容进行识别；另一种情况是要识别的指令内容是随着时间而变化的，对于下一刻可能要识别的内容是未知的，且识别过程中用户的语音是连续输入的。这里语音指令可以是简单的命令词，也可以是语句，即围绕着某个命令词或应用场景的很多种说法。场景二的例子如酷豆游戏，屏幕上实时动态地显示用户可读入的命令词，即当前可识别的命令词，对于识别系统和用户来说，下一时刻可用于识别的命令词是完全未知的，且在命令词变化的整个过程中，用户的语音是连续输入的，此时，识别系统也应实时准确的识别出用户的语音。而传统的语音指令识别方法往往满足不了需求。传统的语音指令识别方法主要处理的是指令集固定的情况。在评测开始前，依据指令集的内容构建固定不变的解码网络，因此，该种识别技术灵活性较差，对于指令集需随时变换的情况束手无策。其具体流程如图I所示第一步依据需求设定指令集；第二步依据指令集内容构建解码网络；第三步接受用户输入的语音；第四步判断接收到的语音是否为有效语音，并给出反馈是否为有...

【技术保护点】
一种语音指令范围动态变化的连续语音识别方法，其特征在于实现步骤如下：（1）输入初始语音指令集文本，并进行文本处理；所述语音指令集文本可根据应用需要分为一组或多组，不同组指令集可具有不同的生命周期；（2）根据步骤（1）中输出的文本，为每组语音指令集分别搭建解码网络，并将解码网络、声学模型传给各自的解码器；所述声学模型是语音识别的基础数学模型，模型单元是音素、音节或字；（3）实时接收语音数据片段，并提取声学特征序列传给每个解码器并进行解码。所述声学特征是描述短时语音本质特征的一组值；（4）在解码的过程中允许外部应用系统根据运行逻辑的需要动态地增、删语音指令集，并根据语音指令集的动态变化实时更新解码网络。所述根据语音指令集的动态变化实时更新解码网络的过程具体如下：（41）接受外部应用系统语音指令集调整请求；（42）若需要增加新的语音指令集，则对新语音指令集进行文本处理，依据文本构建相应的解码网络，并开始进行解码；若需要删除某些语音指令集，则停止该语音指令集对应解码器的所有运算，并删除对应的解码网络；（5）当某个解码器率先解码至网络的结束位置时，获取所有解码器的最优结果，并进行排序，取概率最大...

【技术特征摘要】

【专利技术属性】
技术研发人员：赵乾，朱群，吴玲，潘颂声，何春江，王兵，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人