【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音识别系统,并且特别涉及在语音识别系统中的语音结束(end of utterance)检测。
技术介绍
近年来已经开发了不同的语音识别应用,例如,用于汽车用户接口和移动终端(例如移动电话、PDA设备和便携电脑)。对于移动终端的已知应用包括通过对着移动终端的麦克风大声说出他/她的名字,以及根据与最对应于来自用户的语音输入的模型相关联的姓名/号码,来发起对所述号码的呼叫,从而给特定的人打电话。然而,目前依赖于说话者的方法一般要求对语音识别系统进行训练以识别每个字的发音。不依赖于说话者的语音识别改善了语音控制用户接口的可用性,这是因为可以省略所述训练阶段。在不依赖于说话者的字识别中,可以预先存储字的发音,这样通过预定义的发音(例如音素序列)可以识别用户所说的字。大多数的语音识别系统使用维特比(Viterbi)搜索算法,该算法通过隐马尔科夫模型(HMMs)网络建立搜索,并对于每一帧或时间步长维持在该网络中的每一阶段处的最可能路径得分。语音结束(EOU)检测是与语音识别相关的一个重要方面。EOU检测的目标是最可靠、最快地检测讲话的结尾。当完成了EOU检测时,语音识别器就能停止解码,并且用户得到识别的结果。通过工作良好的EOU检测,也可以提高识别速率,这是因为语音之后的噪声部分被忽略了。为EOU检测已经开发了各种不同的技术。例如,EOU检测可以基于检测到的能量的级别、检测到的过零值,或检测到的熵。然而,这些方法总是被证明对于处理能力有限的受限设备(如移动电话)来说太过复杂。如果在移动设备中使用语音识别,那么收集用于EOU检测的信息的很自然的位置是语 ...
【技术保护点】
一种语音识别系统,其包括具有语音结束检测的语音识别器,其中,所述语音识别器被配置为确定从所接收的语音数据确定的识别结果是否稳定,所述语音识别器被配置为,处理与所接收的语音数据帧相关联的最佳状态得分和最佳令牌得分,用于语音结束检测,以及所述语音识别器被配置为,如果所述识别结果稳定,则在所述处理的基础上确定是否检测到语音结束。
【技术特征摘要】
【国外来华专利技术】US 2004-5-12 10/844,2111.一种语音识别系统,其包括具有语音结束检测的语音识别器,其中,所述语音识别器被配置为确定从所接收的语音数据确定的识别结果是否稳定,所述语音识别器被配置为,处理与所接收的语音数据帧相关联的最佳状态得分和最佳令牌得分,用于语音结束检测,以及所述语音识别器被配置为,如果所述识别结果稳定,则在所述处理的基础上确定是否检测到语音结束。2.根据权利要求1的语音识别系统,其中,所述语音识别器被配置为,通过累加预定数目的帧的最佳状态得分值,来计算最佳状态得分总值,响应所述识别结果为稳定,所述语音识别器被配置为比较所述最佳状态得分总值和预定的门限总值,以及所述语音识别器被配置为,当所述最佳状态得分总值不超过所述门限总值时确定语音结束检测。3.根据权利要求2的语音识别系统,其中,所述语音识别器被配置为通过所检测的静音模型的数目来归一化所述最佳得分总值,以及所述语音识别器被配置为,比较所述被归一化的最佳状态得分总值和所述预定的门限总值。4.根据权利要求2的语音识别系统,其中,所述语音识别器被进一步配置为,比较超过所述门限总值的最佳状态得分总值的数目与预定的最小数目值,所述最小数目值定义了所需的超过所述门限总值的最佳状态得分总值的最小数目,以及所述语音识别器被配置为,如果超过所述门限总值的最佳状态得分总值的数目等于或大于所述预定的最小数目的值,则确定语音结束检测。5.根据权利要求1的语音识别系统,其中,所述语音识别器被配置为在确定语音结束检测之前等待预定的时间段。6.根据权利要求1的语音识别系统,其中,所述语音识别器被配置为反复确定所述最佳令牌得分值,所述语音识别器被配置为,基于至少两个最佳令牌得分值,来计算所述最佳令牌得分值的斜率,所述语音识别器被配置为,比较所述斜率与预定的门限斜率值,以及所述语音识别器被配置为,当所述斜率不超过所述门限斜率值时,确定语音结束检测。7.根据权利要求6的语音识别系统,其中,对每一帧计算所述斜率。8.根据权利要求6的语音识别系统,其中,所述语音识别器被进一步配置为,比较超过所述门限斜率值的斜率数目与预定的超过门限斜率值的斜率的最小数目,以及所述语音识别器被配置为,如果所述超过门限斜率总值的最佳状态得分总值的数目等于或大于所述预定的最小数目,则确定语音结束检测。9.根据权利要求6的语音识别系统,其中,所述语音识别器被配置为,仅当接收了预定数目的帧后才开始计算斜率。10.根据权利要求1的语音识别系统,其中,所述语音识别器被配置为,确定至少一个字间令牌的最佳令牌得分以及至少一个出口令牌的最佳令牌得分,以及所述语音识别器被配置为,仅当所述出口令牌的最佳令牌得分值高于所述字间令牌的最佳令牌得分值时,才确定语音结束检测。11.根据权利要求1的语音识别系统,其中,所述语音识别器被配置为,仅当所述识别结果没有不合格时,才确定语音结束检测。12.根据权利要求1的语音识别系统,其中,所述语音识别器被配置为,当接收到最大数目的产生基本上相同的识别结果的帧后,确定语音结束检测。13.一种用于在语音识别系统中配置语音结束检测的方法,所述方法包括处理与所接收的语音数据帧相关的最佳状态得分和最佳令牌得分,用于语音结束检测,确定从所接收的语音数据确定的识别结果是否稳定,以及如果所述识别结果稳定,则在所述处理的基础上确定是否检测到语音结束。14.根据权利要求13的方法,其中,通过累加预定数目的帧的最佳状态得分值,来计算最佳状态得分总值,响应所述识别结果为稳定,比较所述最佳状态得分总值与预定的门限总值,以及如果所述最佳状态得分总值不超过所述门限总值,则确定所述语音结束检测。15.根据权利要求13的方法,其中,反复确定最佳令牌得分的值,基于至少两个最佳令牌得分值来计算所述最佳令牌得分值的斜率,比较所述斜率与预定的门限斜率值,以及如果所述斜...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。