当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于增量地生成的语音识别假设的增强的稳定性预测制造技术

技术编号:10203231 阅读:209 留言:0更新日期:2014-07-12 01:53
包括在计算机存储介质上被编码的计算机程序在内的用于预测语音识别结果的稳定性的方法、系统和装置。在一个方面,一种方法包括确定词保持在增量语音识别器的顶端假设中的时间长度或者时机数量,并且基于该时间长度或者时机数量向该词分配稳定性度量。

【技术实现步骤摘要】
【国外来华专利技术】用于增量地生成的语音识别假设的增强的稳定性预测相关申请的交叉引用本申请要求2011年11月I日提交的第61/554,039号美国临时专利申请以及2012年5月2日提交的第13/461,033号美国专利申请的权益,它们通过引用结合于此。
本说明书总体上涉及语音识别。
技术介绍
在某些自动语音识别(ASR)实施方式中,用户在识别结果被显示或者被遵照执行之前完成讲话。
技术实现思路
在增量语音识别(incremental speech recognition)中,能够在用户讲话的同时从识别器流输出部分结果,因此例如实现用于口头语言接口的若干有用特征。例如,识别器能够在假设(hypothesis)完全形成之前遵照该假设执行或者向用户显示该假设。此外,在识别结果完全确定之前预先计算响应可以具有计算上的优势。连同这些特征和其它有用的特征,口头语言界面能够感觉更自然并且对用户易于响应。根据本说明书所描述主题的一个总体实施方式,一种系统可以基于例如与持续时间相关的特征的各种特征向增量语音识别结果的分段(segment)分配稳定性度量(stability metric)。代替估计该分段已经被识本文档来自技高网...
用于增量地生成的语音识别假设的增强的稳定性预测

【技术保护点】
一种计算机实施的方法,包括:接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设;从所述多个部分增量语音识别假设之一识别分段;从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久;并且由一个或多个计算机基于所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。

【技术特征摘要】
【国外来华专利技术】2011.11.01 US 61/554,039;2012.05.01 US 13/461,0331.一种计算机实施的方法,包括: 接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设; 从所述多个部分增量语音识别假设之一识别分段; 从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久;并且 由一个或多个计算机基于所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。2.根据权利要求1所述的方法,其中向所述分段分配所述稳定性度量进一步基于所述分段的右侧上下文。3.根据权利要求1所述的方法,其中所述分段包括词或子词。4.根据权利要求1所述的方法,其中确定所述分段持续了多久包括确定所述分段在没有变化的情况下持续了多久。5.根据权利要求1所述的方法,其中所述稳定性度量在所识别的、包括所述分段的特定增量语音识别假设从所述增量语音识别器输出之后被分配给所述分段。6.根据权利要求1所述的方法,包括: 接收与话语相对应的音频信号;并且 对所述音频信号执行增量语音识别以生成所述多个部分增量语音识别假设。7.根据权利要求1所述的方法,包括: 确定所述稳定性度量是否满足阈值;并且 基于确定所述稳定性度量是否满足所述阈值来改变用户界面上所述分段的表示的视觉特征。8.根据权利要求1所述的方法,包括: 确定所述稳定性度量是否满足阈值,并且 基于确定所述稳定性度量是否满足所述阈值来将所述分段翻译为不同语言。9.根据权利要求1所述的方法,包括: 确定所述稳定性度量是否满足阈值;并且 基于确定所述稳定性度量是否满足所述阈值来将所述分段作为搜索查询的一部分提交至搜索引擎。10.根据权利要求1所述的方法,包括: 确定所述稳定性度量是否满足阈值;并且 基于确定所述稳定性度量是否满足所述阈值来在用户界面上显示所述分段的表示。11.根据权利要求1所述的方法,其中所述接收、识别、确定和分配由一个或多个计算机来执行。12.—种系统,包括: 一个或多个计算机以及存储指令的一个或多个存储设备,如果被所述一个或多个计算机执行,所述指令可操作为使得所述一个或多个计算机执行操作,所述操作包括: 接收各自表示增量语音识别器在不同时间点的顶端增量语音识别假设的多个部分增量语音识别假设;从所述多个部分增量语音识别假设之一识别分段; 从所述多个部分增量语音识别假设确定所述分段在所述增量语音识别器的顶端增量语音识别假设中持续了多久;并且 基于所述分段在没有变化的情况下在所述增量语音识别器的顶端增量语音识别假设中持续了多久来向所述分段分配稳定性度量。13.根据权利要求12所述的系统,其中向所述分段分配所述稳定性度量进一步基于所述分段的右侧上下文。14.根据权利要求12所述的系统,其中所述分段包括词或子词。15.根据权利要求12所述的系统,其中确定所述分段持续了多久包括确定所述分段在没有变化的情况下持续了多久。16.根据权利要...

【专利技术属性】
技术研发人员:I·C·麦格劳A·H·格伦斯坦
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1