【技术实现步骤摘要】
【国外来华专利技术】热词辨识和被动辅助
本说明书总体涉及自动语音辨识。
技术介绍
启用语音的家庭或其他环境——即,用户只需要大声讲出查询或命令而基于计算机的系统将应对(field)并回答查询和/或使命令被执行的环境——的现实已来临。能够使用分布在环境的各个房间或区域中的连接麦克风设备的网络来实现启用语音的环境(例如,家庭、工作场所、学校等)。通过这样的麦克风网络,用户具有从环境中基本上任何地方口头查询系统而无需在他/她面前或甚至附近具有计算机或其他设备的能力。例如,当在厨房里烹饪时,用户可能直接问系统“howmanymillilitersinthreecups?(三杯里有多少毫升?)”,并且作为响应,接收来自系统的答案,例如形式为合成话音输出。或者,用户可能问系统诸如“whendoesmynearestgasstationclose(我最近的加油站什么时候关闭)”的问题,或者在准备离开房子时,问“shouldIwearacoattoday?(我今天应该穿外套吗?)”另外,用户可以问系统的查询,并且/或者发出与用户的个人信息有关的命令。例如,用户可能问系统“whenismymeetingwithJohn?(我何时与John见面?)”或者命令系统“remindmetocallJohnwhenIgetbackhome(在我回家时提醒我给John打电话)”。
技术实现思路
对于启用语音的系统,用户与系统交互的方式被设计为主要是而不排他地借助于话音输入。因此,潜在地获取在周围环境中做出的所有话语(包括不针对系统的那些话 ...
【技术保护点】
1.一种计算机实现的方法,包括:/n由计算设备接收与话语相对应的音频数据,所述计算设备(i)正在低功率模式下操作并且包括在所述计算设备处于所述低功率模式时显示图形界面的显示器并且(ii)被配置成响应于检测到第一热词而退出所述低功率模式;/n由所述计算设备确定所述音频数据包括第二不同的热词;/n响应于确定所述音频数据包括所述第二不同的热词,由所述计算设备通过对所述音频数据执行语音辨识来获得所述话语的转录;/n基于所述第二不同的热词和所述话语的所述转录,由所述计算设备生成附加用户界面;以及/n在所述计算设备保持在所述低功率模式下时,提供所述附加图形界面以在所述显示器上输出。/n
【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:
由计算设备接收与话语相对应的音频数据,所述计算设备(i)正在低功率模式下操作并且包括在所述计算设备处于所述低功率模式时显示图形界面的显示器并且(ii)被配置成响应于检测到第一热词而退出所述低功率模式;
由所述计算设备确定所述音频数据包括第二不同的热词;
响应于确定所述音频数据包括所述第二不同的热词,由所述计算设备通过对所述音频数据执行语音辨识来获得所述话语的转录;
基于所述第二不同的热词和所述话语的所述转录,由所述计算设备生成附加用户界面;以及
在所述计算设备保持在所述低功率模式下时,提供所述附加图形界面以在所述显示器上输出。
2.根据权利要求1所述的方法,包括:
在提供所述附加图形界面以在所述显示器上输出之后,由所述计算设备接收包括键按压的输入;和
在接收到所述包括键按压的输入之后,将所述计算设备切换到与所述低功率模式相比消耗更多功率的高功率模式。
3.根据权利要求2所述的方法,包括:
在将所述计算设备切换到与所述低功率模式相比消耗更多功率的所述高功率模式之后并且在所述显示器保持活跃时,使所述计算设备返回到所述低功率模式;和
在使所述计算设备返回到所述低功率模式之后,提供所述用户界面以在所述显示器上输出。
4.根据权利要求2所述的方法,其中:
在处于所述高功率模式时,所述计算设备以第一频率从网络取得数据,并且
在处于所述低功率模式时,所述计算设备以第二较低的频率从所述网络取得数据。
5.根据权利要求1所述的方法,其中:
所述显示器是触敏显示器,
在所述计算设备处于所述低功率模式时,所述显示器不能够接收触摸输入,并且
在所述计算设备处于与所述低功率模式相比消耗更多功率的高功率模式时,所述显示器能够接收触摸输入。
6.根据权利要求1所述的方法,包括:
基于所述第二不同的热词来识别所述计算设备能访问的应用;和
将所述话语的所述转录提供给所述应用,
其中,所述附加用户界面是基于将所述话语的所述转录提供给所述应用来生成的。
7.根据权利要求1所述的方法,包括:
由所述计算设备接收所述第一热词的第一热词模型和所述第二不同的热词的第二不同的热词模型,
其中,确定所述音频数据包括所述第二不同的热词包括将所述音频数据应用于所述第二不同的热词模型。
8.根据权利要求1所述的方法,其中,所述附加图形界面包括可选选项,所述可选选项在由用户选择时更新应用。
9.根据权利要求1所述的方法,包括:
响应于确定所述音频数据包括所述第二不同的热词而将所述计算设备维持在所述低功率模式下。
10.根据权利要求1所述的方法,包括:
由所述计算设备确定所述话语的讲话者不是所述计算设备的主要用户,
其中,通过对所述音频数据执行语音辨识来获得所述话语的所述转录是响应于确定所述话语的讲话者不是所述计算设备的主要用户。
11.根据权利要求1所述的方法,包括:
由所述计算设备接收与附加话语相对应的附加音频数据;
由所述计算设备确定所述附加音频数据包括所述第一热词;以及
响应于确定所述音频数据包括所述第二不同的热词,将所述计算设备从所述低功率模式切换到与所述低功率模式相比消耗更多功率的高功率模式。
12.根据权利要求10所述的方法,包括:
由所述计算设备确定所述附加话语的讲话者是所述计算设备...
【专利技术属性】
技术研发人员:扬·奥尔索斯,马修·谢里菲,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。