The voice action is executed safely using the situation signal. In some implementations, I is used to represent the voice data spoken by the speaker, and (II) to indicate the result of the speaker's voice that is spoken by the speaker, and at least to select the voice action according to the transcript of the audio data. A service provider is selected from a number of different service providers that correspond to the selected voice actions. Identify one or more input data types that the selected service provides for the commercial to perform the authentication of the selected voice action. The service provider provides (I) the request to execute the selected voice actions and (II) corresponds to one or more numerical values of one or more input data types.
【技术实现步骤摘要】
使用情境信号安全执行语音动作
本说明书描述了与语音动作有关的技术。
技术介绍
声控装置可以响应于语音来执行语音动作。例如,一个人可以说“计算机,呼叫1-888-888-8888”,并且其移动计算装置可以呼叫号码1-888-888-8888,而无需来自这个人的进一步输入。
技术实现思路
语音动作通常是要使用户能够方便地执行动作。例如,用户可以在烹饪的同时简单地说“计算机,设置一个一分钟的计时器”来创建一个一分钟的计时器,而不是与装置物理交互。然而,某些语音命令请求可能会造成严重影响的语音动作。例如,执行语音动作可能会解除家庭安全系统、以大货币成本订购物品或者极大地改变家中温度设置。另外,执行语音动作的装置可以由多人访问。例如,执行语音动作的装置可以在厨房操作台上并且可以接收来自在该装置附近的任何人的语音。因此,在执行语音动作时施加安全限制可能很重要。例如,可能需要系统响应于业主说“计算机,解除安全系统”来解除安全系统,并且不响应客人或者入侵者所说“计算机,解除安全系统”来接触安全系统。因此,为了安全地执行语音动作,系统可以从其语音标识说话者并且使用附加情境信号(contextualsignal)来对该说话者进行鉴权。情境信号可以包括,例如,用户的移动计算装置在家中的指示、用户的移动计算装置自最后解锁以来一直在人身上的指示、或者一些其它信号。例如,系统可以接收发声“计算机,解除安全系统”,将说话者的声音标识为业主的语音,并且作为响应,进一步地确定业主的移动计算装置是否在家中。可以基于成功的语音标识和计算装置的物理存在来执行解除安全系统的命令。相比之下,系统可以配置 ...
【技术保护点】
一种用于安全执行语音动作的方法,所述方法包括:获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果;至少根据所述音频数据的转录文选择语音动作;从多个服务提供商选择对应于所选择语音动作的服务提供商;标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型;以及向所选择服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。
【技术特征摘要】
2016.06.10 US 15/178,8951.一种用于安全执行语音动作的方法,所述方法包括:获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果;至少根据所述音频数据的转录文选择语音动作;从多个服务提供商选择对应于所选择语音动作的服务提供商;标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型;以及向所选择服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。2.根据权利要求1所述的方法,其中,获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果包括:获取表示所述说话者说出的所述语音命令的所述音频数据;获取所述说话者的声纹;确定所述说话者的所述声纹与表示所述说话者说出的所述语音命令的所述音频数据匹配;以及响应于确定所述说话者的所述声纹与表示所述说话者说出的所述语音命令的所述音频数据匹配,生成指示所述语音命令由所述说话者说出的所述说话者标识结果。3.根据权利要求1所述的方法,其中,至少根据所述音频数据的转录文选择语音动作包括:确定在所述转录文中的一个或多个词项与一组语音动作中的特定语音动作所标识的一个或多个词项匹配,该一组语音动作中的每个语音动作标识对应于该语音动作的一个或多个词项;以及响应于确定在所述转录文中的所述一个或多个词项与所述特定语音动作所标识的一个或多个词项匹配,从所述一组语音动作选择所述特定语音动作。4.根据权利要求1所述的方法,其中,从多个服务提供商选择对应于所选择语音动作的服务提供商包括:根据语音动作到所述多个服务提供商的映射,确定所述多个服务提供商的特定服务提供商可执行所选择语音动作,其中对每个语音动作所述映射描述了可执行该语音动作的服务提供商;以及响应于确定所述特定服务提供商可执行所选择的语音动作,选择所述特定服务提供商。5.根据权利要求1所述的方法,其包括:使用自动语音识别器生成所述音频数据的所述转录文。6.根据权利要求1所述的方法,其包括:从所述服务提供商接收需要附加鉴权来执行所选择语音动作的指示;以及响应于接收所述指示,提供对附加鉴权的请求。7.根据权利要求1所述的方法,其包括:从所选择服务提供商接收所选择语音动作已被执行的指示。8.根据权利要求1-7中任一项所述的方法,其中,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型包括:向所选择服务提供商提供对所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型的标识的请求;从所选择服务提供商接收对所述标识的所述请求的响应;以及根据对所述标识的所述请求的响应,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型。9.根据权利要求1-7中任一项所述的方法,其中,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型包括:标识所选择服务提供商使用以下输入数据类型中的一个或多个:指示所述说话者的移动计算装置自最后解锁以来是否一直在身上的输入数据类型、指示说话者的移动计算装置是否与特定装置进行近距离通信的输入数据类型、指示说话者的移动计算装置是否在特定地理区域内的输入数据类型、和指示说话者的人脸是否在装置的视野中的输入数据类型。10.一种安全执行语音动作的系统,其包括:一个或多个计算机和一个或多个存储装置,所述一个或多个存储装置存储指令,所述指令在由所述一个或多个计算机...
【专利技术属性】
技术研发人员:巴纳比·约翰·詹姆斯,
申请(专利权)人:谷歌公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。