当前位置: 首页 > 专利查询>谷歌公司专利>正文

使用情境信号安全执行语音动作制造技术

技术编号:16836998 阅读:26 留言:0更新日期:2017-12-19 19:40
使用情境信号安全执行语音动作。在某些实施方式中,获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果;至少根据所述音频数据的转录文选择语音动作。从多个不同的服务提供商选择对应于所选择语音动作的服务提供商。标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型。向所述服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。

Secure execution of voice action with situational signals

The voice action is executed safely using the situation signal. In some implementations, I is used to represent the voice data spoken by the speaker, and (II) to indicate the result of the speaker's voice that is spoken by the speaker, and at least to select the voice action according to the transcript of the audio data. A service provider is selected from a number of different service providers that correspond to the selected voice actions. Identify one or more input data types that the selected service provides for the commercial to perform the authentication of the selected voice action. The service provider provides (I) the request to execute the selected voice actions and (II) corresponds to one or more numerical values of one or more input data types.

【技术实现步骤摘要】
使用情境信号安全执行语音动作
本说明书描述了与语音动作有关的技术。
技术介绍
声控装置可以响应于语音来执行语音动作。例如,一个人可以说“计算机,呼叫1-888-888-8888”,并且其移动计算装置可以呼叫号码1-888-888-8888,而无需来自这个人的进一步输入。
技术实现思路
语音动作通常是要使用户能够方便地执行动作。例如,用户可以在烹饪的同时简单地说“计算机,设置一个一分钟的计时器”来创建一个一分钟的计时器,而不是与装置物理交互。然而,某些语音命令请求可能会造成严重影响的语音动作。例如,执行语音动作可能会解除家庭安全系统、以大货币成本订购物品或者极大地改变家中温度设置。另外,执行语音动作的装置可以由多人访问。例如,执行语音动作的装置可以在厨房操作台上并且可以接收来自在该装置附近的任何人的语音。因此,在执行语音动作时施加安全限制可能很重要。例如,可能需要系统响应于业主说“计算机,解除安全系统”来解除安全系统,并且不响应客人或者入侵者所说“计算机,解除安全系统”来接触安全系统。因此,为了安全地执行语音动作,系统可以从其语音标识说话者并且使用附加情境信号(contextualsignal)来对该说话者进行鉴权。情境信号可以包括,例如,用户的移动计算装置在家中的指示、用户的移动计算装置自最后解锁以来一直在人身上的指示、或者一些其它信号。例如,系统可以接收发声“计算机,解除安全系统”,将说话者的声音标识为业主的语音,并且作为响应,进一步地确定业主的移动计算装置是否在家中。可以基于成功的语音标识和计算装置的物理存在来执行解除安全系统的命令。相比之下,系统可以配置为:如果所需的情境因素不存在,例如,如果语音标识失败或者如果业主的计算装置不在家中,那么命令将因为不符合安全要求而被禁止。这样,系统可以通过防止未获授权的人执行语音动作(诸如解除房屋的安全系统)来提高执行语音动作的安全性。在一般方面的一种方法,该方法可以是一种计算机实现的方法,其包括:获取(i)表示说话者说出的语音命令的音频数据和(ii)指示该语音命令由该说话者说出的说话者标识结果,至少根据音频数据的转录文(transcription)选择语音动作,从多个不同的服务提供商选择对应于所选择语音动作的服务提供商,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型,以及向服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。如上所述,“语音动作”(或语音发起动作)是由用户的语音命令(如语音发声)发起的。该方面和其它方面的其它实施方式包括:编码在计算机存储装置上的配置为执行方法的动作的对应的系统、设备、和计算机程序。一个或多个计算机的系统可以借由软件、固件、硬件、或者其组合来如此配置,该软件、固件、硬件、或者其组合安装在该系统上,在运行时,使该系统执行动作。一个或多个计算机程序可以借由指令来如此配置,该指令在由数据处理设备执行时使该设备执行动作。在另一个方面中,一种存储计算机程序的计算机存储介质,该计算机存储介质可以是非暂时性计算机存储介质,该程序包括指令,该指令在由一个或多个计算机执行时使该一个或多个计算机执行操作,该操作包括:获取(i)表示说话者说出的语音命令的音频数据和(ii)指示该语音命令由该说话者说出的说话者标识结果;至少根据音频数据的转录文选择语音动作;从多个不同的服务提供商选择对应于所选择语音动作的服务提供商;标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型;以及向服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。实施方式可以包括以下特征中的一个或多个特征。例如,在某些方面中,获取(i)表示说话者说出的语音命令的音频数据和(ii)指示该语音命令由该说话者说出的说话者标识结果可以包括:获取表示说话者说出的语音命令的音频数据,获取说话者的声纹(voiceprint),确定说话者的声纹与表示说话者说出的语音命令的音频数据匹配;以及响应于确定说话者的声纹与表示说话者说出的语音命令的音频数据匹配,生成指示该语音命令由该说话者说出的说话者标识结果。在某些方面中,至少根据音频数据的转录文选择语音动作包括:获取一组语音动作,其中,每个语音动作标识对应于该语音动作的一个或多个词项,确定在转录文中的一个或多个词项与对应于语音动作的一个或多个词项匹配,以及响应于确定在转录文中的一个或多个词项与对应于语音动作的一个或多个词项匹配,从该一组语音动作选择语音动作。在某些实施方式中,从多个不同的服务提供商选择对应于所选择语音动作的服务提供商包括:获取语音动作到多个服务提供商的映射,其中,针对每个语音动作,映射描述了可以执行该语音动作的服务提供商,确定语音动作的映射指示服务提供商可以执行所选择语音动作,以及响应于确定语音动作的映射指示服务提供商可以执行所选择语音动作,选择服务提供商。在某些方面中,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型包括:向所选择服务提供商提供对所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型的标识的请求,从所选择服务提供商接收对标识的请求的响应,以及根据对标识的请求的响应,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型。在某些方面中,动作包括:使用自动语音识别器生成音频数据的转录文。在某些实施方式中,动作包括:从服务提供商接收所选择语音动作已被执行的指示。在某些方面中,动作包括:从服务提供商接收需要附加鉴权来执行所选择语音动作的指示,以及响应于从服务提供商接收到需要附加鉴权来执行所选择语音动作的指示,提供对附加鉴权的请求。在某些方面中,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型包括:标识所选择服务提供商使用以下输入数据类型中的一个或多个:指示说话者的移动计算装置自最后解锁以来是否一直在身上的输入数据类型、指示说话者的移动计算装置是否与特定装置进行近距离通信的输入数据类型、指示说话者的移动计算装置是否在特定地理区域内的输入数据类型、或者指示说话者的人脸是否在装置的视野中的输入数据类型。在某些方面中,在向服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值之前,可能存在该一个或多个数值是否满足对服务提供商的一个或多个已知的最低要求的初步确定。如果该确定是肯定的,则将请求发送至服务提供商,但是如果该确定是否定的,则不将请求发送至服务提供商。在附图和以下描述中陈述了本说明书中所描述的主题的一个或多个实施例的细节。其它潜在特征、方面和优点将通过描述、附图及权利要求书变得显而易见。应理解,各方面和实现可以组合,并且在一个方面或者一种实现的背景下描述的特征可以在其它方面或者实现的背景下实施。附图说明图1是示出了与用于安全地执行语音动作的系统的示例交互的框图。图2是用于安全地执行语音动作的示例系统的框图。图3是用于安全地执行语音动作的示例语音动作服务器的框图。图4是示出了与用于安全地执行语音动作的过程的示例的流程图。图5是计算装置的示例的示意本文档来自技高网...
使用情境信号安全执行语音动作

【技术保护点】
一种用于安全执行语音动作的方法,所述方法包括:获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果;至少根据所述音频数据的转录文选择语音动作;从多个服务提供商选择对应于所选择语音动作的服务提供商;标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型;以及向所选择服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。

【技术特征摘要】
2016.06.10 US 15/178,8951.一种用于安全执行语音动作的方法,所述方法包括:获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果;至少根据所述音频数据的转录文选择语音动作;从多个服务提供商选择对应于所选择语音动作的服务提供商;标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型;以及向所选择服务提供商提供(i)执行所选择语音动作的请求和(ii)对应于所标识的一个或多个输入数据类型的一个或多个数值。2.根据权利要求1所述的方法,其中,获取(i)表示说话者说出的语音命令的音频数据和(ii)指示所述语音命令由所述说话者说出的说话者标识结果包括:获取表示所述说话者说出的所述语音命令的所述音频数据;获取所述说话者的声纹;确定所述说话者的所述声纹与表示所述说话者说出的所述语音命令的所述音频数据匹配;以及响应于确定所述说话者的所述声纹与表示所述说话者说出的所述语音命令的所述音频数据匹配,生成指示所述语音命令由所述说话者说出的所述说话者标识结果。3.根据权利要求1所述的方法,其中,至少根据所述音频数据的转录文选择语音动作包括:确定在所述转录文中的一个或多个词项与一组语音动作中的特定语音动作所标识的一个或多个词项匹配,该一组语音动作中的每个语音动作标识对应于该语音动作的一个或多个词项;以及响应于确定在所述转录文中的所述一个或多个词项与所述特定语音动作所标识的一个或多个词项匹配,从所述一组语音动作选择所述特定语音动作。4.根据权利要求1所述的方法,其中,从多个服务提供商选择对应于所选择语音动作的服务提供商包括:根据语音动作到所述多个服务提供商的映射,确定所述多个服务提供商的特定服务提供商可执行所选择语音动作,其中对每个语音动作所述映射描述了可执行该语音动作的服务提供商;以及响应于确定所述特定服务提供商可执行所选择的语音动作,选择所述特定服务提供商。5.根据权利要求1所述的方法,其包括:使用自动语音识别器生成所述音频数据的所述转录文。6.根据权利要求1所述的方法,其包括:从所述服务提供商接收需要附加鉴权来执行所选择语音动作的指示;以及响应于接收所述指示,提供对附加鉴权的请求。7.根据权利要求1所述的方法,其包括:从所选择服务提供商接收所选择语音动作已被执行的指示。8.根据权利要求1-7中任一项所述的方法,其中,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型包括:向所选择服务提供商提供对所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型的标识的请求;从所选择服务提供商接收对所述标识的所述请求的响应;以及根据对所述标识的所述请求的响应,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型。9.根据权利要求1-7中任一项所述的方法,其中,标识所选择服务提供商用来执行所选择语音动作的鉴权的一个或多个输入数据类型包括:标识所选择服务提供商使用以下输入数据类型中的一个或多个:指示所述说话者的移动计算装置自最后解锁以来是否一直在身上的输入数据类型、指示说话者的移动计算装置是否与特定装置进行近距离通信的输入数据类型、指示说话者的移动计算装置是否在特定地理区域内的输入数据类型、和指示说话者的人脸是否在装置的视野中的输入数据类型。10.一种安全执行语音动作的系统,其包括:一个或多个计算机和一个或多个存储装置,所述一个或多个存储装置存储指令,所述指令在由所述一个或多个计算机...

【专利技术属性】
技术研发人员:巴纳比·约翰·詹姆斯
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1