使用不可听音调或其它渲染输出来抢先限制环境中的各种助理设备的响应性制造技术

技术编号:35123801 阅读:14 留言:0更新日期:2022-10-05 09:54
本文阐述的实施方式涉及提供和/或检测自动化助理抑制输出以用于限制经由另一计算设备可用的自动化助理的响应性。可以在环境中将输出渲染为不可听音调,以便抢先抑制来自自动化助理的响应,该自动化助理可以检测到来自用户的即将进行的口头话语。以这种方式限制响应性可以保持其中多个用户可以正携带能够经由口头话语调用的设备的环境中的计算资源,该环境诸如车辆。例如,抢先限制其它自动化助理的响应性可以消除否则可能由于检测到某些口头话语而被无意调用的设备处的中断。话语而被无意调用的设备处的中断。话语而被无意调用的设备处的中断。

【技术实现步骤摘要】
【国外来华专利技术】使用不可听音调或其它渲染输出来抢先限制环境中的各种助理设备的响应性

技术介绍

[0001]人类可以参与与交互软件应用的人机对话,该交互软件应用在本文中被称为“自动化助理”(也被称为“数字智能体”,“聊天机器人”,“交互个人助理”,“智能个人助理”,“对话智能体”等)。例如,人类(当他们与自动化助理交互时可以被称为“用户”)可以使用口头自然语言输入(即,话语)和/或通过提供文本(例如,键入)自然语言输入来提供命令和/或请求,该口头自然语言输入在特定情况下可以被转换成文本并且然后被处理。
[0002]在一些情况下,自动化助理可以在其中多个不同的用户与其自己的相应助理设备一起存在的多个不同的场境中操作。在诸如在车辆内的这样的场境中,用户可以向他们相应的车辆助理提供请求,但是该请求可以被车辆内的一个或多个其他助理设备确认。这可以部分地是因为一些助理设备可以仅仅依赖于相应助理设备是否听到用户说命令以便作出响应。结果,可能限制自动化助理设备对特定多助理环境的适应性。例如,用户可能意外影响由他们不打算与之通信的另一助理设备执行的正在进行的动作。结果,用户可能被要求重复他们先前的口头话语——并且可能导致另一用户补救用户意外与之通信的该另一助理设备上的任何不期望效果。例如,这样的期望效果可以由偶然初始化诸如下载内容、验证支付的身份和/或启动应用的操作而产生。
[0003]不幸的是,响应于意外影响另一助理设备,针对任何受影响的操作分配的存储器可以被其它操作重新使用,并且当用户随后重新调用中断动作时,助理设备可能必须再次获取任何相关数据。这种看似冗余的结果可能浪费网络资源,因为例如,一些口头话语可能由通过网络连接可访问的自然语言模型来处理。此外,必须重新下载与无意取消的动作相关的任何数据以促进完成动作,并且可能不能恢复由于取消能量密集型动作(例如,控制显示器,加热元件和/或电动电器)而浪费的任何能量。

技术实现思路

[0004]本文所述的实施方式涉及由计算设备渲染输出,该输出由环境中的其它计算设备可检测并且当由其它计算设备检测到时使得其它计算设备抢先地限制经由对应麦克风检测到的音频数据的特定处理的执行。例如,其它计算设备可以响应于检测到输出而至少暂时防止以下的执行:基于音频数据执行调用短语/热词检测,基于音频数据执行声音活动检测,基于音频数据执行语音识别,和/或传送音频数据。例如,只要其它计算设备正在检测输出(例如,基于定期或不定期检查输出仍正在被检测),就可以在其它计算设备处防止调用短语检测。结果,可以通过至少临时防止调用短语检测来节省在其它计算设备处的计算资源,该调用短语检测比检测输出在计算上更繁重。例如,检测输出可以基于以规则或不规则间隔(例如,每五秒)进行检查,而调用短语检测可以是连续的。作为另一示例,检测输出可以使用机器学习模型或数字滤波器来执行,该机器学习模型或数字滤波器占用比使用调用短语/热词检测模型更少的存储器和/或需要更少的处理资源。
[0005]通过响应于检测到特定输出而使其它计算设备抢先地限制音频数据的特定处理
的执行,可以将使输出被提供的计算设备有效地指定为仅响应于自动化助理输入。例如,当输出导致限制热词检测时,计算设备可以是唯一响应诸如“OK Assistant(好的,助理)”或其它热词的调用自动化助理的热词的设备。在一些实施方式中,计算设备可以响应于确定一个或多个其它计算设备在该计算设备附近而初始化输出的渲染。输出可以以不干扰环境中的用户的方式渲染,诸如通过渲染具有大于人类可听见的最大频率(例如,大于20kHz的一个或多个频率)的一个频率(或多个频率)的可听输出。在一些实施方式中,输出可以体现具有一个或多个不同频率的波形。在一些实施方式中,输出可以体现一个或多个不规则和/或非周期性波形。
[0006]在一些实施方式中,将特定设备有效地抢先指定为响应于自动化助理命令可以防止用户无意中调用与其它用户相关联的助理设备,并且可以防止这种助理设备的资源的对应浪费使用。例如,在没有抢先地抑制受影响的自动化助理的任何机制的情况下,经常一起乘车的朋友可以意外地调用彼此的自动化助理。结果,当驾驶员发出仅用于他们的车辆自动化助理的命令时,该命令可能意外地被位于车辆中的其它自动化助理(例如,由驾驶员以外的人带入车辆中的其它蜂窝电话和/或平板电脑)确认和响应。考虑到许多设备响应于检测到自动化助理命令而激活它们的显示和/或其它特征,而不管命令是否是有意的,意外调用不同自动化助理可能浪费电池功率。此外,当自动化助理采用外部服务器来处理口头输入时,由于在多个设备的网络连接上意外发送音频数据,意外调用也会浪费计量网络上的网络带宽。此外,当CPU必须从低功率状态初始化时,在CPU从节流状态初始化上可能会浪费附加功率。
[0007]可以保留这种资源的场境的示例是当多个人位于每个相应用户正在携带启用助理的设备的环境中时。该环境可以是办公室,并且这些人可以是在提供对自动化助理的访问的特定计算设备(例如智能电视)处观看演示的同事。当特定计算设备检测到一个或多个用户和/或一个或多个启用助理的设备的存在时,特定计算设备可以渲染对启用助理的设备可检测的输出。所渲染的输出在被其他启用助理的设备检测到时,可以使得那些启用助理的设备绕过和/或限制对指向自动化助理的用户命令的响应。
[0008]例如,当演示的演示者向通过智能电视可访问的自动化助理提供口头命令而智能电视正在渲染输出时,自动化助理将被调用。然而,由于所渲染的输出,经由其它启用助理的设备提供的其它自动化助理将不会被调用——或者至少将不会执行一个或多个动作以促进实现体现在口头命令中的请求。例如,演示者提供口头命令,诸如“Assistant,show me my calendar(助理,向我展示日历)”,其可以指可以由观众成员携带的每个启用助理的设备执行的动作。然而,因为智能电视正在提供由环境中的其他启用助理的设备检测到的渲染输出,所以只有智能电视将响应口头命令。换句话说,因为智能电视正在提供渲染输出(例如,不可听的音调),所以由相应的观众成员携带的每个启用助理的设备将不会操作来实现请求(例如,每个其它启用助理的设备将不会在其相应的显示界面渲染日历)。
[0009]在一些实施方式中,由计算设备提供的用于将其自身指定为负责对助理命令进行响应的输出可以体现可由接收计算设备处理的信息。例如,输出可以体现对接收计算设备的相应自动化助理的请求是无响应的。例如,输出可以通过是在特定频率处,在特定频率范围内,是特定频率序列,或每个在对应频率范围内的频率序列来体现请求。在一些实施方式中,该请求可以体现在以人耳可听和/或不可听的频率传送的音频中。在一些实施方式中,
音频可以没有自然语言内容,但是可以体现可以被解释为作为抑制助理调用的请求的计算设备的数据。在其他实施方式中,音频可以体现自然语言内容,诸如单词“cancel(取消)”和/或能够表示用户不愿意与其自动化助理交互的任何其他单词。当特定计算设备正试图将其自身指定为在第三方设备存在且不符合这样的指定的环境中仅响应于助理命令时,这可能是有益的。特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个处理器实现的方法,所述方法包括:由第一计算设备不依赖于由所述第一计算设备对调用短语的任何检测,使得所述第一计算设备经由耦合到所述第一计算设备的一个或多个扬声器渲染音频输出,其中,特定可听输出是能够由位于具有所述第一计算设备的环境中的第二计算设备的一个或多个麦克风可听地检测的,以及其中,响应于所述特定可听输出由所述一个或多个麦克风在所述第二计算设备处检测到,所述第二计算至少暂时限制在所述第二计算设备处检测到的音频数据的特定处理的执行;在使得所述第一计算设备渲染所述特定可听输出之后,并且在所述第二计算设备正限制音频数据的所述特定处理的执行的同时:由所述第一计算设备确定用户已向经由所述第一计算设备能够访问的自动化助理提供了口头话语,其中,所述口头话语对应于用于所述自动化助理执行一个或多个动作的请求;以及由所述第一计算设备响应于所述口头话语而使得所述自动化助理初始化所述一个或多个动作的执行,其中,基于临时限制音频数据的所述特定处理的执行,所述第二计算设备不响应于所述口头话语而初始化所述一个或多个动作的执行。2.根据权利要求1所述的方法,还包括:确定所述第二计算设备位于所述环境内,以及确定所述第二计算设备提供对所述自动化助理或另一自动化助理的访问。3.根据权利要求1所述的方法,其中,使得所述第一计算设备或另一计算设备渲染所述音频输出包括:使得所述第一计算设备或所述另一计算设备将所述音频输出提供为体现一个或多个不同波形。4.根据前述权利要求中的任一项所述的方法,其中,使得所述第一计算设备或所述另一计算设备渲染所述音频输出包括:基于所述第二计算设备的特性,选择由所述音频输出体现的信号的频率或由所述音频输出体现的不规则波形。5.根据权利要求4所述的方法,其中,所述第二计算设备的所述特性包括与在所述第二计算设备处可用的应用相关联的用户账户。6.根据权利要求1

3中的任一项所述的方法,其中,使得所述第一计算设备或所述另一计算设备渲染所述音频输出包括:基于所述环境的特性,选择由所述音频输出体现的信号的频率。7.根据前述权利要求中的任一项所述的方法,其中,使得所述第二计算设备临时限制所述一个或多个动作的执行包括:使得所述第二计算设备渲染单独输出,所述单独输出指示所述第二计算设备检测到来自用户的所述口头话语。8.根据权利要求7所述的方法,其中,所述单独输出是在所述第二计算设备的图形用户接口处渲染的可选元素。
9.根据前述权利要求中的任一项所述的方法,其中,所述第一计算设备或所述第二计算设备提供对能够由所述用户或另一用户修改的助理设置的访问以用于消除所述音频输出对所述第二计算设备的影响。10.根据权利要求9所述的方法,其中,所述助理设置控制所述第二计算设备响应于所述用户提供所述口头话语或另一口头话语而初始化所述一个或多个动作的能力。11.根据前述权利要求中的任一项所述的方法,还包括:由所述第一计算设备确定所述第二计算设备或单独计算设备是否正渲染单独特定输出以促进使得所述自动化助理不响应于从所述用户到所述第一计算设备的一个或多个输入。12.根据权利要求11所述的方法,其中,在所述第二计算设备或所述单独设备被确定为没有正渲染所述单独特定输出时,执行使得所述第一计算设备或另一计算设备渲染所述音频输出。13.根据权利要求11或权利要求12所述的方法,其中,在所述第二计算设备或所述单独设备被确定为正渲染所述单独特定输出时:使得所述第一计算设备或所述另一计算设备渲染所述音频输出包括:基于所述单独特定输出,选择通过所述特定输出体现的所述信号的特定频率,其中,所述特定频率不同于在所述第二计算设备或所述单独设备被确定为没有正渲染所述单独特定输出时所选择的频率。14.根据前述权利要求中的任一项所述的方法,其中,由所述第二计算设备限制的所述音频数据的所述特定处理包括调用短语检测处理。15.根据前述权利要求中的任一项所述的方法,其中,由所述第二计算设备限制的所述音频数据的所述特定处理包括语音到文本处理。16.根据前述权利要求中的任一项所述的方法,其中,由所述第二计算设备限制的所述音频数据的所述特定处理包括将所述音频数据传送到远程服务器。17.根据前述权利要求中的任一项所述的方法,其中,所述第二计算在所述可听输出在所述第二计算设备处被检测到的整个持续时间期间,防止在所述第二计算设备处检测到的音频数据的所述特定处理的执行。18.根据前述权利要求中的任一项所述的方法,其中,所述第二计算设备通过使用模拟或数字带通滤波器处理所述音频数据来检测所述特定可听输出。19.一种由一个或多个处理器实现的方法,所述方法包括:在第一计算设备处处理音频数据,所述音频数据经由所述第一计算设备的一个或多个麦克风被检测并且捕获由耦合到第二计算设备的一个或多个扬声器渲染的可听输出,其中,所述第一计算设备和所述第二计算设备位于环境中,其中,不依赖于由所述第二计算设备对任何调用短语的检测,由所述第二计算设备使得所述可听输出被渲染,以及其中,所述第一计算设备提供对自动化助理的访问;基于处理所述音频数据,确定输出数据指示所述第二计算设备正尝试抑制经由能够检测来自所述第二计算设备的所述音频数据的一个或多个启用助理的设备能够访问的一个或多个自动化助理...

【专利技术属性】
技术研发人员:维克拉姆
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1