用于言语设备控制的多用户虚拟助手制造技术

技术编号:23563889 阅读:34 留言:0更新日期:2020-03-25 08:19
在一个示例中,一种方法包括:接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;基于所述音频数据而识别提供了所述口头话语的用户;基于所述音频数据而识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于所述口头话语;确定所识别的用户是否被授权以致使执行所识别的自动化动作;以及响应于确定所识别的用户被授权以致使执行所识别的自动化动作,致使所述一个或多个自动化设备执行所识别的自动化动作。

Multi user virtual assistant for speech device control

【技术实现步骤摘要】
【国外来华专利技术】用于言语设备控制的多用户虚拟助手
技术介绍
一些计算平台可以提供用户接口,用户可以从所述用户接口与虚拟的计算助手(例如,也称为“智能助手”或简称为“助手”)聊天、讲话或以其它方式进行沟通,以致使所述助手响应于用户的需求输出有用的信息,或另外执行某些操作以帮助用户完成多种真实世界或虚拟任务。举例来说,一些助手可以触发自动化设备来执行自动化动作以满足用户请求。遗憾的是,这种助手可能无法区分不同的用户,并且可能会触发自动化操作的执行而不考虑提供请求的用户的身份。
技术实现思路
通常而言,本公开的技术可以使虚拟计算助手(例如,也称为“智能助手”或简称为“助手”)能够选择性地致使自动化设备基于提出请求的用户的身份和相关联的访问权限(例如,许可、授权等)而执行满足口头或言语用户请求的自动化动作。举例来说,计算设备可以利用麦克风来接收对应于用户话语的声学输入(例如,音频数据)。基于声学输入,计算设备可以识别提供了口头话语的用户,并且识别用于满足所述话语的自动化动作(例如,使用语音识别)。如果用户具有致使执行识别的自动化动作的访问权限,则计算设备可以发起所述自动化动作的执行(即,致使一个或多个自动化设备执行所述自动化动作)。类似地,如果用户不具有致使执行识别的自动化动作的访问权限,则计算设备可以避免发起自动化动作的执行。通过这种方式,所述助手可以防止用户触发其未经授权的自动化动作。为此,所述助手可以提高自动化动作的口头或言语触发的安全性。在一个示例中,一种方法包括:接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;基于所述音频数据而识别提供了口头话语的用户;由一个或多个处理器并基于音频数据,识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于口头话语;由一个或多个处理器确定识别的用户是否被授权以致使执行识别的自动化动作;以及响应于确定识别的用户被授权以致使执行识别的自动化动作,由所述一个或多个处理器致使所述一个或多个自动化设备执行识别的自动化动作。在另一示例中,一种计算系统包括:通信模块;至少一个处理器;以及至少一个存储器。在该示例中,至少一个存储器包括指令,所述指令当被执行时致使至少一个处理器提供助手,所述助手被配置成:经由通信模块,接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;获得提供了口头话语的用户的标识,所述标识基于音频数据而确定;基于音频数据,识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于口头话语;确定识别的用户是否被授权以致使执行识别的自动化操作;以及响应于确定识别的用户被授权以致使执行识别的自动化动作,致使所述一个或多个自动化设备执行识别的自动化动作。在另一示例中,一种计算机可读存储介质存储指令,所述指令当被执行时致使计算系统的至少一个处理器:接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;获得提供了口头话语的用户的标识,所述识别基于音频数据而确定;基于音频数据而识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于口头话语;确定识别的用户是否被授权以致使执行识别的自动化操作;以及响应于确定识别的用户被授权以致使执行识别的自动化动作,致使所述一个或多个自动化设备执行识别的自动化动作。在另一示例中,一种计算系统或计算设备包括:用于接收由计算设备的一个或多个麦克风生成的音频数据的装置,所述音频数据表示口头话语;用于基于音频数据而识别提供了口头话语的用户的装置;用于基于音频数据而识别与一个或多个自动化设备相关联的自动化动作的装置,所述自动化动作对应于口头话语;用于确定识别的用户是否被授权以致使执行识别的自动化操作的装置;以及用于响应于确定识别的用户被授权以致使执行识别的自动化动作,致使所述一个或多个自动化设备执行识别的自动化动作的装置。一个或多个示例的细节在附图和以下描述中阐述。根据说明书和附图以及根据权利要求,本公开的其它特征、目标和优点将是显而易见的。附图说明图1是示出根据本公开的一个或多个方面的执行示例性虚拟助手的示例性系统的概念图。图2是示出根据本公开的一个或多个方面的被配置成执行示例性虚拟助手的示例性计算设备的框图。图3是示出根据本公开的一个或多个方面的由执行示例性虚拟助手的一个或多个处理器执行的示例性操作的流程图。图4是示出根据本公开的一个或多个方面的被配置成执行示例性虚拟助手的示例性计算设备的框图。图5是示出根据本公开的一个或多个方面的由执行示例性虚拟助手的一个或多个处理器执行的示例性操作的流程图。具体实施方式图1是示出根据本公开的一个或多个方面的执行示例性虚拟助手的示例性系统的概念图。图1的系统100包括经由网络130与自动化设备106A到106N(统称为“自动化设备106”)通信的数字助手系统160、搜索服务器系统180和计算设备110。虽然系统100被示出为分布在助手自动化设备106、数字助手系统160、搜索服务器系统180和计算设备110中,但是在其它示例中,归因于系统100的特征和技术可以由计算设备110的本地部件在内部执行。类似地,数字助手系统160可以包括某些部件并且执行各种技术,所述技术在以下描述中另外归因于搜索服务器系统180和/或计算设备110。网络130表示用于在计算系统、服务器与计算设备之间传输数据的任何公共或专用通信网络,例如蜂窝、Wi-Fi和/或其它类型的网络。数字助手系统160可以经由网络130与计算设备110交换数据,以当计算设备110连接至网络130时提供可被计算设备110访问的虚拟助手服务。数字助手系统160可以经由网络130与搜索服务器系统180交换数据,以访问由搜索服务器系统180提供的搜索服务。计算设备110可以经由网络130与搜索服务器系统180交换数据,以访问由搜索服务器系统180提供的搜索服务。网络130可以包括可操作地相互联接从而提供系统160和180与计算设备110之间的信息交换的一个或多个网络集线器、网络交换机、网络路由器或任何其它网络设备。计算设备110、数字助手系统160和搜索服务器系统180可以使用任何适当的通信技术跨网络130传输和接收数据。计算设备110、数字助手系统160和搜索服务器系统180可以各自使用相应的网络链路可操作地联接到网络130。将计算设备110、数字助手系统160和搜索服务器系统180联接到网络130的链路可以是以太网或其它类型的网络连接,并且这种连接可以是无线和/或有线连接。数字助手系统160和搜索服务器系统180表示能够向诸如网络130等网络发送信息以及从所述网络接收信息的任何合适的远程计算系统,诸如一个或多个台式计算机、膝上型计算机、大型机、服务器、云计算系统等。数字助手系统160对于虚拟助手服务作为主机(或至少提供对虚拟助手服务的访问)。搜索服务器系统180对于搜索服务作为主机(或至少提供对搜索服务的访问)。在一些示例中,数字助手系统160和搜索服务器系统180表示云计算系统,所述云计算系统经由云提供本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;/n基于所述音频数据而识别提供了所述口头话语的用户;/n由一个或多个处理器并基于所述音频数据,识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于所述口头话语;/n由所述一个或多个处理器确定所识别的用户是否被授权以致使执行所识别的自动化动作;以及/n响应于确定所识别的用户被授权以致使执行所识别的自动化动作,由所述一个或多个处理器致使所述一个或多个自动化设备执行所识别的自动化动作。/n

【技术特征摘要】
【国外来华专利技术】20170407 US 15/481,9481.一种方法,包括:
接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;
基于所述音频数据而识别提供了所述口头话语的用户;
由一个或多个处理器并基于所述音频数据,识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于所述口头话语;
由所述一个或多个处理器确定所识别的用户是否被授权以致使执行所识别的自动化动作;以及
响应于确定所识别的用户被授权以致使执行所识别的自动化动作,由所述一个或多个处理器致使所述一个或多个自动化设备执行所识别的自动化动作。


2.根据权利要求1所述的方法,其中,确定所识别的用户是否被授权以致使执行所识别的自动化动作包括:
确定所识别的用户是否被授权以利用与所识别的自动化动作相关联的所述一个或多个自动化设备;以及
响应于确定所识别的用户被授权以利用与所识别的自动化动作相关联的所述一个或多个自动化设备,确定所识别的用户被授权以致使执行所识别的自动化动作。


3.根据权利要求1或权利要求2所述的方法,其中,识别提供了所述口头话语的所述用户包括:
确定所述口头话语是否由向所述计算设备注册的多个用户中的一个提供;以及
响应于确定所述口头话语不是由向所述计算设备注册的所述多个用户中的一个提供,将提供了所述口头话语的所述用户识别为未向所述计算设备注册的访客用户。


4.根据权利要求3所述的方法,其中,确定所识别的用户是否被授权以致使执行所识别的自动化动作包括:
确定访客用户被授权以致使执行所识别的自动化动作。


5.根据前述权利要求中的任何一项所述的方法,其中,所述一个或多个处理器被包括在与所述计算设备不同的计算系统中,并且其中,接收所述音频数据并识别所述用户包括:
由所述计算系统的所述一个或多个处理器并且从所述计算设备接收所述音频数据和所识别的用户的指示,其中,致使所述一个或多个自动化设备来执行所识别的自动化动作包括:
由所述计算系统的所述一个或多个处理器并且向所述一个或多个自动化设备输出请求执行所识别的自动化动作的消息。


6.根据权利要求5所述的方法,其中,所述消息不包括所识别的用户的指示。


7.根据前述权利要求中的任何一项所述的方法,其中,所述一个或多个处理器被包括在所述计算设备或一个或多个其它计算设备中的至少一个中。


8.根据前述权利要求中的任何一项所述的方法,其中,识别所述自动化动作包括:
基于所述音频数据而确定多个自动化动作候选;
为所述自动化动作候选中的每个相应自动化动作候选确定得分,所述得分指示所述相应自动化动作候选对应于所述口头话语的可能性;以及
选择所述多个自动化动作候选中的具有指示对应于所述口头话语的最高可能性的得分的自动化动作候选作为所识别的自动化动作。


9.根据权利要求8所述的方法,所述方法还包括:
相对于对应于所识别的用户未被授权以致使执行的自动化动作的自动化动作候选的得分,来调整对应于所识别的用户被授权以致使执行的自动化动作的自动化动作候选的得分。


10.根据前述权利要求中的任何一项所述的方法,其中,所述音频数据是第二音频数据,所述方法还包括:
基于由所述计算设备识别的触发短语,从由所述一个或多个麦克风生成的第一音频数据中接收所述音频数据,其中,向所述计算设备注册的多个用户中的每个用户与相应的触发短语相关联,其中,与所述多个用户中的第一用户相关联的触发短语不同于与所述多个用户中的第二用户相关联的触发短语,并且其中,识别提供了所述口头话语的所述用户包括:
至少部分地基于由所述计算设备识别的所述触发短语,识别提供了所述口头话语的所述用户。


11.一种计算系统,所述计算系统包括:
通信模块;
至少一个处理器;以及
至少一个存储器,所述至少一个存储器包括指令,所述指令当被执行时,致使所述至少一个处理器提供助手,所述助手被配置成:
经由所述通信模块,接收由计算设备的一个或多个麦克风生成的音频数据,所述音频数据表示口头话语;
获得提供了所述口头话语的用户的标识,所述标识基于所述音频数据而确定;
基于所述音频数据而识别与一个或多个自动化设备相关联的自动化动作,所述自动化动作对应于所述口头话语;
确定所识别的用户是否被授权以致使执行所识别的自动化动作;以及
响应于确定所识别的用户被授权以致使执行所识别的自动化动作,致使所述一个或多个自动化设备执行所识别的自动化动作。


12.根据权利要求11所述的计算系统,其中,为了确定所识别的用户是否被授权以致使执行所识别的自动化动作,所述助手被配置成:
确定所识别的用户是否被授权以利用与所识别的自动化动作相关联的所述一个或多个自动化设备;以及
响应于确定所识别的用户被授权以利用与所识别的自动化动作相关联的所述一个或多个自动化设备,确定所识别的用户被授权以致使执行所识别的自动化动作。


13.根据权利要求11或权利要求12所述的计算系统,其中,为了识别提供了所述口头话语的所述用户,所述助手被配置成...

【专利技术属性】
技术研发人员:倪宇钊大卫·罗伊·沙伊雷尔
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1