语音代理转发制造技术

技术编号:19906101 阅读:51 留言:0更新日期:2018-12-26 03:44
本发明专利技术公开了用于控制包括多个语音代理的语音代理网络中的语音输入检测的示例。示例性语音代理包括音频传感器、通信接口、处理器和存储指令的存储器装置,所述指令可由所述处理器执行,以经由所述音频传感器检测对应于语音输入的音频数据;并且响应于确定语音代理网络的至少一个其他语音代理正在检测对应于所述语音输入的音频数据,而确定检测到所述音频数据时的信号强度,将所述信号强度与来自所述至少一个其他语音代理的报告的信号强度进行比较,并基于将所述信号强度与来自所述至少一个其他语音代理的所述报告的信号强度进行比较来选择性地传输所述信号强度的指示和所述检测到的音频数据中的一个或多个。

【技术实现步骤摘要】
语音代理转发
本公开涉及控制联网语音控制装置中的语音数据处理。
技术介绍
语音控制装置可以响应于传感器数据和/或根据对检测到的状况的编程响应而执行各种功能。例如,语音控制装置可以充当个人助理并存储与一个或多个用户有关的数据,以便帮助一个或多个用户回答语音查询、控制连接的装置、管理日历、便签、通信等和/或以其他方式响应来自用户的语音输入。在一些示例中,语音控制装置被放置在用户的家、企业或其他环境中。语音控制装置的操作范围(例如,其中语音控制装置可以检测语音数据的区域)可以基于该语音控制装置的集成或以其他方式相关联的麦克风的特征。语音控制装置的范围可能没有大到足以覆盖整个房屋、建筑物或其他环境,尤其是考虑到障碍物诸如分隔房间的墙壁时,其会进一步缩小装置的有效范围。
技术实现思路
为了有效扩展一系列语音控制装置,可以在目标环境中部署多个装置。例如,在具有房间的房屋或其他建筑物中,可以将语音控制装置定位在每个房间中和/或分布在环境周围,以便能够在整个环境中检测到语音输入。在这样的示例中,每个语音控制装置可以充当语音代理网络的单独的语音代理。语音代理网络中的每个语音代理可以直接连接(例如,没有任何中间装置)到至少一个其他语音代理和/或相关联的网络装置,使得语音代理网络的每个语音代理直接或间接(例如,经由一个或多个其他语音代理和/或网络装置)连接到语音代理网络的每个其他语音代理。如上所述,语音代理网络的每个语音代理可以具有可以检测语音数据(例如,通过该语音代理的麦克风)的相关联的范围。选定的语音代理的语音代理区域因此可以由选定的语音代理的范围来定义和/或约束。为了提供给定环境的无缝覆盖,语音代理网络的语音代理区域可能至少部分重叠。当用户在部署语音代理网络的环境中移动时,用户可以穿过不同的语音代理区域。因此,如果用户在提供语音输入(例如,语音查询、语音命令等)时从第一语音代理的第一区域转变到第二语音代理的第二区域,则语音输入可以部分由第一语音代理检测并且部分由第二语音代理检测。由于典型的语音代理是单独操作的,因此在解决由多于一个语音代理检测到的语音输入时可能会出现困难。本公开提供了用于控制语音代理之间的语音数据转发和语音数据处理以便在用户在语音代理区域之间转变时避免丢失的系统和方法。公开了用于控制包括多个语音代理的语音代理网络中的语音输入检测的实施方案。示例性语音代理包括音频传感器、通信接口、处理器和存储指令的存储器装置,所述指令可由处理器执行以经由音频传感器检测对应于语音输入的第一音频数据;并且响应于确定语音代理网络的至少一个其他语音代理正在检测对应于语音输入的第二音频数据,而确定检测到第一音频数据时的信号强度,将所述信号强度与如从至少一个其他语音代理接收的第二音频数据的报告的信号强度进行比较,并且基于将第一音频数据的信号强度与如从至少一个其他语音代理接收的第二音频数据的报告的信号强度进行比较,来选择性地传输第一音频数据的信号强度的指示和检测到的音频数据中的一个或多个。用于控制语音代理网络中的语音输入检测的示例性方法包括:在第一语音代理处以第一信号强度检测对应于语音输入的第一音频数据;响应于确定第一信号强度高于由语音代理网络中的每个其他语音代理报告的所接收的信号强度,而将第一语音代理分配为主控语音代理;在将第一语音代理分配为主控语音代理时,从第一语音代理传输包括第一音频数据和检测到第一音频数据时的连续更新的信号强度的报告的流;以及响应于接收到网络中的第二语音代理以高于来自第一语音代理的当前报告的信号强度的信号强度检测到对应于语音输入的第二音频数据的指示,而将第二语音代理分配为主控语音代理并停止在第一语音代理处传输所述流。用于控制语音输入检测的示例性语音代理网络包括多个语音代理以及通信地耦合到多个语音代理和查询响应服务器的网络装置,多个语音代理中的第一语音代理包括存储指令的存储器装置,所述指令可由第一语音代理的处理器执行以以第一信号强度检测对应于语音输入的第一音频数据;响应于确定第一信号强度高于由语音代理网络中的每个其他语音代理报告的所接收的信号强度,而接收作为主控语音代理的分配;在将第一语音代理分配为主控语音代理时,传输包括第一音频数据和检测到第一音频数据时的连续更新的信号强度的报告的流;并且响应于接收到多个语音代理中的第二语音代理以高于来自第一语音代理的当前报告的信号强度的信号强度检测到对应于语音输入的第二音频数据的指示,而将第二语音代理分配为主控语音代理并在第一语音代理处停止传输所述流。附图说明通过参考附图阅读以下对非限制性实施方案的描述,可以更好地理解本公开,其中以下是:图1示出了根据本公开的一个或多个实施方案的用于部署语音代理的示例性环境;图2A和图2B示出了根据本公开的一个或多个实施方案的语音代理网络中的语音数据和控制消息转发的示例性通信图;图3示出了根据本公开的一个或多个实施方案的用于重建语音查询并生成语音查询响应的示例性通信图;图4示出了根据本公开的一个或多个实施方案的示例性语音代理网络的框图;图5是根据本公开的一个或多个实施方案的处理语音代理网络中的语音数据的示例性方法的流程图;图6是根据本公开的一个或多个实施方案的在语音代理网络中移交语音代理控制的示例性方法的流程图;以及图7是根据本公开的一个或多个实施方案的在语音代理网络中接收语音代理控制的移交的示例性方法的流程图。具体实施方式语音代理可以包括任何语音控制和/或语音响应装置,所述语音控制和/或语音响应装置检测语音输入并响应于语音输入而执行动作。例如,语音代理可以检测(例如,经由集成的或以其他方式相关联的麦克风)语音输入,所述语音输入可以包括语音查询(例如,“Whatistheweathertoday(今天是什么天气)”)、语音备忘录(例如,“Remembertobuymilk(记得买牛奶)”)、语音命令(例如,“Turnonlights(开灯)”)和/或其他语音数据。在多个语音代理分布在环境中的示例中,用户可以开始提供由第一语音代理检测到的语音输入(例如,开始语音输入字符串)。然而,当用户在环境中移动时,不同的语音代理可以检测到语音输入的不同部分(例如,语音输入字符串的后面部分)。增加进一步的复杂性,环境中的一些语音代理可能具有重叠的范围,使得语音输入的一部分被多个语音代理检测到。在完成语音输入(例如,完成语音查询)之后,由多个语音代理收集的语音数据可以被聚合和分析以解析语音数据并提供相关联的响应或执行相关联的动作。在许多示例中,上述处理可以在板外(例如,在远程服务器处)或至少仅在一个语音代理上执行。因此,在一些系统中,每个语音代理可以将所有检测到的语音数据发送到处理装置(例如,远程服务器和/或指定的语音代理)。为了减少在语音数据处理期间使用的处理负载和带宽资源,本公开提供了用于控制语音代理网络中的语音代理的系统和方法,使得仅单个语音代理(例如,主控语音代理)负责在给定时间将语音数据转发给网络和/或语音处理装置。特定地说,本公开提供了一种语音代理网络,其中基于检测到的语音数据的信号强度来选择语音代理作为主控语音代理,并且其中响应于确定另一个语音代理正在以高于当前主控语音代理的信号强度检测语音数据,主控语音代理转发控制(例如,将另一个语本文档来自技高网...

【技术保护点】
1.一种语音代理,其包括:音频传感器;通信接口;处理器;以及存储指令的存储器装置,所述指令由所述处理器执行以:经由所述音频传感器检测对应于语音输入的第一音频数据;以及响应于确定语音代理网络的至少一个其他语音代理正在检测对应于所述语音输入的第二音频数据:确定检测到所述第一音频数据时的信号强度,将所述信号强度与从所述至少一个其他语音代理接收的所述第二音频数据的报告的信号强度进行比较,以及基于将所述第一音频数据的所述信号强度与从所述至少一个其他语音代理接收的所述第二音频数据的所述报告的信号强度进行比较,来选择性地传输所述第一音频数据的所述信号强度的指示和所述检测到的音频数据中的一个或多个。

【技术特征摘要】
2017.06.13 US 15/621,6781.一种语音代理,其包括:音频传感器;通信接口;处理器;以及存储指令的存储器装置,所述指令由所述处理器执行以:经由所述音频传感器检测对应于语音输入的第一音频数据;以及响应于确定语音代理网络的至少一个其他语音代理正在检测对应于所述语音输入的第二音频数据:确定检测到所述第一音频数据时的信号强度,将所述信号强度与从所述至少一个其他语音代理接收的所述第二音频数据的报告的信号强度进行比较,以及基于将所述第一音频数据的所述信号强度与从所述至少一个其他语音代理接收的所述第二音频数据的所述报告的信号强度进行比较,来选择性地传输所述第一音频数据的所述信号强度的指示和所述检测到的音频数据中的一个或多个。2.根据权利要求1所述的语音代理,其中所述指令进一步可执行以通过以下动作来确定至少一个其他语音代理正在检测对应于所述语音输入的音频数据:从另一个语音代理接收与所述语音输入相关联的第一语音指纹,确定所述音频数据的第二语音指纹,以及将所述第二语音指纹与所述第一语音指纹进行比较以确定所述第二语音指纹与所述第一语音指纹匹配。3.根据权利要求1所述的语音代理,其中所述指令进一步可执行以响应于从所述至少一个其他语音代理的选定语音代理接收到高于检测到所述音频数据时的当前信号强度的第三音频数据的报告的信号强度,而停止传输所述检测到的音频数据。4.根据权利要求1所述的语音代理,其中所述指令进一步可执行以检测所述语音输入的结束的指示,并且响应于检测到所述语音输入的结束的所述指示,选择性地将指示所述语音输入的结束的消息传输到所述语音代理网络的至少一个网络装置。5.根据权利要求4所述的语音代理,其中选择性地传输所述消息包括:如果在检测到所述语音输入的结束的所述指示时所述语音代理正在传输检测到的音频数据,则传输所述消息;以及如果在检测到所述语音输入的结束的所述指示时所述语音代理没有在传输检测到的音频数据,则不传输所述消息。6.根据权利要求4所述的语音代理,其还包括输出装置,并且其中所述指令进一步可执行以基于在检测到所述语音输入的结束的所述指示时所述语音代理是否正在传输检测到的音频数据,来选择性地接收针对所述语音输入的响应并经由所述输出装置将所述响应输出。7.根据权利要求1所述的语音代理,其中所述指令进一步可执行以开始检测对应于所述语音输入的所述音频数据,并且响应于检测到预定义的唤醒词,而向所述语音代理网络中的每个其他语音代理报告检测到所述音频数据时的信号强度。8.根据权利要求1所述的语音代理,其中所述指令进一步可执行以响应于所述语音代理加入所述语音代理网络而传输通告消息。9.根据权利要求1所述的语音代理,其中选择性地传输所述信号强度的指示和所述检测到的音频数据中的一个或多个包括:响应于被分配为主控语音代理,将所述检测到的音频数据和所述信号强度的所述指示传输到所述语音代理网络的至少一个网络装置;以及响应于确定所述信号强度高于所述至少一个其他语音代理的所述报告的信号强度和所述语音代理当前未被分配成为所述主控语音代理,仅将所述信号强度的所述指示传输到所述语音代理网络的至少一个网络装置。10.一种控制包括多个语音代理的语音代理网络中的语音输入检测的方法,所述方法包括:在所述多个语音代理的第一语音代理处以第一信号强度检测对应于语音输入的第一音频数据;响应于确定所述第一信号强度高于所述语音代理网络中的每个其他语音代理报告的所接收的信号强度,而将所述第一语音代理分配作为主控语音代理;在将所述第一语音代...

【专利技术属性】
技术研发人员:C冈瑟
申请(专利权)人:哈曼国际工业有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1