开发人员语音动作系统技术方案

技术编号:29258344 阅读:33 留言:0更新日期:2021-07-13 17:31
本公开涉及开发人员语音动作系统,用于接收指定用于不同于该语音动作系统的应用的新语音动作的数据。至少基于该数据,生成用于该应用的语音动作意图,其中,语音动作意图包括当由该应用接收时,请求该应用执行为该新语音动作指定的一个或多个操作的数据。语音动作意图与对该新语音动作指定的触发项相关联。语音动作系统被配置为接收由已安装该应用的设备获得的用户话语的指示,并且确定用户话语的转录抄本对应于与该语音动作意图相关联的触发项。响应于该确定,语音动作系统将语音动作意图提供给该设备。

【技术实现步骤摘要】
开发人员语音动作系统分案说明本申请属于申请日为2016年12月28日的中国专利技术专利申请201611235770.X的分案申请。
本说明书涉及语音动作,以及一个具体实现方式涉及配置语音动作。
技术介绍
应用中的任务能包括在用户交互以执行某一作业的软件中定义的一个或多个活动。活动是控制任务的执行的生命周期的类别,在任务内训练的多个活动能允许用户执行作业。在一些实现方式中,命令能与活动或有关活动的动作相关联,使得命令的用户提交能触发活动或动作。能激发特定意图来触发开始活动或执行动作。
技术实现思路
本说明书描述允许应用开发人员部署用于先前安装的软件应用的新语音动作的平台。通常,使用该平台,应用开发人员能提交定义新语音动作的信息,其中,该信息指定该应用、将新语音动作指向触发的动作、用于触发动作的触发项以及触发项应当有效触发应用中的动作的上下文。当语音动作将要对触发应用中的动作有效时,由应用开发人员提交的上下文能指定用户设备状态。设备状态能例如包括哪一个或多个应用在前台(即,目前在设备的用户界面中有效)或后台(例如,目前在设备的用户界面中看不到)中操作,或能包括有关应用的特定信息,诸如什么活动目前正运行、运动活动的状态等。当应用开发人员提交定义新语音动作的信息时,服务或工具能验证定义新语音动作的信息来确定新语音动作是否与应用兼容,或者否则确定是否能实现新语音动作。如果新语音动作有效,通过引入定义新语音动作的信息,为该语音动作创建称为意图并且具有特定格式的无源数据结构的新实例。该意图能指定定义新语音动作的一些或全部信息,诸如应用、触发项、响应于检测触发项触发的活动或动作,和触发项触发活动或动作所需的上下文。然后,对该应用,能部署语音动作,使得语音动作变为用于该应用的启用的语音动作,无需对应用代码做额外变更来支持该语音动作。一旦部署了语音动作,操作用户设备的用户能提供语音输入。用户设备能提交用于该用户设备的上下文信息,并且能使用上下文信息和语音输入的转录抄本来识别意图和触发所识别的意图。当触发意图时,用于执行活动或动作的数据被确定,并且被传送到用户设备以响应于该语音输入,执行活动或动作。例如,媒体播放器应用的应用开发人员能定义使用触发项“播放下一首(playnext)”,用于跳到下一首歌的新语音动作。当应当启用“播放下一首”语音动作时,应用开发人员能指定上下文。例如,应用开发人员可以指定,仅当媒体播放器应用在前台中运行并且处于使媒体播放器应用操作为音频播放器的模式中时,“播放下一首”语音动作应当导致媒体播放器应用跳到下一首歌。在通过应用开发人员部署语音动作后,将媒体播放器应用先前安装在他们的用户设备上的用户提交语音输入“播放下一首”。用户设备能提交指示用户设备或安装在用户设备上的应用的状态的上下文信息,诸如指示媒体播放器应用在前台中运行并且处于音频播放器模式中的上下文信息。响应于接收语音输入“播放下一首”和指定上下文的信息,能将使得媒体播放器应用跳到下一首歌的数据传送到用户设备。相反,如果确定语音输入为说出“播放下一首”,但上下文信息指示社交网络应用在用户设备的前台运行,而不是媒体播放器应用,那么“播放下一首”语音输入不具有任何效果,或会导致在用户设备处执行不同操作。在本说明书中描述的主题的创新方面可以体现在方法中,该方法包括如下动作:由语音动作系统接收指定用于不同于所述语音动作系统的软件应用的新语音动作的数据,所述数据包括用于执行该新语音动作的一个或多个操作和用于触发该新语音动作的一个或多个触发项;至少基于接收的数据,由该语音动作系统生成用于该软件应用的上下文语音动作意图,其中,该上下文语音动作意图包括当被该软件应用接收时,请求该软件应用执行该新语音动作的一个或多个操作的数据;由该语音动作系统将该上下文语音动作意图与用于该新语音动作的一个或多个触发项相关联;其中,该语音动作系统被配置为:接收由安装有该软件应用的设备获得的用户话语的指示;确定该用户话语的转录抄本对应于与该上下文语音动作意图相关联的一个或多个触发项;以及响应于该确定,将该上下文语音动作意图提供给该设备,由此请求安装在该设备上的软件应用执行新语音动作的一个或多个操作。这些和其他实施例可以每一个可选地包括下述特征中的一个或多个。在各个示例中,接收的数据指定上下文,该上下文指定当启用该新语音动作时,该设备或该软件应用的状态;该上下文指定该软件应用正在安装有软件应用的设备的前台中操作;该上下文指定该软件应用正在安装有软件应用的设备的后台中操作;该上下文指定该软件应用正在执行特定活动;该上下文指定该软件应用正执行的特定活动处于特定活动状态。在其他示例中,这些和其他实施例可以每一个可选地包括下述特征:将该上下文语音动作意图与用于新语音动作的上下文相关联;由该语音动作系统接收指示安装有该软件应用的特定设备或安装在该特定设备上的软件应用的状态的上下文信息;确定该上下文信息满足用于新语音动作的上下文;以及响应于确定由特定设备获得的用户话语的转录抄本对应于与上下文语音动作意图相关联的一个或多个触发项以及该上下文信息满足与该上下文语音动作意图相关联的上下文,由该语音动作系统将上下文语音动作意图提供给该特定设备,由此请求安装在特定设备上的软件应用执行新语音动作的一个或多个操作;接收指示特定设备或安装在特定设备上的软件应用的状态的上下文信息包括:由语音动作系统将用于特定上下文信息的请求提供给特定设备;以及响应于该请求,接收特定上下文信息。在其他示例中,这些和其他实施例可以每一个包括一个或多个特征,包括:确定该上下文信息满足用于第二语音动作的上下文,并且用户话语的转录抄本对应于与用于该第二语音动作的意图相关联的一个或多个触发项,其中,用于第二语音动作的意图指定用于执行第二语音动作的一个或多个操作;响应于该确定,从新语音动作和第二语音动作中选择语音动作;以及由该语音动作系统将与选择的语音动作相关联的意图提供给该特定设备,由此请求安装在该特定设备上的软件应用执行选择的语音动作的一个或多个操作;从该新语音动作和第二语音动作中选择选择的语音动作包括响应于接收指示用户选择新语音动作或第二语音动作中的一个的数据,选择选择的语音动作;从该新语音动作和第二语音动作选择选择的语音动作包括:向该新语音动作和选择的语音动作中的每一个分配得分;以及至少基于分配给新语音动作和第二语音动作的每一个的得分,选择选择的语音动作;从该新语音动作和第二语音动作中选择选择的语音动作包括响应于确定与选择的语音动作相关联的软件应用正在前台中操作,选择选择的语音动作。在其他示例中,这些和其他实施例可以每一个包括一个或多个特征,包括:生成用于该软件应用的上下文语音动作意图包括确定新语音动作的一个或多个操作能够由该软件应用执行;确定由安装有该软件应用的特定设备获得的用户话语的转录抄本与该上下文语音动作意图相关联的一个或多个触发项类似;响应于该确定,由该语音动作系统将指示确认该用户话语是否指定一个或多个触发项,或旨在使该软件应用执行该新语音动作的用于用户输入的请求的数本文档来自技高网...

【技术保护点】
1.一种用于生成语音动作的方法,所述方法由语音动作系统的一个或多个处理器实现,并且所述方法包括:/n接收定义对安装在一个或多个设备上的软件应用当前不存在的新语音动作的数据,所述软件应用不同于所述语音动作系统,所述数据指示用于所述软件应用执行所述新语音动作的一个或多个操作和用于触发所述新语音动作的一个或多个触发项,其中,定义所述新语音动作的数据指定上下文,所述上下文指定安装在用户设备上的所述软件应用的模式的某一状态;/n至少基于定义所述新语音动作的数据,生成语音动作无源数据结构,其中,所述语音动作无源数据结构包括当被所述软件应用接收时,使得所述软件应用执行用于执行所述新语音动作的一个或多个操作的数据;/n将所述语音动作无源数据结构与所述上下文且与用于触发所述新语音动作的所述一个或多个触发项相关联,其中,多个语音动作无源数据结构被定义在所述语音动作系统中;/n接收(i)由所述用户设备获得的用户命令话语,所述用户设备安装有所述软件应用,以及(ii)关于所述用户设备的当前上下文信息,其中,所述当前上下文信息包括当前应用状态,所述当前应用状态是由所述软件应用提供并且指示所述软件应用是否具有所述模式的所述某一状态;/n响应于确定所述当前应用状态指示所述软件应用具有所述模式的所述某一状态,包括与所述语音动作无源数据结构相关联的所述一个或多个触发项作为所述当前上下文的候选触发;/n确定所述用户命令话语是否对应于所述一个或多个触发项,其中,响应于包括所述一个或多个触发项作为所述当前上下文的所述候选触发而确定所述用户命令话语是否对应于所述一个或多个触发项;/n确定所述用户命令话语对应于与所述语音动作无源数据结构相关联的所述一个或多个触发项;以及/n响应于确定所述用户命令话语对应于所述一个或多个触发项,使用与所述语音动作无源数据结构相关联的所述语音动作无源数据结构,以使得安装在所述用户设备上的所述软件应用执行所述新语音动作的所述一个或多个操作。/n...

【技术特征摘要】
20160301 US 15/057,4531.一种用于生成语音动作的方法,所述方法由语音动作系统的一个或多个处理器实现,并且所述方法包括:
接收定义对安装在一个或多个设备上的软件应用当前不存在的新语音动作的数据,所述软件应用不同于所述语音动作系统,所述数据指示用于所述软件应用执行所述新语音动作的一个或多个操作和用于触发所述新语音动作的一个或多个触发项,其中,定义所述新语音动作的数据指定上下文,所述上下文指定安装在用户设备上的所述软件应用的模式的某一状态;
至少基于定义所述新语音动作的数据,生成语音动作无源数据结构,其中,所述语音动作无源数据结构包括当被所述软件应用接收时,使得所述软件应用执行用于执行所述新语音动作的一个或多个操作的数据;
将所述语音动作无源数据结构与所述上下文且与用于触发所述新语音动作的所述一个或多个触发项相关联,其中,多个语音动作无源数据结构被定义在所述语音动作系统中;
接收(i)由所述用户设备获得的用户命令话语,所述用户设备安装有所述软件应用,以及(ii)关于所述用户设备的当前上下文信息,其中,所述当前上下文信息包括当前应用状态,所述当前应用状态是由所述软件应用提供并且指示所述软件应用是否具有所述模式的所述某一状态;
响应于确定所述当前应用状态指示所述软件应用具有所述模式的所述某一状态,包括与所述语音动作无源数据结构相关联的所述一个或多个触发项作为所述当前上下文的候选触发;
确定所述用户命令话语是否对应于所述一个或多个触发项,其中,响应于包括所述一个或多个触发项作为所述当前上下文的所述候选触发而确定所述用户命令话语是否对应于所述一个或多个触发项;
确定所述用户命令话语对应于与所述语音动作无源数据结构相关联的所述一个或多个触发项;以及
响应于确定所述用户命令话语对应于所述一个或多个触发项,使用与所述语音动作无源数据结构相关联的所述语音动作无源数据结构,以使得安装在所述用户设备上的所述软件应用执行所述新语音动作的所述一个或多个操作。


2.如权利要求1所述的计算机实现的方法,其中,所述新语音动作是所述软件应用未被编程以支持的启用语音的命令。


3.如权利要求1所述的计算机实现的方法,其中,接收定义所述新语音动作的所述数据包括从发布了所述软件应用的开发人员接收所述数据。


4.如权利要求1所述的计算机实现的方法,其中,所述语音动作系统从安装在所述用户设备上的所述软件应用未接收到定义所述新语音动作的所述数据。


5.如权利要求1所述的计算机实现的方法,其中,生成所述语音动作无源数据结构包括确定用于执行所述新语音动作的一个或多个操作能够由所述软件应用执行。


6.如权利要求1所述的计算机实现的方法,包括:
接收部署所述新语音动作的请求;以及
响应于所述请求,部署所述新语音动作,其中,部署所述新语音动作启用触发所述新语音动作。


7.如权利要求1所述的计算机实现的方法,包括:
接收撤销部署所述新语音动作的请求;以及
响应于所述请求,撤销部署所述新语音动作,其中,撤销部署所述新语音动作禁用触发所述新语音动作。


8.如权利要求1所述的计算机实现的方法,包括:
接收启用所述新语音动作的测试的请求,其中,所述请求指定应当为其启用所述新语音动作的一个或多个设备;以及
响应于所述请求,启用触发用于一个或多个指定的设备的新语音动作,其中,对不包括在所述指定的一个或多个设备中的设备,禁用触发所述新语音动作。


9.如权利要求1所述的计算机实现的方法,进一步包括:
基于所述数据确定所述新语音动作对所述软件应用是否有效;以及
基于所述新语音动作对所述软件应用是有效的所述确定,引入所述新语音动作以生成所述语音动作无源数据结构。...

【专利技术属性】
技术研发人员:王波苏尼尔·韦缪里巴纳比·约翰·詹姆斯斯科特·B·赫夫曼普拉维尔·库马尔·古普塔
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1