当前位置: 首页 > 专利查询>谷歌公司专利>正文

开发者语音动作系统技术方案

技术编号:31619061 阅读:29 留言:0更新日期:2021-12-29 18:53
方法、系统和装置,用于接收识别应用程序和语音命令触发术语的数据,验证接收到的数据,引导接收到的数据以产生指定应用程序、语音命令触发术语和一个或多个至少基于所述语音命令触发术语确定的其他语音命令触发术语的被动数据结构,以及将所述被动数据结构存储在语境意图数据库中,其中所述语境意图数据库包括一个或多个其他被动数据结构。包括一个或多个其他被动数据结构。包括一个或多个其他被动数据结构。

【技术实现步骤摘要】
开发者语音动作系统
[0001]本申请是申请日为2016年04月12日、申请号为201680019717.8、专利技术名称为“开发者语音动作系统”的专利技术专利申请的分案申请。


[0002]本说明书一般地但不排他地涉及语音命令,并且一个特定实现涉及配置语音命令。

技术介绍

[0003]在软件中定义的行为可以指定任务,其中行为是控制任务执行的生命周期的类。意图是被动的数据结构,其可以指定特定行为和与特定行为相关联的应用程序。意图可以由应用程序触发,并且可以使得由该意图指定的行为在由该意图指定的目标应用程序上执行或由该应用程序执行。

技术实现思路

[0004]被称为意图的被动数据结构可以指定要在应用程序上执行或者由应用程序执行的应用程序和行为,其中行为是在应用程序上执行或由该应用程序执行的任务。意图可以指定一个或多个可用于触发意图的触发短语,使得意图的触发导致由指定的应用程序执行行为。例如,意图可以与针对出租车服务的应用程序相关联,并且可以指定一个或多个作为语音动作来操作的触发短语,使得当用户说话时,检测到触发短语中的一个触发短语触发出租车服务应用程序的启动。除了由意图指定的应用程序以外,意图可以由应用程序或操作系统触发,使得应用程序的触发导致指定行为在特定应用程序上执行或者由其执行。
[0005]由主机提供的服务或工具可使得应用程序开发者能够请求指定他们正在开发的特定应用程序的新意图。针对新意图的提交可以是语法的形式,其中开发者可以向服务或工具提交语法,并且该服务或工具可以基于该语法为特定应用程序产生意图。
[0006]新意图的产生可以通过增加可以被提供给应用程序以使得实现特定结果的输入的数量和范围来增强正在开发的特定应用程序的灵活性。因此,正在开发的应用程序的可靠性可以被提高,因为可以确保特定应用程序将以正确的方式响应用户的输入,用户输入的处理得到改善。
[0007]在一些实现中,开发者提交的语法可以指定应用程序、触发短语、行为或复合行为、语境或其他信息中的一个或多个。语法由开发者提交,并由开发者语音动作服务或工具通过网络接收。开发者语音动作服务或工具可以验证语法。例如,语法的验证可以涉及确定触发短语是否已经与用于操作系统或另一应用程序的意图相关联、可以确定由语法指定的行为是否可以由指定的应用程序执行、可以确定触发短语是否符合某些标准、可以确定所提交的语法的格式是否在语法上有效、或者可以以其他方式确定由开发者提交的语法是否是可用于创建新意图的可行语法。
[0008]有效语法可以由开发者语音动作服务或工具引导以将语法转换为意图并扩展语
法中指定的触发短语。例如,语法的引导可以涉及将以第一格式提交的语法转换成第二格式的意图。除了将语法转换成意图之外,开发者提交的触发短语可以被扩展为包括其他相关的触发短语。例如,可以将一个或多个触发短语扩展规则、同义词规则、术语可选规则或其他规则应用于触发短语以产生与该意图相关联的一个或多个相关的触发短语。所产生的意图可以与一个或多个其他意图一起存储在语境意图数据库中,该一个或多个其他意图中的每一个意图与应用程序、一个或多个触发短语、以及可选地行为、复合行为、语境或者涉及该意图或该意图的触发的其他信息相关联。
[0009]基于语法验证的新意图的产生意味着开发者不需要通过直接输入该意图本身来产生新的意图。如上所述,语法可以具有可以在归纳过程中转换的特定格式,并且该转换过程能够扩大可以是新意图的适当候选者的语法数量,因为放松了对输入语法格式的要求。因此,可以开发应用程序以包括具有较少用户输入的新意图。
[0010]在开发者提交的语法已经被建立为意图之后,用户可以向客户端设备提供语音输入。用户的语音输入可以被转录以产生语音输入的转录,并且该转录可以同与存储在语境意图数据库或指定意图的一个或多个其他数据库(比如包括与操作客户端设备的系统相关联的意图的数据库)相关联的一个或多个触发短语相匹配。基于确定转录的一部分同与特定意图相关联的触发短语相匹配,可以触发意图以使得与该意图相关联的行为在由特定意图指定的应用程序上执行或由该应用程序执行。
[0011]例如,与启动出租车服务应用程序相关联的意图可以与触发短语“呼叫出租车”相关联。基于接收包括短语“呼叫出租车”的用户语音输入的客户端设备,客户端设备或其他系统可以触发出租车服务应用程序的启动。
[0012]本说明书中描述的主题的创新方面可以体现在包括下列动作的方法中:接收识别应用程序和语音命令触发术语的数据,验证接收到的数据,引导接收到的数据以产生指定应用程序、语音命令触发术语以及至少基于该语音命令触发术语确定的一个或多个其他语音命令触发术语的意图,并将该意图存储在语境意图数据库中,其中该语境意图数据库包括一个或多个其他意图。这些方面的其他实施例包括被配置为执行在计算机存储设备上编码的方法的动作的对应系统、装置和计算机程序。
[0013]这些和其他实施例可以各自可选地包括以下特征中的一个或多个。在各个示例中,验证接收到的数据包括确定语音命令触发术语不与不同于所识别的应用程序的应用程序相关联。该动作包括接收识别动作的数据,其中验证接收到的数据包括确定所识别的动作与所识别的应用程序兼容。引导接收到的数据以产生指定应用程序的意图,语音命令触发术语和至少基于该语音命令触发术语确定的一个或多个其他的语音命令触发术语包括将识别应用程序的接收数据、和语音命令触发术语转换为不同的数据格式。引导接收数据以产生指定应用程序、语音命令触发术语和至少基于该语音命令触发术语确定的一个或多个其他的语音命令触发术语的意图,包括:通过对该语音命令触发术语应用一个或多个同义词规则、可选规则或扩展规则,产生至少基于该语音命令触发术语而确定的一个或多个其他语音命令触发术语。
[0014]该动作包含:获得包括用户所说言语的音频数据,至少基于该音频数据产生该用户所说言语的转录,确定该转录的至少一部分与由存储在语境意图数据库中的意图所指定的特定的语音命令触发术语匹配,其中该意图指定特定应用程序、以及特定的语音命令触
发术语,并且基于确定该转录的至少一部分与由该意图指定的特定的语音命令触发术语相匹配,使得任务被执行。使得任务被执行包括使特定应用程序执行任务。该动作还可以包括:针对每一个指定(i)应用程序、和(ii)语音命令触发术语的一个或多个意图中的每一个,确定该转录的至少一部分与由该意图指定的语音命令触发术语相匹配;从包括由该一个或多个意图中的每一个所指定的应用程序的一组应用程序中请求特定应用程序的选择,从包括由该一个或多个意图中的每一个所指定的应用程序的一组应用程序中接收指示特定应用程序的选择的数据,并且响应于接收到指示该特定应用程序的选择的数据,调整特定语音命令触发术语与指定特定应用程序的意图之间的关联的强度。
[0015]动作包含:针对每一个指定(i)应用程序和(ii)语音命令触发术语的一个或多个意图中的每一个,确定转录的至少一部分与由该意图指定的语音命令触发术语相匹配,针对一个或多个意图中的每一个,确定该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法,包括:由语音动作服务系统接收在用户的计算设备处提供的所说言语,所说言语包括语音命令触发短语;由所述语音动作服务系统处理所说言语以确定与所述语音命令触发短语相关联的意图;由所述语音动作服务系统识别各自能够满足所述意图的两个或更多个应用,其中,识别所述两个或更多个应用是基于确定所述两个或更多个应用与一个或多个数据库中的意图相关联的;由所述语音动作服务系统与所述两个或更多个应用中的其余应用相比选择所述两个或更多个应用中的仅一个应用,其中,至少部分地基于(i)用户对所述仅一个应用的使用的新近度以及(ii)用户的过去行为来选择所述两个或更多个应用中的所述仅一个应用;以及由所述语音动作服务系统且响应于所说言语向用户的计算设备仅提供所选择的仅一个应用的指示。2.根据权利要求1所述的计算机实现的方法,其中,至少部分地基于(i)用户对所述仅一个应用的使用的新近度以及(ii)用户的过去行为来选择所述两个或更多个应用中的所述仅一个应用包括:确定所述仅一个应用是响应于所述语音命令触发短语由所述用户最近选择的。3.根据权利要求1所述的计算机实现的方法,其中,还至少部分地基于所述仅一个应用与语音命令触发短语或意图中的至少一个之间的关联得分的强度来选择所述两个或更多个应用中的所述仅一个应用。4.根据权利要求1所述的计算机实现的方法,其中,还至少部分地基于在接收所说言语时在所述用户的计算设备上执行所述仅一个应用来选择所述两个或更多个应用中的所述仅一个应用。5.根据权利要求1所述的计算机实现的方法,其中,仅提供所选择的仅一个应用的指示包括提供所选择的仅一个应用的声音指示。6.根据权利要求1所述的计算机实现的方法,还包括:由语音动作服务系统接收在用户的计算设备处额外的所说言语,所述额外的所说言语包括对所选择的仅一个应用的确认;以及响应于接收到所述额外的所说言语,执行所述仅一个应用以满足意图。7.根据权利要求1所述的计算机实现的方法,其中,处理所述所说言语以确定意图包括:由所述语音动作服务系统对所说言语进行声音识别以获得所说言语的转录;以及由所述语音动作服务系统确定所述转录的至少一部分包括语音命令触发短语以及所述语音命令触发短语匹配意图。8.一种系统,包括:至少一个处理器;以及包括指令的至少一个存储器,所述指令在被执行时使所述至少一个处理器:接收在用户的计算设备处提供的所说言语,所说言语包括语音命令触发短语;处理所说言语以确定所说言语包括所述语音命令触发短语;
识别两个或更多个应用,其中,识别所述两个或更多个应用是基于确定所述两个或更多个应用被映射到一个或多个数据库中的语音命令触发短语的;与所述两个或更多个应用中的其余应用相比选择所述两个或更多个应用中的仅一个应用,其中,至少部分地基于(i)用户对所述仅一个应用的使用的新近度以及(ii)用户的过去行为来选择所述两个或更多个应用中的所述仅一个应用;以及响应于所说言语且向用户的计算设备仅提供所选择的仅一个应用的指示。9.根据权利要求8所述的系统,其中,用于至少部分地基于(i)用户对所述仅一个应用的使用的新近度以及(ii)用户的过去行为来选择所述两个或更多个应用中的所述仅一个应用的指令包括:用于确定所述仅一个应用是响应于所述语音命令触发短语由所述用户最近选择的指令。10.根据权利要求8所述的系统,其中,用于选择所述两个或更多个应用中的所述仅一个应用的指令还包括:用于至少部分地基于所述仅一个应用与语音命令触发短语之间的关联得分的强度来选择所述两个或更多个应用中的所述仅一个应用的指令。11.根...

【专利技术属性】
技术研发人员:王波S韦穆里NM谢蒂PK古普塔SB霍夫曼JA雷伊JA波尔茨
申请(专利权)人:谷歌公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1