跨诸设备缩放数字个人助理代理制造技术

技术编号:16112572 阅读:15 留言:0更新日期:2017-08-30 05:55
一种用于提供数字个人助理响应的方法可包括由与多个反应型代理相关联的数字个人助理接收发起与计算设备内的数字个人助理的对话的用户输入。响应于接收到该输入,可从多个可用操作模式中检测该计算设备的操作模式。可基于接收到的输入来选择多个反应型代理中的一个反应型代理。可访问与所选的反应型代理相关联的多个响应串。至少基于该计算设备的操作模式和至少一个硬件特性选择多个响应串中的至少一个响应串。在该对话期间提供多个响应串中的所选的至少一个响应串作为对用户输入的响应。

【技术实现步骤摘要】
【国外来华专利技术】跨诸设备缩放数字个人助理代理背景随着计算技术的发展,越来越强大的移动设备已经变得可用。例如,智能电话以及其他计算设备已经变得普及。此类设备的处理能力已导致开发出不同类型的功能性,诸如与数字个人助理相关功能性。实现在各种移动设备内的数字个人助理具有交互式和内置会话理解力以能够对用户问题或语音命令作出响应。然而,取决于正被使用的设备的类型,来自数字个人助理的这样的响应可能不是总是适当的。例如,一些设备可能不具有触摸屏,并且指令用户触摸或按压屏幕上的按钮的响应可能不是可行的。概述提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。根据一个或多个方面,一种用于提供数字个人助理响应的方法可包括由与多个反应型代理相关联的数字个人助理接收发起与计算设备内的数字个人助理的对话的用户输入。响应于接收到该输入,可从多个可用操作模式中检测计算设备的操作模式。可基于接收到的输入来选择多个反应型代理中的一个反应型代理。可访问与所选的反应型代理相关联的多个响应串。至少基于计算设备的操作模式和/或至少一个硬件特性选择多个响应串中的至少一个响应串。在对话期间提供多个响应串中所选的至少一个响应串作为对用户输入的响应。根据一个或多个方面,包括处理器、存储器和话筒的计算设备可被适配成执行一种用于提供数字个人助理响应的方法。该方法包括由数字个人助理接收由用户生成的输入(例如,文本、语音、触觉等),其中该输入可经由话筒来接收(在数字语音输入的实例中)。响应于接收到该输入,检测计算设备的操作模式和/或至少一个硬件特性。选择与数字个人助理的反应型代理相关联的多个响应串中的至少一个响应串以及多个响应串中的该至少一个响应串的呈现模式。对多个响应串中的至少一个响应串以及呈现模式的选择可至少基于操作模式和/或至少一个硬件特性。可使用该呈现模式来提供多个响应串中的该至少一个响应串作为对数字语音输入的响应。根据一个或多个方面,计算机可读存储介质可包括指令,这些指令在执行之际,使得计算机系统通过在该计算机系统上运行的第三方应用来接收由用户生成的输入。该输入可包括数字语音输入、通过例如打字接收的文本输入和/或任何其他类型的用户输入(例如,触觉输入)。数字语音输入可通过话筒来接收。话筒可以是计算机系统内的内置式话筒、可通过有线连接连接(附连)到计算机系统的可拆卸话筒、无线地耦合到计算机系统的远程监听设备(例如,具有话筒的蓝牙耳机)和/或具有话筒和/或扬声器能力的伴随设备(例如,智能手表)。在数字语音输入被使用时的实例中,使用数字语音输入的自然语言处理被执行以确定用户语音请求。用户语音请求与由在计算机系统上运行的应用执行的一个或多个功能性相关联。应用包括用于执行一个或多个功能性的一个或多个反应型代理。可选择一个或多个反应型代理中的一个反应型代理来执行一个或多个功能性。由应用请求标识计算机系统的操作模式和至少一个硬件特性的信息,该请求使用API请求。响应于API请求,接收标识计算机系统的操作模式和/或至少一个硬件特性的信息。选择与所选的第三方反应型代理相关联的多个响应串中的至少一个响应串以及多个响应串中的该至少一个响应串的呈现模式。对多个响应串中的至少一个响应串以及呈现模式的选择可至少基于操作模式和/或至少一个硬件特性。可使用该呈现模式来提供多个响应串中的该至少一个响应串作为对用户语音请求的响应。如本文所述的,各种其它特征和优点可按照需要被结合到所述技术中。附图简述图1是解说根据本公开的示例实施例的用于跨具有不同设备能力的诸计算设备缩放数字个人助理代理的示例架构的框图。图2是解说根据本公开的示例实施例的具有在图1的架构中使用的缩放服务的示例反应型代理的框图。图3是解说根据本公开的示例实施例的具有示例设备操作模式和对应的输出串的表的框图。图4是根据本公开的示例实施例的使用可被缩放的应用反应型代理的计算设备的框图。图5-7是解说根据一个或多个实施例的跨诸设备缩放数字个人助理代理的流程图。图8是解说可结合其来实现此处描述的创新的示例移动计算设备的框图。图9是可用于实现所描述的一些实施例的示例计算系统的示图。详细描述如本文中所描述的,各种技术和解决方案可被应用来跨诸设备缩放数字个人助理反应型代理。更具体地,在检测到用户输入(例如,用于语音控制数字个人助理的语音输入、诸如键入打字输入之类的文本输入、触觉输入等)之际,反应型代理可被选择来帮助执行与设备功能性相关联并通过该用户输入触发的任务。数字个人助理(或代理)可随后使用当前设备操作模式和一个或多个设备能力(例如,诸如硬件特性之类的一个或多个设备特征或特性)来定制响应于该用户输入而发起的语音响应对话。响应串可基于设备操作模式和/或一个或多个设备能力来选择。此外,用于呈现响应串的呈现模式(例如,纯音频、纯显示、音频/显示组合、响应串有多详细等)可基于设备操作模式和/或一个或多个设备能力来定制。就此而言,通过使用该设备类型的硬件能力以及用户在与数字个人助理进行交互时可能如何参与(例如,基于设备操作模式),数字个人助理可提供针对正在特定操作模式中使用的特定设备定制的更相关及高效的响应体验。如本文中所使用的,术语“反应型代理”指代可被数字个人助理用来实现与设备功能性相关联的一个或多个响应对话(例如,语音、文本和/或触觉响应)的数据/命令结构。该设备功能性(例如,电子邮件收发、消息收发等)可由到数字个人助理的用户输入(例如,语音命令)来激活。反应型代理(或代理)可使用语音代理定义(VAD)或反应型代理定义(RAD)XML文档以及用于驱动该代理来通过对话的编程代码(例如,C++代码)来定义。图1是解说根据本公开的示例实施例的用于跨具有不同设备能力的诸计算设备缩放数字个人助理代理的示例架构100的框图。参考图1,架构100可包括计算设备102、…、104,其中每一计算设备分别具有特定设备能力(或特性),诸如120、…、121。计算设备102、…、104可包括台式计算机、膝上型计算机、上网本、平板计算机、智能电话或可执行操作系统(例如,106、...、107)和数字个人助理108(其可以是语音控制的数字个人助理)的其他计算设备。尽管数字个人助理108被示为被安装在计算设备102上,但本公开不限于此。例如,伴随设备(例如,智能手表)可与其上安装有数字个人助理的另一设备(例如电话)通信。在该情况下,尽管伴随设备没有数字个人助理被安装在该设备上,但通过依赖于由安装在第二设备(即,电话)上的数字个人助理提供的信息(例如,响应串),它仍可利用本文中描述的功能性。数字个人助理也可以是云环境中的服务器的一部分,该服务器可由云环境中的多个其他设备访问。计算设备102、…、104中的每一者都可使用数字个人助理(DPA)108。DPA108可包括合适的逻辑、电路系统、接口和/或代码,并且可用于使用一个或多个反应型代理(RA),诸如RA110、…、114。RA可被用于执行一个或多个功能性,该一个或多个功能性可由到DPA108的用户输入(例如,语音输入)触发。例如,RA110可以是电子邮件代理,该电子邮件代理可基于用户语音命令被用于打开新的电子邮本文档来自技高网...
跨诸设备缩放数字个人助理代理

【技术保护点】
一种在具有数字个人助理的计算设备中的用于提供数字个人助理响应的方法,所述方法包括:接收发起与所述计算设备内的所述数字个人助理的对话的用户输入,所述数字个人助理与多个反应型代理相关联;响应于接收到所述输入,从多个可用操作模式中检测所述计算设备的操作模式;基于接收到的输入选择所述多个反应型代理中的一个反应型代理;访问与所选的反应型代理相关联的多个响应串;至少基于所述计算设备的所述操作模式以及至少一个硬件特性选择所述多个响应串中的至少一个响应串;以及在所述对话期间提供所述多个响应串中的所选的至少一个响应串作为对所述用户输入的响应。

【技术特征摘要】
【国外来华专利技术】2014.12.22 US 14/580,0931.一种在具有数字个人助理的计算设备中的用于提供数字个人助理响应的方法,所述方法包括:接收发起与所述计算设备内的所述数字个人助理的对话的用户输入,所述数字个人助理与多个反应型代理相关联;响应于接收到所述输入,从多个可用操作模式中检测所述计算设备的操作模式;基于接收到的输入选择所述多个反应型代理中的一个反应型代理;访问与所选的反应型代理相关联的多个响应串;至少基于所述计算设备的所述操作模式以及至少一个硬件特性选择所述多个响应串中的至少一个响应串;以及在所述对话期间提供所述多个响应串中的所选的至少一个响应串作为对所述用户输入的响应。2.根据权利要求1所述的方法,其特征在于,所述操作模式是以下中的一者:纯音频操作模式;半分心操作模式;完全参与操作模式;以及限制显示操作模式。3.根据权利要求1所述的方法,其特征在于,进一步包括:至少部分地基于所述操作模式和所述至少一个硬件特性选择所述多个响应串中的所述至少一个响应串的呈现模式;以及基于以下中的至少一者修改所述呈现模式选择:所述用户距所述计算设备的距离、所述计算设备附近的噪声水平、以及所述用户主动参与所述计算设备的当前可用性。4.根据权利要求3所述的方法,其特征在于,所述呈现模式包括以下至少一者:所述多个响应串中的所选的至少一个响应串的文本到语音表示的音频输出;所述多个响应串中的所选的至少一个响应串的视觉输出;以及与所述多个响应串中的所选的至少一个响应串相关联的触觉输出。5.根据权利要求1所述的方法,其特征在于,进一步包括:检测通信地耦合到所述计算设备的至少一个外围设备;至少基于所述至少一个外围设备的操作模式以及至少一个硬件特性选择所述多个响应串中的至少一个第二响应串;以及在所述对话期间向所述至少一个外围设备提供所述多个响应串中的所选的至少一个第二响应串。6.根据权利要求1所述的方法,其特征在于,所述用户输入是语音输入并且所述方法进一步包括:基于所述语音输入检测所述数字个人助理的至少一个被请求的功能性;以及选择所述多个反应型代理中的所述一个反应型代理来执行所述至少一个被请求的功能性。7.一种计算设备,所述计算设备包括处理器、存储器和话筒,所述计算设备被适配成执行一种用于提供数字个人助理响应的方法,所述方法包括:由数字个人助理接收由用户生成的数字语音输入,其中所述数字语音输入是经由所述话筒来接收的;响应于接收到所述数字语音输入,检测所述计算设备的操作模式和至少一个硬件特性;选择与所述数字个人助理的反应型代理相关联的多个响应串中的至少一个响应串;选择所述多个响应串中的所述至少一个响应串的呈现模式,其中对所述多个响应串中的所述至少一个响应串以及所述呈现模式的选择至少基于所述操作模式和所述至少一个硬件特性;以及使用所述呈现模式提供所述多个响应串中的所述至少一个响应串作为对所述数字语音输入的响应。8.根据权利要求7所述的计算设备,其特征在于,所述操作模式是纯音频操作模式,并且所述方法进一步包括:使用文本到语音(TTS)转换将所述多个响应串中的所述至少一个响应串转换为语音响应音频输出;以及提供所述语音响应音频输出作为对所述数字语音输入的响应。9.根...

【专利技术属性】
技术研发人员:M·莱迪V·S·坎南A·乌瑟拉克D·J·黄M·R·苏弗L·J·施蒂费尔曼
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1