基于上下文的虚拟助理实现制造技术

技术编号:20727839 阅读:24 留言:0更新日期:2019-03-30 18:29
本申请涉及基于上下文的虚拟助理实现。具体而言,公开了用于维持虚拟助理和用户之间的对话的技术。系统生成上下文对象。与对话相关的上下文信息被存储到上下文对象。上下文信息可以定义状态。基于该状态,虚拟助理可以呈现信息、呈现查询、执行查询或从用户接收信息。虚拟助理经由上下文对象确定整个谈话中的上下文。虚拟助理可以使用存储到上下文对象的信息来确定与接收到的输入对应的变量。

【技术实现步骤摘要】
基于上下文的虚拟助理实现
本公开涉及虚拟助理。具体而言,本公开涉及经由特定于状态的上下文对象维持虚拟助理与用户之间的对话。权益要求本申请要求于2017年9月22日提交的美国非临时申请No.15/712,480号的优先权,该申请通过引用并入本文。
技术介绍
虚拟助理是用于执行任务的软件代理。虚拟助理可以经由语音命令和/或文本命令来接受来自用户的指令。语音命令可以由智能扬声器接收。可替代地,虚拟助理可以经由键入聊天界面的文本命令接收来自用户的命令。一般而言,虚拟助理响应于请求而执行简单的任务。例如,响应于语音命令“今天的天气如何?”,虚拟助理获得并读取今天的天气预报。虚拟助理可以使用特定的应用或模块来执行具体的任务。作为示例,虚拟助理调用独立的应用来查找方向、检查天气以及更新日历。虚拟助理可以确定用户的意图,以识别要执行的任务。虚拟助理可以使用样本话语来确定意图。例如,基于样本话语“我的支票帐户的余额是多少?”而调用名为lookupBalance的应用。本节中描述的方法是可以追求的方法,但不一定是先前已经构想或追求的方法。因此,除非另有说明,否则不应当假定本节中描述的任何方法仅仅因为它们被纳入本节中就符合作为现有技术。附图说明在附图的各个图中,实施例是作为示例而不是作为限制进行图示的。应当注意的是,本公开中对“一个”实施例的引用不一定是指相同的实施例,并且它们意味着至少一个。在附图中:图1图示了根据一个或多个实施例的系统;图2A图示了根据一个或多个实施例的、用于维护基于上下文的虚拟助理对话的示例操作集合;图2B图示了根据一个或多个实施例的、用于定制虚拟助理应用的示例操作集合;图3图示了根据一个或多个实施例的示例状态图;以及图4示出了图示根据一个或多个实施例的计算机系统的框图。具体实施方式在以下描述中,为了说明的目的,阐述了许多具体细节以便提供透彻的理解。可以在没有这些具体细节的情况下实践一个或多个实施例。在一个实施例中描述的特征可以与在不同的实施例中描述的特征组合。在一些示例中,参考框图形式描述众所周知的结构和设备,以避免不必要地模糊本专利技术。1.一般概述2.基于上下文的虚拟助理系统3.基于上下文的虚拟助理对话4.生成虚拟助理应用5.示例实施例6.杂项;扩展7.硬件概述1.一般概述一个或多个实施例包括经由基于状态的上下文对象维护虚拟助理与用户之间的对话。系统建立与对话的相应部分对应的状态。系统向上下文对象存储上下文信息。上下文信息可以包括当前状态和与该状态相关联的信息。基于当前状态,虚拟助理请求来自用户的信息。系统可以经由智能扬声器或聊天界面接收来自用户的输入。系统将接收到的输入的一部分映射到与所请求的信息对应的变量。系统可以基于当前状态、先前状态和/或用户输入历史将输入映射到变量。当对话进行时,系统可以将上下文对象更新为新的状态。一个或多个实施例包括经由图形界面来定制虚拟助理应用。系统经由图形界面呈现节点和连接器。系统允许用户配置节点和连接器以形成状态图,其中每个节点表示相应的状态。系统使用户能够重新布置节点来配置状态的顺序。系统使用户能够选择与状态节点相关联的输入和/或输出。系统将状态图转换成用于虚拟助理应用的可执行代码。本说明书中描述和/或权利要求中阐述的一个或多个实施例可以不包括在这个“一般概述”部分中。2.基于上下文的虚拟助理系统图1图示了根据一个或多个实施例的系统100。如图1所示,系统100包括查询系统定义界面102、状态机生成器108、查询系统110和用户通信设备120。在一个或多个实施例中,系统100可以包括比图1中所示的部件更多或更少的部件。图1中所示的部件可以在彼此本地或彼此远离。图1中所示的部件可以在软件和/或硬件中实现。每个部件可以分布在多个应用和/或机器上。多个部件可以被组合到一个应用和/或机器中。关于一个部件描述的操作可以替代地由另一个部件执行。在一个或多个实施例中,系统100基于来自用户130的输入来执行任务。示例性任务包括进行旅行安排、呈现方向、显示所请求的图像以及在账户之间转移资金。可以基于与用户130的对话来执行任务中的一个或多个步骤。对话可以包括由用户130接收的输入和由系统100生成的输出。对话可以包括来自用户130的初始请求。对话可以包括来自系统100的解决用户请求的响应。对话可以包括由系统100生成的针对来自用户130的附加信息的请求。在一个或多个实施例中,用户通信设备120包括被配置为促进与用户130的通信的硬件和/或软件。用户通信设备120可以从用户130接收信息。用户通信设备120可以向用户130发送信息。用户通信设备可以促进经由音频接口122和/或可视界面124与用户130的通信。用户通信设备120通信耦合到查询系统110。在实施例中,用户通信设备120在一个或多个数字设备上被实现。术语“数字设备”一般是指包括处理器的任何硬件设备。数字设备可以指执行应用或虚拟机的物理设备。数字设备的示例包括计算机、平板电脑、膝上型电脑、台式机、上网本、服务器、web服务器、网络策略服务器、代理服务器、通用机器、特定于功能的硬件设备、硬件路由器、硬件交换机、硬件防火墙、硬件网络地址翻译器(NAT)、硬件负载平衡器、大型机、电视机、内容接收器、机顶盒、打印机、移动手持机、智能手机、个人数字助理(“PDA”)、无线接收器和/或发送器、基站、通信管理设备、路由器、交换机、控制器、接入点和/或客户端设备。在实施例中,用户通信设备120是智能扬声器。智能扬声器接收来自用户130的音频数据。智能扬声器播放音频。智能扬声器向查询系统110发送信息和从查询系统110发送信息。智能扬声器可以被实现为独立设备,或者实现为智能设备(诸如智能手机、平板电脑或计算机)的一部分。在一个或多个实施例中,音频接口122是指被配置为促进用户130与用户通信设备120之间的音频通信的硬件和/或软件。音频接口122可以包括播放音频的扬声器。所播放的音频可以包括包含对话的口头问题和答案。音频接口可以包括接收音频的麦克风。所接收的音频可以包括从用户130接收的请求和其它信息。在一个或多个实施例中,可视界面124是指被配置为促进用户与用户通信设备120之间的可视通信的硬件和/或软件。可视界面124渲染用户界面元素并且经由用户界面元素接收输入。可视界面的示例包括图形用户界面(GUI)和命令行界面(CLI)。用户界面元素的示例包括复选框、单选按钮、下拉列表、列表框、按钮、双态开关(toggles)、文本字段,日期和时间选择器、命令行、滑块、页面和表单。可视界面124可以呈现消息传送界面。消息传送界面可以用于接受来自用户的键入的输入。消息传送界面可以用于向用户显示文本。可视界面124可以包括显示图像(诸如地图和图片)的功能。可视界面124可以包括上传图像的功能。作为示例,用户130上传动物的图片连同文本“这是什么?”。在实施例中,查询系统110是用于响应于经由用户通信设备120来自用户130的输入来执行一个或多个任务的系统。查询系统110可以从用户通信设备120接收语音输入、文本输入和/或图像。查询系统110可以使用语音识别技术将语音输入转换成文本。查询系统110可以数字化和/或过滤接收到的语音输入。查本文档来自技高网...

【技术保护点】
1.一种包括指令的非暂态计算机可读介质,所述指令在被一个或多个硬件处理器执行时使得包括以下的操作被执行:由查询系统经由智能扬声器接收来自用户的第一语音输入;基于第一语音输入:由查询系统将上下文对象从第一状态修改为第二状态;由查询系统选择要从用户请求的、与第二状态相关联的信息;由查询系统经由智能扬声器请求与第二状态相关联的信息;由查询系统经由智能扬声器从用户接收第二语音输入;至少基于第一语音输入,将第二语音输入的至少一部分映射到与所述信息对应的第一变量;以及将第二语音输入的至少一部分存储为第一变量的值。

【技术特征摘要】
2017.09.22 US 15/712,4801.一种包括指令的非暂态计算机可读介质,所述指令在被一个或多个硬件处理器执行时使得包括以下的操作被执行:由查询系统经由智能扬声器接收来自用户的第一语音输入;基于第一语音输入:由查询系统将上下文对象从第一状态修改为第二状态;由查询系统选择要从用户请求的、与第二状态相关联的信息;由查询系统经由智能扬声器请求与第二状态相关联的信息;由查询系统经由智能扬声器从用户接收第二语音输入;至少基于第一语音输入,将第二语音输入的至少一部分映射到与所述信息对应的第一变量;以及将第二语音输入的至少一部分存储为第一变量的值。2.如权利要求1所述的介质,其中所述操作还包括以下中的一个或多个:在接收第一语音输入之前,配置上下文对象的初始状态,所述上下文对象的初始状态是用户输入不可知的;丢弃第二语音输入的第二部分,而不将第二部分映射到任何变量;或者当上下文对象处于第一状态时,基于第一语音输入被接收而将上下文对象从第一状态修改为第二状态。3.如权利要求1所述的介质,其中至少基于第一语音输入的映射包括基于第二状态的映射,其中第二状态是基于第一语音输入确定的。4.如权利要求1所述的介质,其中:用于查询系统的可执行代码是基于包括第一状态和第二状态的用户定义的状态图由计算机生成的;以及用户定义的状态图经由用户界面来设计,其中用户界面包括至少表示用户定义的状态图中的第一状态和第二状态的图形部件。5.如权利要求1所述的介质,其中所述操作还包括:基于第二语音输入:由查询系统将上下文对象从第二状态修改为第三状态;选择要从用户请求的、与第三状态相关联的附加信息;由查询系统经由智能扬声器请求与第三状态相关联的附加信息;由查询系统经由智能扬声器从用户接收第三语音输入;...

【专利技术属性】
技术研发人员:M·P·罗杰斯
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1