场境感知人机对话制造技术

技术编号:18426476 阅读:29 留言:0更新日期:2018-07-12 02:01
本申请涉及场境感知人机对话。描述了涉及利用正进行的人机对话的场境来增强自动化助理在用户在不同的域(主题)之间突然转换时进行解释和响应的能力的方法、设备、和计算机可读介质。在各种实现方式中,可在与自动化助理的正在进行的人机对话期间接收来自用户的自然语言输入。可选择语法以解析所述自然语言输入。该选择可以是基于作为与正在进行的人机对话相关联的场境数据结构的一部分存储的主题。可基于所选择的语法来解析所述自然语言输入,以生成解析。基于所述解析,可生成自然语言响应,并且通过使用输出装置将所述自然语言响应输出至用户。可识别由所述解析或者所述自然语言响应提出的任何主题,并且可将其添加至所述场境数据结构。

Field perception man-machine dialogue

This application involves field - aware man-machine dialogue. The methods, devices, and computer readable media are described for enhancing the ability of automated assistants to interpret and respond to a sudden conversion between different domains (Topics) using the field of ongoing human-computer dialogues. In various implementations, natural language input from users can be received during the ongoing man-machine conversation with automation assistants. You can choose syntax to parse the natural language input. The selection can be based on the theme stored as part of the field data structure associated with ongoing human-machine conversation. The natural language input can be parsed based on the selected syntax to generate parsing. Based on the parsing, the natural language response can be generated and output of the natural language response to the user by using the output device. Any topic proposed by the parsing or the natural language response can be identified and added to the field data structure.

【技术实现步骤摘要】
场境感知人机对话
本申请涉及场境感知人机对话。
技术介绍
用户越来越有能力使用自然语言与计算机交互,例如,本文中将这种情况称为“人机对话”。例如,许多移动计算装置(诸如,智能电话、平板、智能手表、独立式智能扬声器等)包括称为“自动化助理”(也称为“交互式助理模块”、“移动助理”等)的软件程序。自动化助理可以被配置为解析和解释自然语言输入(例如,首先口语表达,然后转换成文本,或者最初以文本形式接收)并且提供响应输出(诸如,对问题的回答、任务开始等)。现有的自动化助理通常难以在会话的域之间切换。例如,如果用户和自动化助理已经关于一个主题或者域(例如,玩游戏)中的对象交换对话,并且然后用户突然将会话转向不相关的域(例如,天气)中的另一主题,则自动化助理可能不会完全地响应和/或可能需要附加对话来进行合适地响应。
技术实现思路
本文中描述了用于利用正在进行的人机对话的场境(context)来增强自动化助理(或者更一般地,交互式语音响应“IVR”部件)以在用户在不同的域之间突然转换人机对话时进行解释和响应的能力的技术。在各种实现方式中,可以使用所谓的“场境数据结构”以保持与正在进行的人机对话相关的各种“主题”。例如,可以使用这些主题来选择用于解析用户的自然语言输入的一个或多个语法。基于由所选择的语法产生解析,并且在某些情况下,进一步基于表示正在进行的人机对话的动态对话树,可以由自动化助理生成并且提供响应(例如,自然语言响应、启动任务等)。同时,可以将由用户和/或由自动化助理添加至正在进行的对话的任何新主题添加至场境数据结构。可以丢弃在一段时间内尚未提到或者提及的主题。以这种方式,如果用户提供与正在进行的对话的一些先前的主题不直接有关,但是与自然语言输入有关,则自动化主题可能能够无缝地转回到先前主题。因此,自动化助理更能够理解用户在给定时刻正在讲的是什么,并且由此在缺乏清楚陈述的情况下更能够提供用户需要的信息或服务。在一些实现方式中,本文中描述的技术可以被实现在包括解析器子系统和响应子系统的系统上。解析器子系统可以负责解释自然语言输入并且将解释(例如,“解析”和/或主题)提供给响应子系统。响应子系统可以通过生成并且输出自然语言响应或者通过采取一些其它响应动作(例如,启动特定应用)来负责接收解释并且适当地进行响应。在一些实现方式中,解析器子系统可以被配置为基于在与正在进行的人机对话相关联的前述场境数据结构中存储的一个或多个主题来选择一个或多个语法以解析接收到的自然语言输入。例如,在一些实现方式中,可以与一个或多个适用主题相关联地存储多个语法(例如,可能非常大的语法库)中的每个语法。如果语法的相关联主题中的一个或多个当前与人机对话有关(和/或足够有关),则可以选择/应用该语法,否则,可以不应用该语法。因此,当用户提供自然语言输入时,仅选择和应用与当前相关主题相关联的这些语法。本文偶尔将这种技术称为“场境过滤”。场境过滤提供了避免在会话的场境中没有任何意义,从而可能会导致无意义输出的语法的技术优点。在某些情况下,(与向每个自然语言输入应用潜在庞大的库的所有语法相反)这可以减少向从人类接收的每个自然语言输入应用的语法的数目。减少所应用的语法数目减低了计算资源(诸如,处理器周期、存储器、和/或网络带宽)的利用。这对于人机对话可能尤为有利,因为最小化了自动化助理的延迟(即,确保其自动化助理尽可能快地对用户输入做出响应)对用户而言可能是至关重要的。如果人机对话刚刚开始(因此,还没有一个主题是有关的),则解析器子系统可以使用会话技术对接收到的自然语言输入进行处理。解析器子系统然后可以在人机对话期间基于由人或者由自动化助理提出的主题开始填写场境数据结构。与解析器子系统和响应子系统交互是前述场境数据结构。场境数据结构可以采用在存储器中存储的各种形式的数据结构,并且可以被用于保持与正在进行的人机对话相关或者最近已经与正在进行的人机对话相关的主题。当由用户或者由自动化助理中任一个提出主题时,例如,可以通过响应子系统将该主题添加至场境数据结构。如果提出了在场境数据结构中已经存在的主题,则可以“触动”该主题,例如,可以将该主题再次带到会话的最前端。为此,在各种实现方式中,在场境数据结构中储持续存在的每个主题可以与主题与正在进行的人机对话的关联性的度量相关联。例如,在一些实现方式中,可以至少部分地基于自最后提出主题起的正在进行的人机对话的回合的计数来确定与每个主题相关联的关联性的度量。自提出(例如,添加或者触动)主题起的回合的计数越多,针对那个主题的关联性的度量就越低。假设的是用户关于天气的问题开始了人机对话(使主题“天气”能够添加进来),但是然后对话涵盖了与天气无关的各种主题。自提出天气的主题起的进入对话的回合的计数越多,就越多与主题天气相关联的相关性评分减少。在一些实现方式中,如果主题的相关性的度量缩减到阈值以下,则可以从场境数据结构完全丢弃那个主题。从场境数据结构中丢弃“失效的”主题可以提供各种技术优点。由解析器子系统选择的(即,如以上描述的场境过滤)并且向从用户接收的每个自然语言输入应用的语法越多,就越多计算资源被消耗。通过丢弃失效的主题,可以减少由解析器子系统向每个自然语言输入应用的语法的数目,从而降低计算资源消耗。另外,通过将解析器子系统的重点放在与和当前人机对话相关的主题相关联语法上,将不太可能会产生偏离主题或者其它无意义的解析(这可能会导致自动化助理提供类似地无意义输出)。因此,可以减少实现用户的特定目标需要的人机对话回合的数目(因此,用户提供的自然语言输入),这可以使用户获得提供多个输入的有限物理或者情境能力的益处。关联性的度量还可以是基于其它因素。例如,在一些实现方式中,可以至少部分地基于主题与场境数据结构中的一个或多个其它主题之间的相关性(例如,语义)的度量,确定与每个主题相关联的关联性的度量。如果已经在一段时间内未提出第一主题,但是稍后提出了语义上相关的第二主题,则可以提升第一主题的关联性度量。在一些实现方式中,场境数据结构可以采用无向图的形式,该无向图包括多个节点以及连接该多个节点的多个边。无向图的每个节点可以表示作为场境数据结构的一部分存储的一个或多个主题中的给定主题。在一些实现方式中,每个节点还可以存储自最后提出给定主题起正在进行的人机对话的回合的计数。在一些实现方式中,连接两个节点的每个边可以表示在分别由这两个节点表示的两个主题之间的相关性的度量(例如,语义等)。当然,本文中还考虑了其它数据结构。在一些实现方式中,每个语法可以与主题以及那个主题的阈值关联性评分相关联。如果主题持续存在在场境数据结构中,但其关联性评分不满足阈值,则可以不选择语法。这使对何时应用语法以及何时不应用语法能够精细调整。在各种实现方式中,响应子系统可以从由解析器子系统选择并且应用的语法接收解释(或者“解析”)。在一些实现方式中,例如,解析器子系统还可以向响应子系统提供主题,作为解析/解释的部分和/或单独地作为解析/解释。在一些实现方式中,这些主题可能已经持续存在在场境数据结构中,并且可能已经凭借已经应用的这些主题的相关联语法而被触动。在各种实现方式中,响应子系统可以采用对话树来在看似无关的主题之间操纵正在进行的人机对话。本质上,响本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,所述方法包括:接收来自用户的自然语言输入作为所述用户与由一个或多个处理器操作的自动化助理之间的正在进行的人机对话的一部分;基于在存储器中存储的一个或多个主题选择一个或多个语法,作为与所述正在进行的人机对话相关联的场境数据结构的一部分;基于所选择的一个或多个语法解析所述自然语言输入,以生成一个或多个解析;基于所述一个或多个解析,生成自然语言响应;使用一个或多个输出装置,将所述自然语言响应输出至所述用户;识别由所述一个或多个解析或者所述自然语言响应提出的一个或多个主题;以及将所识别到的一个或多个主题添加至所述场境数据结构。

【技术特征摘要】
2016.12.30 US 62/440,856;2017.03.01 US 15/446,9081.一种计算机实现的方法,所述方法包括:接收来自用户的自然语言输入作为所述用户与由一个或多个处理器操作的自动化助理之间的正在进行的人机对话的一部分;基于在存储器中存储的一个或多个主题选择一个或多个语法,作为与所述正在进行的人机对话相关联的场境数据结构的一部分;基于所选择的一个或多个语法解析所述自然语言输入,以生成一个或多个解析;基于所述一个或多个解析,生成自然语言响应;使用一个或多个输出装置,将所述自然语言响应输出至所述用户;识别由所述一个或多个解析或者所述自然语言响应提出的一个或多个主题;以及将所识别到的一个或多个主题添加至所述场境数据结构。2.根据权利要求1所述的计算机实现的方法,其中,所述一个或多个语法是从多个语法中选择的,以及其中,所述多个语法中的每个语法是与一个或多个能够应用的主题相关联地存储的。3.根据权利要求1所述的计算机实现的方法,其中,在所述存储器中存储的每个主题作为所述场境数据结构的一部分是与所述主题的与所述正在进行的人机对话的关联性的度量相关联的。4.根据权利要求3所述的计算机实现的方法,其中,与每个主题相关联的关联性的度量是至少部分地基于自最后提出所述主题起的所述正在进行的人机对话的回合的计数来确定的。5.根据权利要求3所述的计算机实现的方法,其中,与每个主题相关联的关联性的度量是至少部分地基于所述主题与所述场境数据结构中的一个或多个其它主题之间的相关性的度量来确定的。6.根据权利要求1所述的计算机实现的方法,其中,所述场境数据结构包括无向图,所述无向图包括多个节点和连接所述多个节点的多个边。7.根据权利要求6所述的计算机实现的方法,其中,所述无向图的每个节点表示作为所述场境数据结构的一部分存储的所述一个或多个主题中的给定主题、以及自最后提出所述给定主题起的所述正在进行的人机对话的回合的计数。8.根据权利要求7所述的计算机实现的方法,其中,连接所述无向图中的两个节点的每个边表示在分别由所述两个节点表示的两个主题之间的相关性的度量。9.根据权利要求1所述的计算机实现的方法,进一步包括生成具有一个或多个节点的对话树,所述一个或多个节点表示在所述正在进行的人机对话期间已经调用的一个或多个交互式语音过程。10.根据权利要求9所述的计算机实现的方法,其中,所述一个或多个节点中的每个节点与相应的主题相关联。11.根据权利要求10所述的计算机实现的方法,其中,所述选择包括从各自与一个或多个能够应用的主题相关联的多个语法中选择所述一个或多个语法。12.一种系统,所述系统包括一个或多个处理器以及与所述一个或多个处理器操作地耦合的存储器,其中,所述存储器存储指令,所...

【专利技术属性】
技术研发人员:彼得·塔基尔
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1