用于自动化对话系统的检测机构技术方案

技术编号:22174572 阅读:23 留言:0更新日期:2019-09-21 15:13
一种会话系统,接收话语,并且解析器对话语执行解析操作,导致一些词被解析而一些词未被解析。对于未被解析的词,将忽略被确定为不重要的词或短语。对所得的未被解析的词进行处理以确定它们重要的可能性以及它们是否应当由自动化助理解决。例如,如果与重要的未被解析的词相关联的得分达到特定阈值,则对该话语采取的动作过程可以包括提供不能处理话语中的与该重要的未被解析的词相关联的部分的消息。

Inspection Institution for Automatic Dialogue System

【技术实现步骤摘要】
【国外来华专利技术】用于自动化对话系统的检测机构相关申请的交叉引用本申请要求于2017年02月09日提交的题目为“DetectionMechanismforAutomatedDialogueSystems”的美国临时专利申请号62/456870的优先权权益,其公开内容并入本文。
技术介绍
自动化助理是被设计成与用户关于一个或几个知识域进行会话一种软件。以前的技术(如SIRI或Alexa,它们是分别来自AppleComputer和Amazon的命令控制系统)经常无法提供用户寻找的系统或答案。这至少部分是因为对话系统处理较窄的域。在会话系统中,这个问题变得更加严重,会话系统必须理解对话中的上下文,以及来自一个或多个来源的信息。试图为网页提供语义注释(比会话事务更简单的任务)的诸如“语义网”的当前的系统未能满足用户的要求:“对于语义网的一些挑战包括宽泛性、模糊性、不确定性、不一致性和欺骗性。自动化推理系统将必须处理这些问题中的所有问题才能实现语义网的承诺。”过去系统的语义分析技术似乎依赖于在“域内”对“域外”交互的话语上训练的词袋分类器。这种两路(或用于在多域系统中使用的多路)方法至少三个方面存在缺陷。首先,它忽略了交互的对话状态。其次,它不允许在会话期间重新分析一些短语或词的状态。第三,它没有考虑系统是否需要理解话语中的短语。至少出于这些原因,自动化助理难以确定话语的主题何时超出已知域。
技术实现思路
本技术的会话系统提供了一种新颖的方式来处理一种情况,其中用户提供了系统在当前上下文中不能或无法理解的信息。在该新系统中,存在对要递送的语句或数据中的词或短语的自动标识,该自动标识由大型字典、与数据交互的对话模型,或者语言的统计模型和系统中的交互的统计模型提供。对于任何词或短语,例如在给定交互的暗示或假设意图的情况下,系统尝试判定词或短语是否可能对用户重要。例如,在对话片段“我想要飞往波士顿参加求职面试”中,这次旅行是针对求职面试的事实不会影响将该语句解释为对到波士顿航班请求。另一方面,在语句“我需要求职面试的帮助”中,会话是严格地关于求职面试的事实需要对准备求职面试的行为进行语义解释。人/机交互中的以意图为条件的语义解释可与其他环境中相同词的语义解释分离,如上段所说明的那样。特别地,本系统可以针对各种主题进行训练,并且不必在从系统能力添加或删除主题时重新训练。在高水平,由自动化助理接收话语。解析器对话语执行解析操作,导致一些词被解析而一些词未被解析。对于未被解析的词,将忽略被确定为不重要的词或短语。对所得的未被解析的词进行处理以确定它们重要的可能性以及它们是否应当由自动化助理解决。例如,如果与重要的未被解析的词相关联的得分达到特定阈值,则对该话语采取的动作过程可以包括提供不能处理话语中的与该重要的未被解析的词相关联的部分的消息。在实施例中,一种方法提供了一种会话系统,该会话系统检测重要的域外的内容。方法包括接收具有多个词的话语。通过存储在存储器中并且由计算设备上的处理器执行的解析器代码对话语执行解析操作。确定话语的一个或多个词未被解析器识别。通过存储在存储器中并且由计算设备上的处理器执行的分类器代码来确定未被解析器识别的一个或多个词中的一个或多个词是重要的。基于被解析器解析的词和未被解析器解析的重要的词生成动作。附图说明图1是用于提供能够检测域外的主题的自动化助理的系统的框图。图2是实现自动化助理应用的模块的框图。图3是检测机构模块的框图。图4是用于由自动化助理检测域外的内容的方法。图5是用于由解析器生成用于话语的覆盖矢量的方法。图6是用于通过分类器对未被解析的词进行分类的方法。图7是用户和自动化助理之间的交流的图。图8是用户和自动化助理之间的交流的图,通过分析未被识别的词来增强该交流。图9是用户和自动化助理之间的交流的图,其中忽略了话语中的未被解析的词。图10是用户和自动化助理之间的交流的图,其具有助理不能对(多个)特定词采取行动的消息。图11是用于实现本技术的系统的框图。具体实施方式粗略描述的本技术的会话系统(即,自动化助理)处理一种情况,其中用户提供了系统在当前上下文中不能或无法理解的信息。在该系统中,存在对要递送的语句或数据中的词或短语的自动标识,该自动标识由大型字典、与数据交互的对话模型,或者语言的统计模型和中的交互系统的统计模型提供。对于任何词或短语,例如在给定交互的暗示或假设意图的情况下,系统尝试判定词或短语是否可能对用户重要。例如,在对话片段“我想要飞往波士顿参加求职面试”中,这次旅行是针对求职面试的事实不会影响将该语句解释为对到波士顿航班请求。另一方面,在语句“我需要求职面试的帮助”中,会话是严格地关于求职面试的事实需要对准备求职面试的行为进行语义解释。人/机交互中的以意图为条件的语义解释可与其他环境中相同词的语义解释分离。本系统可以针对各种主题进行训练,并且不必在从系统能力添加或删除主题时重新训练。在一些情况下,自动化助理接收话语。解析器对话语执行解析操作,导致一些词被解析而一些词未被解析。对于未被解析的词,将忽略被确定为不重要的词或短语。对剩余的未被解析的词进行处理以确定它们重要的可能性以及它们是否应当由自动化助理解决。例如,如果与重要的未被解析的词相关联的得分达到特定阈值,则对该话语采取的动作过程可以包括提供不能处理与该重要的未被解析的词相关联的话语的部分的消息。图1是用于提供可以检测域外的主题的自动化助理的系统的框图。图1的系统100包括客户端110、移动设备120、计算设备130、网络140、网络服务器150、应用服务器160和数据存储装置170。客户端110、移动设备120和计算设备130通过网络140与网络服务器150通信。网络140可以包括专用网络、公共网络、因特网和内联网、WAN、LAN、蜂窝网络或适合于在图1的计算设备之间传输数据的某种其他网络。客户端110包括应用112。应用112可以提供自动化助理、TTS功能、自动语音识别、解析、域检测以及本文所讨论的其他功能。应用112可以被实现为一个或多个应用、对象、模块或其他软件。应用112可以通过图1的服务器架构或直接(图1中未示出)与应用服务器160和数据存储装置170通信以访问数据。移动设备120可以包括移动应用122。移动应用可以提供与关于应用112描述的相同的功能。移动应用122可以被实现为一个或多个应用、对象、模块或其他软件,并且可以操作以结合应用服务器160提供服务。计算设备130可以包括网络浏览器132。网络浏览器可以接收一个或多个内容页面、脚本代码和其他代码,这些代码在被加载到网络浏览器中时提供与关于应用112描述的相同的功能。内容页面可以操作以结合应用服务器160提供服务。网络服务器150可以经由网络140从应用112、移动应用122和网络浏览器132接收请求和数据。请求可以由特定应用或浏览器应用发起。网络服务器150可以处理请求和数据、传送响应,或者向应用服务器160传送请求和数据或其他内容。应用服务器160包括应用162。应用服务器可以接收数据(包括从应用112和122以及浏览器132接收的数据请求)、处理数据,以及向网络服务器150传送响应。在一些实施方式中,网络服务器152将响应转发到最初发送请求的计算机或应用。应本文档来自技高网...

【技术保护点】
1.一种用于提供会话系统的方法,所述会话系统检测重要的域外内容,所述方法包括:接收具有多个词的话语;通过被存储在存储器中、并且由计算设备上的处理器执行的解析器代码对所述话语执行解析操作;确定所述话语的一个或多个词未被所述解析器识别;通过被存储在存储器中、并且由所述计算设备上的处理器执行的分类器代码,确定未被所述解析器识别的所述一个或多个词中的一个或多个词是重要的;以及基于被所述解析器解析的所述词和未被所述解析器解析的重要的所述词生成动作。

【技术特征摘要】
【国外来华专利技术】2017.02.09 US 62/456,870;2018.01.31 US 15/885,7901.一种用于提供会话系统的方法,所述会话系统检测重要的域外内容,所述方法包括:接收具有多个词的话语;通过被存储在存储器中、并且由计算设备上的处理器执行的解析器代码对所述话语执行解析操作;确定所述话语的一个或多个词未被所述解析器识别;通过被存储在存储器中、并且由所述计算设备上的处理器执行的分类器代码,确定未被所述解析器识别的所述一个或多个词中的一个或多个词是重要的;以及基于被所述解析器解析的所述词和未被所述解析器解析的重要的所述词生成动作。2.根据权利要求1所述的方法,还包括确定未被解析的、被确定为不重要的词被忽略。3.根据权利要求1所述的方法,其中所述动作包括由自动化管理助理执行的操作。4.根据权利要求1所述的方法,其中所述动作包括生成不能对未被所述解析器解析的重要的所述词采取动作的消息。5.根据权利要求1所述的方法,还包括确定未被解析的所述一个或多个词将被链接到因特网上可用的内容页面的概率。6.根据权利要求1所述的方法,还包括确定未被解析的所述一个或多个词在所述话语中是突出的。7.根据权利要求1所述的方法,还包括确定未被解析的所述一个或多个词包括命名实体。8.根据权利要求1所述的方法,还包括确定未被解析的所述一个或多个词形成句法成分。9.根据权利要求1所述的方法,还包括确定未被解析的所述一个或多个所述词满足与重要性相关联的阈值。10.根据权利要...

【专利技术属性】
技术研发人员:D·L·W·豪尔D·克莱恩
申请(专利权)人:语义设备公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利