当前位置: 首页 > 专利查询>谷歌公司专利>正文

处理在处理自然语言查询中的故障制造技术

技术编号:15938753 阅读:24 留言:0更新日期:2017-08-04 21:41
用于处理在从自然语言查询生成结构化查询中的故障的系统、方法和计算机存储介质。一种方法包括通过自然语言前端从用户获得自然语言查询;将自然语言查询转换成将在知识库的结构化应用编程接口(API)上执行的结构化操作,包括:解析自然语言查询,分析所解析的查询以确定依赖性,执行词法分辨,基于依赖性和词法分辨来形成概念树,分析概念树以生成超图,基于超图来生成虚拟查询,以及处理虚拟查询以生成一个或多个结构化操作;在知识库的结构化API上执行一个或多个结构化操作;以及将与自然语言查询匹配的搜索结果返回给用户。

Dealing with faults in processing natural language queries

System, method and computer storage medium for processing faults generated in a structured query from a natural language query. A method includes using natural language front-end obtained from users of natural language query; natural language query will be converted into the structured knowledge base application programming interface (API) on the implementation of the structured operation, including: analysis of natural language query, analysis the parsed query to determine the dependence of the implementation of resolution dependent lexical and lexical. Resolution to form the concept tree based on the analysis of the concept tree to generate a hypergraph, to generate virtual query based on hypergraph, and virtual query to produce one or more structured operation; the implementation of one or more structured operating in a structured API knowledge base; and with the natural language query, the search results returned to the user.

【技术实现步骤摘要】
处理在处理自然语言查询中的故障优先权声明本申请根据35U.S.C.§119(e)要求于2015年9月11日提交的名称为“HandlingFailuresinProcessingNaturalLanguageQueriesThroughUserInteractions”的美国临时专利申请序列号No.62/217,260的提交日期的优先权,其全部内容通过引用合并于此。
本说明书涉及处理在处理自然语言查询中的故障。
技术介绍
当计算机系统试图处理由用户提供的自然语言查询以提供匹配的搜索结果时,可能发生故障。可以使用迭代模型来处理这些故障。然而,在该上下文中实现迭代模型可能是禁止的,例如,通常需要可能在用户提供的自然语言查询中使用的术语的完全定义集合。
技术实现思路
本说明书描述了用于处理在从自然语言查询生成SQL查询中的故障的技术。通常,能用方法体现在本说明书中描述的主题的一种创新方面,所述方法包括以下动作:通过自然语言前端从用户获得自然语言查询;将自然语言查询转换成将在知识库的结构化应用编程接口(API)上执行的结构化操作,包括:解析所述自然语言查询,分析所解析的查询以确定依赖性,执行词法分辨,基于依赖性和词法分辨来形成概念树,分析所述概念树以生成超图,基于所述超图来生成虚拟查询,以及处理所述虚拟查询以生成一个或多个结构化操作;在知识库的结构化API上执行一个或多个结构化操作;以及将与自然语言查询匹配的搜索结果返回给用户。该方面的其他实施例包括相应的计算机系统、装置和记录在一个或多个计算机存储介质上的计算机程序,每一个被配置为执行方法的动作。对于被配置为执行特定操作或动作的一个或多个计算机的系统,是指该系统上安装有软件、固件、硬件或它们的组合,在操作中使得该系统执行操作或动作。对于被配置为执行特定操作或动作的一个或多个计算机程序,是指一个或多个程序包括指令,所述指令在由数据处理装置执行时使该装置执行操作或动作。上述和其他实施例每一个可以可选地包括下述特征中的一个或多个,单独的组合。具体地,一个实施例包括结合的所有下述特征。解析所述自然语言查询包括将所述自然语言查询分成短语并且将短语作为节点放在解析树中。执行词法分辨包括生成用于一个或多个所解析的短语的概念。分析所述概念树包括:分析概念树中的概念以及父-子或兄弟姐妹关系;以及变换概念树包括用新信息注释概念、移动概念、删除概念或将概念与其他概念合并。超图表示数据库模式,其中数据表可以具有它们之间的多个联合映射。该方法进一步包括分析超图,包括使用概念树来执行用于联合的路径分辨。该方法进一步包括在将自然语言查询转换成一个或多个结构化操作期间检测故障。该方法进一步包括通过包括确定用于自然语言查询的替代解析是否可用的另外的处理来解决故障。该方法进一步包括通过包括以下操作的另外的处理来解决故障:通过用户交互界面向用户提供识别故障的一个或多个信息项;响应于与信息项的用户交互:以及根据用户交互,修改自然语言查询以生成一个或多个结构化操作。故障能基于不良解析、歧义列引用、歧义常量、歧义日期时间、未用比较关键字或否定关键字、聚合错误、丢失联合步骤、未处理概念、不匹配的名词短语或丢失数据访问中的一个或多个。知识库、自然语言前端和用户交互界面被实现在一个或多个计算机和存储指令的一个或多个存储设备上,以及其中,知识库根据数据模式来存储与实体相关联的信息并且具有用于查询知识库的程序的API。本说明书中所述的主题能在特定实施例中实现以便实现以下优点中的一个或多个。能减少用于处理在处理自然语言查询中的故障的努力。通过用户交互,能使自然语言词语匹配到由自然语言处理系统识别的词典,减少可能出现在自然语言查询中先期对查询词语的完整定义的需要。而且,在用户提供的自然语言查询中检测到的语言歧义能当它们出现时被解决,消除了基于每一替选解释来产生搜索结果的需要。此外,能更早引起用户对数据访问问题的关注,没有任何违反数据安全的风险。在从自然语言查询生成结构化查询中能最小化用户交互。具体地,系统经由评估解析以及在解析和处理以自然语言表达的输入查询期间通过识别某些错误或警告生成的结构化查询的质量,通过用户动作,使用技术来避免不必要迭代。该评估允许系统执行提供将自然语言查询翻译成结构化查询同时克服解析器的一些缺点或自然语言查询中的一些语法/结构错误的操作。因此,该系统通常能从紧凑的句子或甚至短语确定结构查询的内容。这提高了用户体验并且使得更有用地将自然语言查询翻译成结构化查询。在一些情况下,该系统在没有用户交互的情况下不能确定结构化查询。在那些情况下,该系统尝试引导用户进行能解决错误并且导致成功翻译成结构化查询的校正。例如,如果有歧义,该系统能识别并且呈现可能的解释和选择以消歧。这帮助用户在那些情况下快速地校正自然语言查询并且提高生成结构化查询的速度。系统允许未面临特定数据领域或查询语言的用户使用自然语言查询来获得特别所期望的信息。该系统接受以纯英文(或用户选择的语言)呈现的查询并且通过使用NLP(自然语言处理)技术处理它以在查询后端生成和运行相应的结构化查询并且将结果返回给用户。为了处理自然语言查询,生成多个模式词典,其提供用来处理自然语言查询的多个映射。在附图和下述描述中阐述本说明书的主题的一个或多个实施例的细节。主题的其他特征、方面和优点从描述、附图和权利要求将变得显而易见。附图说明图1是将自然语言查询转换成结构查询的示例性过程的流程图。图2是示出用于通过用户交互来处理在处理自然语言查询中的故障的示例性系统的框图。图3是示出用于在查询版本上迭代的示例性过程的流程图。图4-7是示例性概念树的图。图8是示出用于通过用户交互来处理丢失令牌故障的示例性过程的框图。图9是示出用于通过用户交互来处理词典匹配故障的示例性过程的框图。图10是示出用于通过用户交互来处理数据访问故障的示例性过程的框图。图11是示出用于通过用户交互来处理语言歧义故障的示例性过程的框图。图12是示出用于通过用户交互来处理在处理自然语言查询中的故障的示例性过程的流程图。不同图中相同的参考数字和名称指示相同的元件。具体实施方式概述用户能使用例如自由形式英文文本串的自然语言来提供查询。系统能将接收的自然语言查询转换成结构化查询,例如结构化查询语言(“SQL”)查询。能执行结构化查询并且返回响应数据以输出。例如,响应于查询,转换的结构化查询能被用来获得响应于该查询的数据,然后能将其返回给用户。该系统不总是能够成功地将给定的自然语言查询转换成结构化查询。具体地,自然语言查询能包括用户所犯的错误,包括打字错误、格式错误的句子、或丢失关键词。由于系统在识别特定语句格式方面的限制,该系统还可能不能转换自然语言查询。将自然语言查询转换成结构化查询的过程可能经过许多阶段。图1是将自然语言查询转换成结构化查询的示例性过程100的流程图。为了方便,参考执行该过程的系统,例如下文参考图2所述的系统,描述该过程。系统获得102自然语言查询。该系统能接收用户通过用户接口输入的查询。例如,用户接口能是搜索接口,用户通过该接口能提交自然语言搜索查询。在下文中,将参考图2-7,更详细地描述各个过程步骤的细节。系统解析104获得的自然语言查询。解析器能被用来将自然语言查询本文档来自技高网...
处理在处理自然语言查询中的故障

【技术保护点】
一种方法,包括:通过自然语言前端从用户获得自然语言查询;将所述自然语言查询转换成将在知识库的结构化应用编程接口API上执行的结构化操作,包括:解析所述自然语言查询,分析所解析的查询以确定依赖性,执行词法分辨,基于所述依赖性和词法分辨来形成概念树,分析所述概念树以生成超图,基于所述超图来生成虚拟查询,以及处理所述虚拟查询以生成一个或多个结构化操作;在所述知识库的结构化API上执行所述一个或多个结构化操作;以及将与所述自然语言查询匹配的搜索结果返回给所述用户。

【技术特征摘要】
2015.09.11 US 62/217,2601.一种方法,包括:通过自然语言前端从用户获得自然语言查询;将所述自然语言查询转换成将在知识库的结构化应用编程接口API上执行的结构化操作,包括:解析所述自然语言查询,分析所解析的查询以确定依赖性,执行词法分辨,基于所述依赖性和词法分辨来形成概念树,分析所述概念树以生成超图,基于所述超图来生成虚拟查询,以及处理所述虚拟查询以生成一个或多个结构化操作;在所述知识库的结构化API上执行所述一个或多个结构化操作;以及将与所述自然语言查询匹配的搜索结果返回给所述用户。2.如权利要求1所述的方法,其中,解析所述自然语言查询包括将所述自然语言查询分成短语并且将所述短语作为节点放在解析树中。3.如权利要求2所述的方法,其中,执行词法分辨包括生成用于一个或多个所解析的短语的概念。4.如权利要求1所述的方法,其中,分析所述概念树包括:分析所述概念树中的概念以及父-子或兄弟姐妹关系;以及变换所述概念树包括用新信息注释概念、移动概念、删除概念或将概念与其他概念合并。5.如权利要求1所述的方法,其中,所述超图表示数据库模式,其中数据表具有它们之间的多个联合映射。6.如权利要求1所述的方法,包括分析所述超图,分析所述超图包括使用所述概念树来执行用于联合的路径分辨。7.如权利要求1所述的方法,包括在将所述自然语言查询转换成所述一个或多个结构化操作期间检测故障。8.如权利要求7所述的方法,包括通过包括确定用于所述自然语言查询的替选解析是否可用的另外的处理来解决所述故障。9.如权利要求7所述的方法,包括通过包括以下的另外的处理来解决所述故障:通过用户交互界面向所述用户提供识别所述故障的一个或多个信息项;响应与信息项的用户交互;以及根据所述用户交互来修改所述自然语言查询以生成一个或多个结构化操作。10.如权利要求7所述的方法,其中,所述故障基于以下中的一个或多个:不良解析、歧义列引用、歧义常量、歧义日期时间、未用比较关键字或否定关键字、聚合错误、丢失联合步骤、未处理概念、不匹配的名词短语或丢失数据访问。11.如权利要求1所述的方法,其中,所述知识库、所述自然语言前端和所述用户交互界面被实现在一个或多个计算机和存储指令的一个或多个存储设备上,以及其中,所述知识库根据数据模式来存储与实体相关联的信息并且具有用于程序的API以查询所述知识库。12.一种计算系统,包括:一个或多个计算机;以及一个或多个存储单元,所述存储单元存...

【专利技术属性】
技术研发人员:托尔加·博兹卡亚阿尔曼多·约瑟夫·迪迦姆克德兰·布以游植宇
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1