当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于自然语言查询的联接路径的消岐制造技术

技术编号:15938751 阅读:32 留言:0更新日期:2017-08-04 21:41
本发明专利技术涉及用于自然语言查询的联接路径的消岐。其中一个方法包括:获得来自用户的自然语言查询;在将自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作时:响应于检测与转换相关联的行文歧义,其中行文歧义标识出自然语言查询中包括的单词的两个以上解释:通过基于已经基于知识库的数据模式生成的一个或多个联接路径从单词的两个以上解释中选择单词的解释,解决行文歧义;根据选择的单词的解释修改自然语言查询,以生成一个或多个结构化操作;对于知识库的结构化API进行一个或多个结构化操作;以及将与自然语言查询结果匹配的搜索结果返回用户。

Disambiguation of join paths for natural language queries

The present invention relates to disambiguation of join paths for natural language queries. Including one method: natural language queries from users; in the natural language query into the structured knowledge base application programming interface (API) on the structured operation: in response to the detection of associated with the conversion of the ambiguity, the ambiguity which identifies the words including natural language in the query above two interpretation: through has been based on one or more join path generating the knowledge base data model selection of more than two words from the words in the interpretation of the interpretation based on solving the ambiguity; according to the selection of the interpretation of the word query modification of natural language, to generate one or more structured operation; one or more structured operations for structured API knowledge base; and the natural language and the query results, the search results are returned to the user.

【技术实现步骤摘要】
用于自然语言查询的联接路径的消岐相关申请的交叉参考根据35U.S.C.§119(e),本申请要求2015年9月11日提交的美国临时专利申请No.62/217,409“DisambiguatingJoinPathsforNaturalLanguageQueries”的优先权,通过引用将其合并于此。
本说明书涉及用于自然语言查询的联接路径的消岐。
技术介绍
辨别进行自然语言查询的行文语境可以改善查询处理。例如,可将查询“calculatethesalesofgoodsproducedinItaly”解释为“calculatethesalesmadeinItalyofgoodsthathavebeenproduced”或者“calculatethesalesofgoodsthathavebeenproducedinItaly”。发布该查询的语境将有助于理解预期的解释。
技术实现思路
一般而言,本说明书描述为了自然语言查询将联接路径消岐的技术。一般而言,本说明书所述主题内容的一个创造性方案可以在包括以下动作的方法中具体实施:获得来自用户的自然语言查询;在将所述自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作时:响应于检测与所述转换相关联的行文歧义,其中所述行文歧义标识出自然语言查询中包括的单词的两个以上解释:通过基于已经基于所述知识库的数据模式生成的一个或多个联接路径从所述单词的两个以上解释中选择所述单词的解释,解决所述行文歧义;根据选择的所述单词的解释修改所述自然语言查询,以生成一个或多个结构化操作;对于所述知识库的所述结构化API进行所述一个或多个结构化操作;以及将与所述自然语言查询结果匹配的搜索结果返回所述用户。该方法的其他实施例包括对应的计算机系统、设备、以及在一个或多个计算机存储装置上记录的计算机程序,每个被配置为进行该方法的动作。对于要被配置为进行特定操作或动作的一个或多个计算机的系统而言,意味着系统在上面安装了软件、固件、硬件或它们的组合,工作时软件、固件、硬件或它们的组合使得系统进行操作或动作。对于要被配置为进行特定操作或动作的一个或多个计算机程序而言,意味着一个或多个程序包括在通过数据处理设备执行时,使得设备操作或动作的指令。上述及其他实施例可以分别选择性地包括以下特征的一个或多个,单独地或组合地。具体而言,一个实施例包括组合的所有以下特征。所述联接路径包括共享公共列的至少两个表的标识符。所述联接路径还包括所述公共列的一个或多个标识符。通过基于已经基于所述知识库的数据模式生成的一个或多个联接路径从所述单词的两个以上解释中选择所述单词的解释,解决所述行文歧义包括:确定所述单词与所述至少两个表的第一表的第一列中指定的值匹配;以及基于所述确定,在参考所述至少两个表的第二表的第二列中指定的值时识别所述单词。将所述自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作包括:获得通过分析器生成的分析器输出,所述输出代表所述自然语言查询;以及根据所述分析器输出生成概念树,其中子语境概念节点在所述概念树上所位于的等级不比任何属性节点更靠近所述概念树的根部。获得分析器输出包括将所述自然语言查询处理为标志。基于所述概念树以及选择的所述单词的解释生成所述结构化操作。本说明书所述主题内容可以在特定实施例中实施,从而实现以下优点的一个或多个。可以减少解决自然语言歧义所需的计算工作量。可以基于预设语境自动解决自然语言查询中出现的歧义,因此不需要用户介入。此外,对于用户提供的自然语言查询中检测的行文歧义,可以在它们出现时就被解决,这消除了基于每个替代性解释而产生搜索结果的需要。本说明书所述主题内容的一个或多个实施例的细节在附图以及以下描述中给出。根据说明书、附图、以及权利要求书,主题内容的其他特征、方案、以及优点将变得显而易见。附图说明图1是示出示例性数据表以及数据表之间的潜在联接的简图。图2是示出示例性子语境词汇的简图。图3是示出示例性超图的简图。图4是示出图3所示超图的示例性表现的简图。图5是示出示例性概念树的简图。图6是示出用于自然语言查询的联接路径的消岐的示例性系统的简图。图7至图8是示出示例性图式词汇的简图。图9是示出处理联接路径的示例的流程图。不同的附图中相同的附图标记和指定表示相同的元件。具体实施方式自然语言查询处理系统可以基于自然语言查询,利用自然语言处理(NLP)技术来产生能够在基础数据源上操作的结构化查询,并执行结构化查询来获得查询结果。为此,例如需要通过领域专家来指定——在本说明书中被称为图式词汇的——以下信息集合的一个或多个:根据自然语言查询产生的基础数据源的数据模式——例如列名与标志——例如单词或短语之间的映射;数据表之间的联接映射,例如表A中哪个列与表B中的“country”列联接;可识别的域值;例如,应当将单词“Italy”识别为国家;以及查询过滤器与自然语言查询中包括的单词之间的映射;例如一个或多个国家过滤器所参考的映射,在“whatistherevenueinG20countries”这样的查询中的短语“G20countries”。基于这些图式词汇,在接收自然语言查询之后,询问处理系统可以识别查询中的标志,例如通过利用分析器来分析查询,以及基于图式词汇将标志映射到概念。分析器可以指定所识别的标志之间的依赖关系,例如利用概念树。因此,分析器输出可包括将所识别的概念作为节点的概念树。系统可以分析概念树,以生成结构化查询——例如SQL查询,并对基础数据源执行这些结构化查询,以获得搜索结果。歧义可能由于处理自然语言查询而出现。例如,当自然语言查询中包括的单词可以解释为表示两个不同的可识别图式词汇——例如表示不同表的不同列中包括的值——的时候,歧义可能出现。本说明书描述了当歧义出现时用于检测它们的技术。因此,可以在提交机构化查询以获得搜索结果之前解决歧义。这样可以改善性能,并缩短提供与用户预期相对应的结果所需的时间。例如,当通过用户将输入查询修正一次或多次,以响应于基于有歧义的自然语言查询生成的结果消除歧义的时候,不需要生成多个结构化查询。在一些实施方式中,可以基于本文所述的一个或多个算法来解决歧义,不需要用户介入来简化处理以及合理化用户体验。例如,在接收到“calculatethesalesofgoodsproducedinItaly”的查询之后,自然语言系统可以生成以下三个标志:“sales”、“Italy”和“produced”。通过自然语言系统确定为匹配图式词汇的标志被识别为概念。例如,系统可将“sales”识别为表示图1所示表102的列“sales_usd”的概念;将概念“Italy”识别为用于国家名的反向索引匹配;将概念“produced”识别为图2所示子语境204中包括的n-gram;并且因此,系统将查询识别为包括三个概念。但是系统可以确定,用于国家“Italy”的概念是有歧义的,因为概念“Italy”可以解释为进行销售所在的国家,也可以解释为生产或制造商品所在的国家。因此系统可以要求附加语境来消岐。附加语境可以是根据与特定子语境中指定的值匹配的相同自然语言查询产生的另一个概念。例如,因为概念“produced”与子语境20本文档来自技高网...
用于自然语言查询的联接路径的消岐

【技术保护点】
一种方法,包括:获得来自用户的自然语言查询;将所述自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作,包括:响应于检测到行文歧义,在该行文歧义中,所述自然语言查询中包括的单词具有两个以上解释:通过基于已经基于所述知识库的数据模式生成的一个或多个联接路径而从所述单词的所述两个以上解释中选择所述单词的解释,来解决所述行文歧义;根据所选择的所述单词的解释,修改所述自然语言查询,以生成一个或多个结构化操作;对于所述知识库的所述结构化API,进行所述一个或多个结构化操作;以及将与所述自然语言查询结果相匹配的搜索结果返回到所述用户;其中,在一个或多个计算机以及存储有指令的一个或多个存储装置上实施所述知识库,以基于结构化操作产生操作结果;以及其中,所述知识库根据所述数据模式来存储与实体相关联的信息,并且具有用于程序的API,以查询所述知识库。

【技术特征摘要】
2015.09.11 US 62/217,4091.一种方法,包括:获得来自用户的自然语言查询;将所述自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作,包括:响应于检测到行文歧义,在该行文歧义中,所述自然语言查询中包括的单词具有两个以上解释:通过基于已经基于所述知识库的数据模式生成的一个或多个联接路径而从所述单词的所述两个以上解释中选择所述单词的解释,来解决所述行文歧义;根据所选择的所述单词的解释,修改所述自然语言查询,以生成一个或多个结构化操作;对于所述知识库的所述结构化API,进行所述一个或多个结构化操作;以及将与所述自然语言查询结果相匹配的搜索结果返回到所述用户;其中,在一个或多个计算机以及存储有指令的一个或多个存储装置上实施所述知识库,以基于结构化操作产生操作结果;以及其中,所述知识库根据所述数据模式来存储与实体相关联的信息,并且具有用于程序的API,以查询所述知识库。2.根据权利要求1所述的方法,其中,所述联接路径包括共享公共列的至少两个表的标识符。3.根据权利要求2所述的方法,其中,所述联接路径还包括所述公共列的一个或多个标识符。4.根据权利要求3所述的方法,其中,通过基于已经基于所述知识库的数据模式生成的一个或多个联接路径而从所述单词的所述两个以上解释中选择所述单词的解释来解决所述行文歧义包括:确定所述单词与在所述至少两个表中的第一表的第一列中指定的值相匹配;以及基于所述确定,在参考所述至少两个表中的第二表的第二列中指定的值时识别所述单词。5.根据权利要求1所述的方法,其中,将所述自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作包括:获得通过分析器生成的分析器输出,所述输出代表所述自然语言查询;以及根据所述分析器输出来生成概念树,其中,子语境概念节点在所述概念树上所处的等级不比任何属性节点更靠近于所述概念树的根部。6.根据权利要求5所述的方法,其中,获得分析器输出包括:将所述自然语言查询处理为标志。7.根据权利要求5所述的方法,其中,基于所述概念树以及所选择的所述单词的解释,来生成所述结构化操作。8.根据权利要求1所述的方法,其中,在没有用户介入的情况下,来解决所述行文歧义。9.根据权利要求1所述的方法,其中,在所述行文歧义出现时解决该行文歧义,以使得基于通过被解决的行文歧义而修改的自然语言查询来进行所述一个或多个结构化操作。10.一种计算系统,包括:一个或多个计算机;以及一个或多个存储单元,其存储有指令,当通过所述一个或多个计算机执行时,所述指令使得所述计算系统进行包括以下方面的操作:获得来自用户的自然语言查询;将所述自然语言查询转换为要在知识库的结构化应用编程接口(API)上进行的结构化操作,包括:响应于检测到与所述转换相关联的行文歧义,其中,所述行文歧义标识出在所述自然语言查询中包括的单词的两个以上解释:通过基于已经基于所述知识库的数据模式生成的一个或多个联接路径而从所述单词的所述两个以上解释中选择所述单词的解释,来解决所述行文歧义;根据所选择的所述单词的解释,修改所述自然语言查询,以生成一个或多个结构化操作;对于所述知识库的所述结构化API进...

【专利技术属性】
技术研发人员:托尔加·博兹卡亚阿尔曼多·约瑟夫·迪迦姆克
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1