当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于事实查询引擎的带有来自信息源的包含查询词语和回答词语的片段的用户界面制造技术

技术编号:2830361 阅读:423 留言:0更新日期:2012-04-11 18:40
公开了一种可以对事实查询提供回答的源文档的片段的方法和系统。为了响应用户对源文档的请求可以提供源文档的片段,从该源文档提取对事实查询的事实回答。所述片段包含所述事实查询的词语和所述回答的词语。所述片段可以连同所述源文档的统一资源定位器(URL)一起被显示。

【技术实现步骤摘要】
【国外来华专利技术】
公开的实施例通常涉及对事实的查询,尤其涉及用于事实查询引 擎的用户界面和具有查询词语和回答词语的源的片段。
技术介绍
万维网(也可以叫做web)和万维网中的网页都是事实信息的巨 大资源。用户可以查看网页来获得事实问题的回答,例如波兰的首 都是什么或者乔治 华盛顿的出生日期是什么。然而,万维网 搜索引擎在这一点上对用户不能提供帮助,那就是他们通常不能提供 对于例如上述的那些事实查询的简单、简洁的回答。相反的,万维网 搜索引擎提供被确定为匹配用户查询的网页的列表,用户必须对匹配 的网页进行分类才能发现回答。试图建立搜索引擎,可以对事实问题提供快速回答,但这种方式 有其固有的缺点。例如, 一些搜索引擎从单一的资源提取它们的事实,例如从特定的百科全书。这就限制了这些引擎可以应答的问题的类型。 例如,基于某百科全书的搜索引擎不可能回答许多关于流行文化的问 题,例如关于电影、歌曲等的问题,而且也不可能回答许多关于产品、 服务、零售和批发业务诸如此类的问题。如果扩展由这样的搜索引擎 所使用的资源集,然而,这样的扩展可能引入对事实查询的多种可能 回答的可能性,其中一些可能是矛盾的或者含混的。另外,随着资源 集的扩展,信息可能来自不可靠的来源或者未知可靠性的来源。
技术实现思路
根据本专利技术的一方面,公开了一种用于显示事实的源的方法,该方法包括接收包括一个或多个词语的事实查询,查找对该包括一个或多个词语的事实査询的回答,查找一个或多个源文档,所述源文档包括所述查询的一个或多个词语以及所述回答的一个或多个词语,生成 至少——一个源文档的片段,该片段包括所述查询的一个或多个词语以及所述回答的一个或多个词语,生成包括所述片段的响应。 附图说明图1示出根据本专利技术一些实施例的网络。图2示出根据本专利技术一些实施例的用于对象的数据结构和事实储 存库中的相关联事实。图3示出根据本专利技术一些实施例的用于事实索引的数据结构。 图4示出根据本专利技术一些实施例的用于可能回答的列表的数据结构。图5A-5C是根据本专利技术一些实施例的用于选择对事实查询的回答以及显示回答和回答的源的过程的流程图。图6示出根据本专利技术一些实施例的对事实査询的回答的表示。 图7示出根据本专利技术一些实施例的对于事实查询的回答的源的列表的表示。图8示出了根据本专利技术一些实施例示的系统,用于选择对事实查 询的回答以及显示该回答和回答的源的列表。在全部图中相同的参考数字表示相应的部分。具体实施例方式查询引擎可以存储从很多分散的源收集的事实信息并且响应于用 户对事实信息(或者事实査询)的查询而返回回答。从许多源收 集信息扩展了用于查询引擎的可用事实信息的范围,但也引入了多个 可能回答的可能性。查询引擎可以识别可能的回答并且从可能的回答 中选择最好的回答提供给用户,或者它也可以确定没有一个可能的回 答可以提供给用户。查询引擎还可以提供回答的源的列表,包括来自 每一个源的文本部分。文本的部分或多个部分被称作片段(snippet), 可以包括,实查询词语和回答词语。当片段示出了由搜索引擎查找或 选择的回答,源的列表给用户提供回答的基础并且可以帮助用户评估 回答的真实性。图1根据本专利技术的一些实施例示出了网络100。网络100包括一 个或多个客户端102和查询引擎106。客户端102可以包括客户端应用 程序(未示出)。网络100还可以包括一个或多个可以耦接这些组件 的通信网络104。客户端应用程序为客户端102的用户(未示出)提供至査询引擎 106的接口。使用在客户端102上运行的客户端应用程序,用户可以向 查询引擎106提交关于文档的搜索(例如,web搜索)和事实查询并且 观察来自査询引擎106的响应。客户端应用程序可以包括万维网浏览 器。万维网浏览器的实例包括FIREFOX, INTERNET EXPLORER和 OPERA。查询引擎106提供平台用于存储事实信息和响应事实查询,以及处理其它类型的搜索。查询引擎106可以处理对文档的搜索,例如万 维网搜索,还可以处理事实信息的查询。查询引擎106提供查询服务器IOS。査询服务器108为查询引擎106提供前端。査询服务器108从 客户端102接收查询,将查询引导至能够处理事实查询和其它搜索的 查询引擎106的组件,产生响应,并且将响应传送给客户端102。查询 服务器108可以被分布到多个计算机。在其它实施例中,查询引擎可 以处理更多或者更少的功能。例如,在其它实施例中,响应产生可以 在查询引擎106中的其它地方来处理。查询引擎106包括第一搜索控制器110,第一高速缓存112,文档 索引114和文档数据库116,用于处理文档搜索。在一些实施例中,为 了提供对大量文档的快速存取可以在多个计算机中布局这些组件。例 如,文档数据库116可以布局在N个服务器中,利用映射功能例如模 数N功能来确定哪些文档被存储在N个服务器的每一个。N可以是 大于1的整数,例如介于2和8196之间的整数。类似的,文档索引114 可以分布在多个服务器中,第一高速缓存112也可以分布在多个服务 器中。另外,第一搜索控制器iio也可以分布在多个计算机中。第一搜索控制器IIO耦接到查询服务器108。第一搜索控制器110 也耦接到第一高速缓存112、文档索引114和文档数据库116。配置第 一搜索控制器110使得可从查询服务器108接收文档搜索查询并且传 送该查询到第一高速缓存112、文档索引114和文档数据库116。第一 高速缓存112用于通过临时存储以前找到的搜索结果来提高搜索效率。第一搜索控制器110从第一高速缓存112和/或文档索引114接收 文档搜索结果并且构建经排序的搜索结果列表。第一搜索控制器110 然后向查询服务器108返回定位文档列表用于向前传送到客户端102。 由第一搜索控制器IIO从第一高速缓存112和/或文档索引114接收的 文档搜索结果可以伴随着搜索结果中的被定位文档片断。查询引擎106还包括第二搜索控制器118,第二高速缓存10,事实索引122,以及事实储存库124。在一些实施例中,为了提供对大量事实的更快速的存取可以在多个计算机中布局这些组件。例如,事实 储存库124可以布局在N个服务器中,可利用映射功能例如模数N 功能来确定哪些事实被存储在N个服务器的每一个中。N可以是大于1 的整数,例如介于2和8196之间的整数。类似的,事实索引122可以 分布在多个服务器中,第二高速缓存120也可以分布在多个服务器中。 另外,第二搜索控制器118也可以分布在多个计算机中。第二搜索控制器118耦接到查询服务器108。第二搜索控制器118 还耦接到第二高速缓存120、事实索引122和事实储存库124。第二搜 索控制器118被配置为可以从查询服务器108接收对事实问题的回答 的査询并且传送该査询到第二高速缓存120和事实储存库124(通过事 实索引122)。第二高速缓存120用于通过临时存储以前定位的搜索结 果来提高事实检索效率。第二搜索控制器118从第二高速缓存120和/或事实储存库124接 收事实查询的可能回答的事实。第二搜索控制器118从可能的回答中 选择回答作为最好的回答提供给用户。回答被传送给查询服务器108, 其中产生包括该回答的响应并且传送给客户端10本文档来自技高网...

【技术保护点】
一种用于显示事实的源的方法,包括:接收事实查询,该事实查询包括一个或多个词语;查找对该事实查询的回答,该回答包括一个或多个词语;查找那些包括所述事实查询的一个或多个词语和所述回答的一个或多个词语的源文档;为所述源文档中的至少一个产生片断,所述片断包括所述事实查询的一个或多个词语和所述回答的一个或多个词语;以及产生包括所述片断的响应。

【技术特征摘要】
【国外来华专利技术】US 2005-3-31 11/097,6891.一种用于显示事实的源的方法,包括接收事实查询,该事实查询包括一个或多个词语;查找对该事实查询的回答,该回答包括一个或多个词语;查找那些包括所述事实查询的一个或多个词语和所述回答的一个或多个词语的源文档;为所述源文档中的至少一个产生片断,所述片断包括所述事实查询的一个或多个词语和所述回答的一个或多个词语;以及产生包括所述片断的响应。2. 根据权利要求l的方法,其中产生响应进一步包括在片断中突 出所述事实查询的一个或多个词语和所述回答的一个或多个词语。3. 根据权利要求1的方法,进一步包括响应在对所述事实査询的 所述回答的显示表示中的链接的用户选择。4. 根据权利要求3的方法, 户选择。5. 根据权利要求1的方法, 档的请求。6. 根据权利要求5的方法, 或多个源文档的请求。其中产生响应是响应于所述链接的用进一步包括接收列出一个或多个源文其中产生响应是响应于所述列出一个7. —种用于显示事实的源的系统,包括查询接收器,用于接收事实查询,所述事实查询包括一个或多个词语;回答査找器,用于査找对于事实查询的回答,该回答包括一个或 多个词语;源文档查找器,用于査找源文档,所述源文档包括所述事实査询 的一个或多个词语和所述回答的一个或多个词语;片断生成器,用于对所述源文档中的至少一个产生片断,所述片 断包括所述事实查询的一个或多个词语和所述回答的一个或多个词语;以及响应生成器,用于产生包括所述片断的响应。8. 根据权利要求7的系统,其中所述响应生成器进一步包括指令, 用于在所产生的片断中突出所述事实查询的一个或多个词语和所述回 答的一个或多个词语。9. 根据权...

【专利技术属性】
技术研发人员:安德鲁威廉霍格
申请(专利权)人:谷歌公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1