当前位置: 首页 > 专利查询>雅虎公司专利>正文

使用内联上下文查询的搜索系统及方法技术方案

技术编号:5712473 阅读:172 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种使用与用户在输入查询时正在查看的Web页面(或其他文档)有关的上下文信息实现搜索的系统和方法。该页面包括上下文搜索界面,该上下文搜索界面具有表示该页面的内容的相关上下文向量。当用户通过上下文搜索界面提交搜索查询时,该查询和上下文向量都被提供给查询处理器并用于响应该查询。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总》也涉及一种4叟索系统和方法,具体;也涉及一种4吏用内 耳关上下文查询的4叟索系统和方法。
技术介绍
万维网(World Wide Web,简称Web),如其名字所暗示的一 样,是相互链接的信息的分散性全球集合,该相互链接的信息通常 为可以包含虚拟地涉及每个可以想象得到的主题的文本、图像、和 /或媒体内容的"页面"形式。知道或查找到页面的统一资源定位器 (URL)的用户可以向Web客户程序(通常称为浏览器)提供该 URL并可以立即查看该页面。由于网页(Web页)通常都包括到其 他页面的链接(也称为"超链接"),因此,查找URL通常并不困难。对于大多数用户来说,查找到他们感兴趣的页面的URL比较 困难。Web上可获得的内容的凄t量已经将查找关于特定兴趣的页面 的任务变为了可能是最终在大海里捞针的问题。为了解决这个问 题,演化出了搜索4是供商(例如,Yahoo!、 MSN、 Google)行业。 4叟索4是供商通常都维护Web页面的凝::悟库,其中,每个页面的URL 都与反映其内容的信息(例如,关4定字、分类数据等)有关。搜索 提供商还维护用于管理Web上的搜索页面(或站点)的搜索服务器。 搜索页面具有表格,用户可以将通常包括表示其兴趣的一个或多个 项的查询输入该表4各中。 一旦输入了查询,4叟索月艮务器就访问l史据 库并生成"命中(hit)"(通常是其内容与从用户的查询中得到的关 4建字相匹配的页面的URL)列表。该列表一皮^是供给用户。由于查询 通常会返回数百、数千、或在一些情况中会返回数百万个命中,所 以搜索提供商开发出了用于对这些命中进行排列(即,确定将命中 显示给用户的顺序)的复杂算法,以4吏与给定查询最相关的页面可 能出现在该列表的顶部附近。典型的排列算法不仅考虑了关键字及 其出现的次数,还考虑了其他信息(诸如,链接到命中页面的其他 页面的数量、命中页面在用户中的受欢迎程度等)。为了进一步方便使用他们的力l务, 一些搜索纟是供商现在都l是供了用于Web浏览器程序的"搜索工具条"附加软件。搜索工具条通常都具有用户可以在其中键入查询的文本框、以及用于将查询提交给搜索提供商的服务器的"提交(Submit)"按钮。 一旦用户安装了搜 索工具条,则不管用户正在查看什么页面,搜索工具条通常都是可 见的,这4吏用户能够在任<可时候都可以输入查询,而不必首先导舶二 到搜索提供商的Web站。以与在提供商的站点启动的搜索相同的方 式来处理通过工具条启动的搜索;唯一的不同在于使用户省去了导 航到搜索提供商的站点的步骤。虽然自动搜索技术非常有用,但其确实还具有^艮多局限性,最主要的一个是用户需要尽量传送足够多的上下文信息来引导搜索 相关内容。太宽的查询(太少的上下文)可能会返回淹没在大量不 相关的命中中的很少的几个相关内容;而太窄的查询(太多的上下 文)可能会导致相关内容随着不相关内容而被滤掉。通常,用户脑 海里有非常具体的上下文,^f旦这种具体的上下文可能没有反映在查 询中。例如,输入查询"jaguar(美洲虎)"的用户可能完全正在想的 是汽车、动物、专业足球队、或其他事物。原则上,可以/人用户l命入查询前所估文的事情中收集上下文4言 息。众所周知,当用户当前正在查阅的信息引发了另外的问题时, 通常会促动用户进行搜索。例如,在查看关于汽车的页面后(或同时)输入查询"美洲虎"的用户,才及有可能对汽车感兴趣,而在查看 关于动物园的页面后(或同时)输入相同查询的用户则极有可能对 动物感兴趣。现有的搜索技术没有提供收集这种上下文信息或使用 该上下文〗言息来响应查询的可靠方法。因此,希望^是供一种具有可以用于响应查询的上下文4言息的4臾 索服务器。
技术实现思路
本专利技术的实施例提供了 一种使用与用户输入查询时正查看的 页面或其〗也文档有关的上下文〗言息来实3见4叟索的系统和方法。在一 些实施例中,页面或文档包4舌上下文4叟索界面,其中,上下文4臾索上下文搜索界面纟是交搜索查询时,上下文向量也被^是供给查询处理 器并用于对查询进行响应。上下文向量还可以用于其他方面(诸如, 选4奪用户可能感兴趣的其他内容)。才艮据本专利技术的一个方面,才是供了一种用于处理查询的方法。通 过上下文4叟索界面4妾收用户查询,其中,用户查询包4舌用户l餘入的 数据。除此之外,接收与上下文搜索界面有关的上下文向量,其中, 上下文向量包括表示与上下文搜索界面有关的内容的数据。使用搜索查询和上下文向量对搜索语料库(corpus)进行搜索,以获取包 括命中列表的搜索结果。用于呈现的搜索结果被传送给用户。才艮据本专利技术的另 一个方面,提供了 一种用于向用户提供信息的 方法。提供包括内容的页面。使上下文搜索界面与内容相关联,其 中,上下文搜索界面用于接收来自用户的查询。使表示内容的上下 文向量与上下文4叟索界面相关联。通过上下文4叟索界面4妄收来自用 户的查询,并将该查询和上下文向量传送纟会4臾索力艮务器以用于处理,其中,4叟索力l务器^皮配置来使用查询和上下文向量对:度索语料 库进4亍4叟索,并将4叟索结果返回乡会用户。在一些实施例中,为下文 搜索界面限定了未激活状态和激活状态,其中,当处于未激活状态 时,上下文4叟索界面在页面上显示为小图标,当处于激活状态时, 上下文纟臾索界面在页面上显示为完整界面。例如,可以通过,默i人以 未激活状态显示上下文搜索界面,并可以响应于用户对图标的选4奪 以激活状态重新显示上下文4叟索界面u在一些实施例中,响应于用 户对图标的选择,可以将特定内容添加到页面中,其中,基于上下 文向量来选冲奪该特定内容。下面的详细描述和附图将提供对本专利技术的特征和优点的更好的理解。附图说明图1是根据本专利技术实施例的包括客户系统的信息检索和通信网络的高层次框图;图2是根据本专利技术实施例的另一个信息检索和通信网络的框图;图3是根据本专利技术实施例的具有上下文搜索界面的Web页面的 示意图;图4是根据本专利技术实施例的用于上下文搜索的上下文向量的示 意图;界面的Web页面的示意图; 图6是才艮据本专利技术实施例的具有多个上下文4叟索界面的Web 页面的示意图;文搜索界面的过程的流程图;图8是根据本专利技术实施例的用于生成上下文向量的过程的流程图;图9是根据本专利技术实施例的用于用户创建上下文搜索界面的过 程的流程图;图10是根据本专利技术实施例的用于执行上下文搜索的过程的流 程图;图11是4艮据本专利技术实施例的用于4丸行上下文搜索的另一过程 的流程图;的Web页面的示意图;以及l ; , 、、 、 、 具体实施方式I .概述A.网纟各实玉见 图1示出了才艮据本专利技术实施例的包括客户系统20的信息才全索和通信网络10的总体相"见。在计算才几网络10中,客户系统20通 过互4关网40或其他通信网络(例如,通过任4可局域网(LAN)或 广域网(WAN)连接)连接至任意数量的服务器系统501至50N。 如本文中将描述的,根据本专利技术将客户系统20配置为与服务器501 至50N中的任意一个进行通信,以(例如)访问、接收、提取、和 显示々某体内容和诸如web页面的其他信息。图1中示出的系统中的多个元件包4舌不需要在此处详细i兌明的 传统的、公知的元件。例如,客户系统20可以本文档来自技高网
...

【技术保护点】
一种用于处理查询的方法,所述方法包括:    通过上下文搜索界面接收包括由用户输入的数据的用户查询;    接收与所述上下文搜索界面有关的上下文向量,所述上下文向量包括表示与所述上下文搜索界面有关的内容的数据;    使用所述用户查询和所述上下文向量对搜索语料库进行搜索,以获取包括命中列表的搜索结果;以及    将用于呈现的所述搜索结果传送至所述用户。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:赖纳克拉夫特
申请(专利权)人:雅虎公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1