当前位置: 首页 > 专利查询>微软公司专利>正文

统一和混合搜索的系统和方法技术方案

技术编号:2861015 阅读:139 留言:0更新日期:2012-04-11 18:40
提供了用于全异资源的统一搜索的系统、方法和计算机可访问媒质。该系统和方法确定要在其中搜索的最相关的全异资源,并混合来自搜索的最相关的结果,以用综合的方式向用户呈现。

【技术实现步骤摘要】

本专利技术一般涉及计算机软件和搜索引擎,尤其涉及便于从不同资源搜索内容的系统和方法。
技术介绍
数字形式的内容的广泛而迅速的增加提出了一种在各种环境中搜索信息的新机遇。除无所不在的因特网搜索引擎之外,也有其它常见的搜索工具可供用户使用。例如,电子邮件应用程序可向用户提供搜索出现在用户发送或接收的电子邮件的主标题或正文中的信息的工具。在文字处理应用程序中,用户可使用工具来搜索用户所创建或所访问的文档的标题或正文中的单词。其它类型的搜索可包括使用与图像相关联的元数据的图像搜索。学习如何使用这些不同的搜索工具可能令用户感到迷惑。首先,现有的搜索工具被设计成在假定用户已标识了要观察的特定资源-对许多用户此假定不一定准确-的情况下搜索特定的数据资源。对于现今的用户,知道要到何处寻找尤其困难,因为计算机越来越多地使用因特网或其它类型的网络链接到其它计算机。寻找的可能位置的绝对量,以及一旦到达该位置所要搜索的数据量,令尽可能有效地搜索变得十分重要。确定要到何处寻找,以及挑选出哪些搜索结果是最相关的可以是令人生畏的工作。此外,对要寻找的最佳位置以及最相关结果的确定可能会迅速地改变,由此很难保持搜索既相关又有效。现有搜索工具的另一问题是每一搜索工具具有不同的界面,用户必须学习这些界面以找出他或她正在寻找的内容。例如,在Windows XPTM操作系统下的搜索(Search)命令调用“搜索助理(search companion)”来引导用户以完全不同于Microsoft Word文字处理程序下的搜索(Search)命令的方式进行搜索,后者用具有选项卡的搜索对话框来提示用户。先前有各种努力来为用户简化搜索,但这些努力不足以满足用户的需求。例如,在因特网搜索引擎的环境中,允许用户一次键入搜索词然后同时调用若干不同的搜索引擎的网站曾经是流行的。但是这类网站没有进一步帮助用户有效地搜索最相关的内容或从各种搜索中挑选出最相关的结果。实际上,当返回了比使用单个搜索引擎时更多的结果时,这类网站可能将用户的任务复杂化。
技术实现思路
为克服上述问题,提供了一种统一搜索的系统、方法和计算机可访问媒质。该系统和方法便于不同资源的统一搜索,并混合来自搜索的最相关结果,以用综合的方式向用户呈现。依照本专利技术的一个方面,用户导航到一统一搜索入口界面并输入查询。该统一搜索过程捕捉该查询的导航上的下文,并确定在最相关的资源,在最相关的资源中,不仅基于查询的内容,即搜索词,还基于正引导到该查询的入口的导航的上下文中的一个或多个,即搜索入口点、用户偏好以及随时间推移所收集的潜在资源的相关度的任何自动测量来搜索。用户偏好可由用户明确地预定义,或基于用户过去的行为来隐含地确定,并可包括一私密或安全偏好,用于指定应当不再搜索哪些资源或哪些资源是可信的,无论其确定的相关度如何。相关度的自动测量包括使用数据,它反映用户如何在本地和/或非本地环境中与资源交互,并由此反映其与特定搜索查询的潜在相关度。资源包括包含可搜索内容以及内容本身的各种数据库和其它数据存储库。使用数据包括诸如访问资源的频率、访问资源的时间长度、用户在访问之后对资源作出的行动(如,打开、检索、浏览、编辑、发送、复制、保存、创建、购买交易等)的数据。本地使用数据表示本地用户与资源的交互,而非本地使用数据表示许多用户与资源的交互的集成。依照本专利技术的另一方面,确定在其中进行搜索的最相关资源可包括确定何时将搜索联合到另外的资源,这些另外的资源一般不会被搜索,因为搜索它们太昂贵或者太耗时,这些另外的资源如可通过虚拟专用网络、企业网络、大数据库,或付费可用的专利数据库访问的远程计算机。在本专利技术的一个方面,确定是否将搜索联合到其它资源可由用户偏好来控制。依照本专利技术的又一方面,一旦确定了最相关资源,该系统和方法使用归一化为搜索词在不同资源上的出现统一了搜索。归一化通过确定出现在例如网页标题中的搜索词相对于出现在电子邮件的主标题中的搜索词的相对重要性来确保统一的搜索将产生有意义的结果。确定出现在一个位置中的搜索词相对于另一位置的搜索词的相对重要性包括首先确定在何处搜索每一相关资源,然后确定如何权衡搜索词在一个位置中的出现与其在其它位置中的出现。依照本专利技术的再一方面,使用随时间推移构建的局部索引来执行搜索,以对被确定为与用户搜索相关的资源进行索引。一旦被索引,对索引的资源的任何改变都将在索引中反映以用于未来的搜索。依照本专利技术的还有一个方面,一旦执行了统一搜索,该系统和方法提供了混合搜索结果并以综合的方式向用户呈现混合的结果。混合搜索结果包括,确定显示来自哪些资源的哪些结果,以及以什么顺序显示等等。以综合的方式向用户呈现混合结果包括,以易于访问的格式显示不同的结果等等,该易于访问的格式允许用户快速地标识他或她搜索的特定数据,而无论结果所代表的数据类型如何。依照本专利技术的再有一个方面,提供了用于统一搜索的计算机可访问媒质。该计算机可访问媒质包括数据结构和计算机可执行组件,它们包括一统一搜索处理器,它便于不同资源的统一搜索,并混合来自搜索的最相关结果,以综合的方式向用户呈现。该数据结构以一般与上述方法一致的方式定义了资源、用户偏好、导航的上下文数据、自动相关度数据以及索引数据。同样,该计算机可执行组件能够执行一般与上述方法一致的行动。附图说明当结合附图参考以下详细描述时,可以更容易地理解本专利技术的上述方面和许多附加优点,附图中图1是依照本专利技术可在其中执行统一搜索并呈现搜索结果的示例性统一搜索系统和一个合适的操作环境的描述;图2是依照本专利技术的一个实施例更详细描述图1的统一搜索系统的某些组件的排列的框图;图3是更详细描述用于实现本专利技术的一个实施例的搜索客户端的某些计算组件的排列的框图;图4A-4B所示是依照本专利技术的一个实施例结合图1和2的统一搜索系统所执行的用于实现统一搜索并以综合的方式呈现搜索结果的逻辑的流程图;图5是用于实现本专利技术的一个实施例的示例性统一搜索用户界面的图示;图6是依照本专利技术的一个实施例,在混合了搜索结果并以综合的方式向用户呈现之后的稍后时刻,图5的示例性统一搜索用户界面的图示;以及图7是依照本专利技术的一个实施例,在选择了显示多媒体搜索结果的选项之后,图6的示例性统一搜索用户界面的图示。具体实施例方式以下描述旨在提供适用于实现本专利技术的一个实施例的各个特征的计算系统的简要、通用描述。尽管将在个人计算机和服务器计算机,或可用于在其中辅助任务由通过通信网络链接在一起的远程计算装置执行的分布式计算环境的其它类型的计算装置的一般上下文中描述本计算系统,本领域的技术人员可以理解,本专利技术也可以用许多其它计算机系统配置来实践,包括多处理器系统、小型机、大型机等等。除上述更常规的计算机系统之外,本领域的技术人员将认识到,本专利技术可在其它计算设备上实践,包括膝上计算机、图形输入板计算机、个人数字助理(PDA)、蜂窝电话和在其上安装了计算机软件或其它数字内容的其它设备。尽管本专利技术的各方面可以借助由web浏览器结合个人计算机执行的程序或进程,或由搜索引擎结合服务器计算机执行的程序或进程来描述,本领域的技术人员将认识到,这些方面也可以结合其它程序模块来实现。一般而言,程序模块包括例程、子例程、程序、进程、组件、数据结构、函数、接口、对本文档来自技高网
...

【技术保护点】
一种便于从全异的资源中搜索内容的方法,其特征在于,所述方法包括:响应于一搜索内容的请求,显示一统一搜索入口界面;从多个全异资源中确定在其中搜索在所述统一搜索入口界面中输入的搜索词的出现的至少一个相关资源;归一化所述相关全异资源;以及混合从在所述归一化相关全异资源中搜索所述搜索词的出现中获得的全异结果。

【技术特征摘要】
US 2004-1-26 10/765,8191.一种便于从全异的资源中搜索内容的方法,其特征在于,所述方法包括响应于一搜索内容的请求,显示一统一搜索入口界面;从多个全异资源中确定在其中搜索在所述统一搜索入口界面中输入的搜索词的出现的至少一个相关资源;归一化所述相关全异资源;以及混合从在所述归一化相关全异资源中搜索所述搜索词的出现中获得的全异结果。2.如权利要求1所述的方法,其特征在于,归一化所述相关全异资源包括确定所述搜索词在第一全异资源的一个位置中出现相对于在第二全异资源的另一位置中出现的相对重要性;以及依照所述相对重要性对所述资源中所述搜索词的出现加权。3.如权利要求2所述的方法,其特征在于,混合所述全异结果包括按照所述搜索词的出现的权值对所述结果分级、按照与所述资源相关联的分类显示所分级的结果、以及显示其中所述搜索词在每一分类的可比较位置中出现的位置。4.如权利要求1所述的方法,其特征在于,它还包括捕捉所述搜索请求的上下文;以及其中,确定所述至少一个相关资源是基于所述搜索请求上下文。5.如权利要求1所述的方法,其特征在于,它还包括获得所述多个全异资源的每一个的相关度的自动测量;其中,确定所述至少一个相关资源是基于所述相关度的自动测量的。6.如权利要求5所述的方法,其特征在于,所述相关度的自动测量是量化用户与所述资源的交互的度量。7.如权利要求6所述的方法,其特征在于,所量化的用户交互包括用户访问所述资源的频率、用户访问所述资源的时间长度、以及用户在所述资源上执行的行动的重要性中的至少其中之一。8.如权利要求1所述的方法,其特征在于,它还包括获得指示要在其中搜索的较佳资源的用户偏好;其中,确定所述至少一个相关资源是基于所述用户偏好中指示的所述较佳资源。9.如权利要求1所述的方法,其特征在于,它还包括为所述全异资源构建一索引;以及在搜索所述搜索词的出现时搜索与所述相关资源相关联的索引。10.一种用于电子内容的统一搜索的系统,其特征在于,所述系统包括包含可搜索内容的多个全异资源;一用于储存为所述资源收集的自动相关度数据的存储库;一搜索词输入;以及一处理器,它基于所述自动相关度数据确定所述全异资源中的哪一个与所述搜索词输入最相关、归一化所述相关资源、在所归一化的相关资源中搜索所述搜索词、以及混合来自所述搜索的结果以向用户显示,其中,所述结果表示从所述归一化相关资源的至少一个获得的相关但全异的内容。11.如权利要求10所述的系统,其特征在于,归一化所述相关资源包括从所述全异资源中确定要在其中搜索所述搜索词的出现的可比较数据。12.如权利要求11所述的系统,其特征在于,混合来自所述搜索的结果包括基于所述可比较数据中所述搜索词的出现的相对重要性对所述全异结果分级,以及以统一的方式显示来自每一个所述结果的可比较数据。13.如权利要求10所述的系统,其特征在于,它还包括一用户偏好输入,并且其中,确定所述全异资源的哪一个与所述搜索词输入最相关是基于所述用户偏好输入。14.如权利要求10所述的系统,其特...

【专利技术属性】
技术研发人员:EL梅斯EB瓦特森O荷斯特希勒
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1