当前位置: 首页 > 专利查询>微软公司专利>正文

为聚焦的搜索构建并使用子网制造技术

技术编号:2861443 阅读:210 留言:0更新日期:2012-04-11 18:40
一种便于在包括对应于用户感兴趣的主题和/或用户特征的子网的站点集合上的聚焦搜索的执行的系统。该子网包括涉及该主题和/或用户特征的多个域和/或路径(如,站点)。该子网内的每一站点被分配一指示该站点与期望的主题和/或用户特征的相关度的权值。搜索引擎采用该子网以便于在站点集合上聚焦搜索。搜索引擎接收查询,并使用该子网在站点集合上聚焦对应于由该子网表示的主题和/或用户特征的搜索。搜索的结果至少部分地基于向该子网内的站点分配的相关度权值被返回到用户。

【技术实现步骤摘要】

本专利技术一般涉及因特网和/或内联网搜索,尤其涉及便于域和/或路径的主题分类或偏置,并且还便于这类分类的搜索的系统和方法。
技术介绍
计算机和网络技术从高成本、低性能数据处理系统到低成本、高性能通信、问题解决和娱乐系统的演变提供了一种减少执行诸如通信联系、付帐、购物、预算、和信息收集等日常任务的负担的节省成本且节省时间的方法。例如,通过有线或无线技术与因特网接口的计算系统可向用户提供用其指尖几乎瞬时地访问位于全球的网站和服务器存储库上的健康信息的通道。通常,可从网站和服务器上获得的信息是通过在web客户机(如,计算机)上执行的web浏览器来访问的。例如,web用户可使用web浏览器,并通过将网站的同一资源定位器(URL)(如,web地址和/或因特网地址和/或内联网地址)输入到web浏览器的地址栏然后按下键盘上的回车键或者用鼠标点击“go(转到)”按钮来访问网站。URL通常包括便于访问的四部分信息指示用于信息交换的一组规则和标准的协议(计算机彼此通信的语言)、到网站的位置、维护该网站的组织的名称、以及标识组织类型的web地址后缀(如,com、org、net、gov和edu)。在某些情况下,用户事先知道站点或服务器的名字,和/或到用户期望访问的站点或服务器的URL。在这些情况下,用户可通过将URL输入到地址栏并连接到该站点来如上所述地访问该站点。然而,在大多数情况下,用户不知道URL或站点名。相反,用户采用了一种搜索功能以便于基于由用户提供的关键字定位特定的站点。当前存在两种完全不同类型的搜索功能-其搜索被限制在特定域或站点(如,www.domain.com)的域专用搜索功能,以及在整个万维网(或内联网)中搜索涉及提供的关键字的站点的通用搜索功能(如,通用搜索引擎)。例如,用户可能期望定位包含关于计算机病毒的信息的站点。第一个选项是直接到专门研究涉及计算机病毒的信息的特定的域(如,www.computervirus.com),并在该域内搜索包含相关信息的文档(如,www.computervirus.com/virus1.htm)。更具体地,用户将URL www.computervirus.com输入到web浏览器的地址栏,并被定向到这一站点。在该站点上,用户可在搜索对话框中输入关键字,搜索将返回域www.computervirus.com中用户可选择的文档。然而,将不会向用户返回位于该域外部的相关信息。例如,将不会返回域www.compvirus.com中的相关页,因为它不位于域www.computervirus.com中。由此,为使用户获得位于域www.computerviurs.com之外的相关数据,他必须知道包含信息的其它域的URL地址并搜索这些特定的域。可选地,用户可将关键字输入到通用搜索引擎中,它将搜索整个万维网或其它站点集合(如,内联网),并返回它所确定的涉及该关键字的站点。然而,通用搜索引擎通常会返回完全不涉及用户的特定兴趣的大量站点。例如,如果用户使用关键字“病毒”来搜索,他或她并非获得仅涉及计算机病毒的信息,而是会接收涉及生物学病毒以及计算机病毒的信息。之后,用户可滚动通过多个返回的站点,并试图确定它们是否涉及用户的兴趣。滚动通过返回的结果是极其耗时且令用户感到沮丧的,因为通用搜索引擎在执行搜索时可返回大量的站点。用户可试图通过使用布尔操作符的组合来缩小搜索范围,但是很难构造能导致返回仅包含相关信息的站点的适当的布尔搜索。此外,某些常规通用搜索引擎试图基于关键字推断用户正在搜索什么。例如,如果用户向通用搜索引擎输入项“病毒”,则搜索引擎可返回多个站点以及用于缩小搜索范围的建议。更具体地,搜索引擎可返回多个建议,比如“你希望搜索计算机病毒吗?”、“你希望搜索生物学病毒吗?”等等。对于许多搜索(尤其是对于更详细且具体的搜索),该常规方法要求选择所建议的搜索的连续层次,并且返回的站点可能仍缺少相关信息。此外,用户可能期望定位不由返回的搜索建议所包含的站点。因此,本领域中强烈需要一种提供可在域专用搜索中找到的聚焦结果,而不会牺牲涉及通过通用搜索引擎所执行的搜索的益处的搜索系统和/或方法。
技术实现思路
以下内容提出了本专利技术的简化概述,以提供本专利技术的某些方面的基本理解。本概述并非本专利技术的广泛综述。它并非旨在标识本专利技术的关键/决定性元素,或描绘本专利技术的范围。其唯一的目的是以简化的形式提出本专利技术的某些概念,作为后文的更详细描述的序言。本专利技术使用涉及特定主题、个人子集、或任何其它合适的站点分组的域和/或路径(后文总体简称为“站点”)的部分总体(subpopulation)的分组,以便于关于搜索因特网的改进。在下文中,这些站点包含可由用户检索的文档页。例如,站点的部分总体可被选中,并基于通常察看这些站点的个人的年龄组、察看这些站点的个人的政治党派、察看这些站点的个人的地理位置、察看这些站点的个人的宗教信仰等来分组。例如,相关站点的部分总体可与期望由用户搜索的特定主题有关。更具体地,年龄在10到20之间的用户可能搜索与年龄在40到50之间的用户完全不同的站点,第一政治党派的个人通常搜索与对立的政治党派的个人不同的站点。在另一示例中,站点的集合(如,因特网)概念上可被视为多个主题,其中,主题由站点集合内涉及该主题的站点来定义。当搜索涉及特定主题的信息时,在执行搜索前拥有已被发现涉及该主题的站点的列表将是有益的。本专利技术描述了一种编译可依照主题、个人年龄、个人政治党派、个人地理位置等来分组的站点列表的系统和/或方法,并且还揭示了一种向所列出的每一站点分配相关度权值的系统和/或方法。为可读性目的,下文将采用术语“主题”不仅指“主题”的常规定义,还指相关站点的其它分组(如,依照对特定年龄范围、地理位置……的相关度分组的站点)。涉及特定主题或组的相关度加权的站点的集合在下文被称为子网(subweb)。当因特网上的信息改变时、当用户偏好改变时、或为任何其它合适的原因,可修改子网以保持最新。此外,子网可被储存(如,储存在硬盘驱动器、CD、DVD……)、复制和在用户之间传输。依照本专利技术的一个方面,子网可包括涉及由子网表示的主题的站点的列表,并且子网中的每一站点将依照站点对主题的相关度来分配一偏置权值(biasedweight)。由此,例如,被发现为与由子网表示的主题高度相关的站点将被分配一比被发现为与该主题较不相关的站点更大的相关度权值。之后,通用搜索引擎可使用一个或多个主题专用子网来便于搜索的聚焦。更具体地,可选择一个或多个子网来适当地聚焦搜索,并且可将搜索查询输入到通用搜索引擎中。之后,可基于常规搜索引擎分级系统以及分配给定义子网的站点的相关度权值来确定搜索结果。例如,由搜索引擎返回的子网中存在的站点将接收对应于所分配的加权相关度分级的分级升高。依照本专利技术的另一方面,从通用搜索引擎返回的多个站点被丢弃,因为它们不由被选择来聚焦搜索的子网包含在内。本专利技术也可用于向用户呈现经分类/经群集的搜索引擎返回结果一对于给定的返回组,可将分别为特定不同子网的一部分的站点的多个子集装箱(bin)。例如,可存在涉及健康和医药的子网以及涉及计算机的子网,并可用于搜索引擎。如果向搜索引擎输入查询“病毒”,可对涉及医药的结果和涉及计算本文档来自技高网
...

【技术保护点】
一种便于搜索的系统,其特征在于,它包括:一显示组件,它通过一项目集合呈现供搜索的多个子网,所述子网分别与按相关度加权的各个项目子集相关联;以及一输入组件,它通过至少一个所述子网来接收搜索查询。

【技术特征摘要】
US 2004-1-23 60/538,838;US 2004-2-13 10/778,4981.一种便于搜索的系统,其特征在于,它包括一显示组件,它通过一项目集合呈现供搜索的多个子网,所述子网分别与按相关度加权的各个项目子集相关联;以及一输入组件,它通过至少一个所述子网来接收搜索查询。2.如权利要求1所述的系统,其特征在于,它驻留在服务器上。3.如权利要求1所述的系统,其特征在于,它驻留在客户机上。4.如权利要求1所述的系统,其特征在于,所述子网对于所述系统的用户个性化。5.如权利要求4所述的系统,其特征在于,所述系统还包括一机器学习组件,它构建关于所述用户的概况。6.如权利要求1所述的系统,其特征在于,它还包括一环境组件,它根据用户环境来呈现所述多个子网。7.如权利要求5所述的系统,其特征在于,所述概况是可传输的。8.一种爬行系统,其特征在于,它包括一爬行组件,它根据与项目相关联的预定子网来爬行站点,所述子网分别与按相关度加权的各个项目子集相关联。9.如权利要求8所述的系统,其特征在于,它还包括一实用程序组件,它执行关于所述爬行的基于概率的分析。10.如权利要求9所述的系统,其特征在于,所述实用程序组件执行关于所述爬行的成本一收益分析。11.如权利要求8所述的系统,其特征在于,所述爬行组件是爬行因特网和内联网中的至少一个的web爬行器。12.一种便于站点集合上的聚焦搜索的性能的系统,其特征在于,它包括一子网,所述子网对应于特定主题和用户特征中的至少一个,所述子网包括涉及所述主题和用户特征中的至少一个的多个站点,所述多个站点的每一个都被分配一指示所述站点与所述主题和用户特征中的至少一个的相关度的相关度权值;以及一搜索组件,它接收查询,所述搜索组件采用所述子网以基于所述查询通过所述站点集合聚焦搜索,所述搜索组件至少部分地基于所述子网和所述查询返回结果。13.如权利要求12所述的系统,其特征在于,它还包括一子网选择器,它选择一子网用于所述搜索。14.如权利要求13所述的系统,其特征在于,所述子网选择器至少部分地基于所述站点集合上的入口点来选择子网。15.如权利要求13所述的系统,其特征在于,所述子网选择器至少部分地基于所述查询、用户状态、用户环境和用户历史之一来选择子网。16.如权利要求15所述的系统,其特征在于,所述子网选择器至少部分地基于检测到的用户位置来选择子网。17.如权利要求15所述的系统,其特征在于,所述子网选择器至少部分地基于一天中的时间和一周中的日中的一个或多个来选择子网。18.如权利要求13所述的系统,其特征在于,所述子网选择器与一用户界面相关联,其中,用户通过所述用户界面选择一子网用于所述搜索。19.如权利要求12所述的系统,其特征在于,它还包括一调整组件,它便于向所述子网添加和从所述子网移除站点之一。20.如权利要求12所述的系统,其特征在于,它还包括一调整组件,它改变所述子网内所述多个站点的一个或多个所分配到的相关度权值。21.如权利要求20所述的系统,其特征在于,所述调整组件与一用户界面相关联,其中,用户通过所述用户界面改变分配给所述子网内所述多个站点的一个或多个的相关度权值。22.如权利要求20所述的系统,其特征在于,它还包括一爬行组件,它根据所述子网来爬行站点,所述爬行组件和所述调整组件共同操作以自动维护所述子网。23.如权利要求12所述的系统,其特征在于,所述子网可通过网站来访问。24.如权利要求12所述的系统,其特征在于,所述子网与一用户概况相关联,所述用户概况是可移动的。25.如权利要求12所述的系统,其特征在于,它还包括一接受涉及所述结果的反馈的组件,所述反馈用于自动维护所述子网。26.如权利要求12所述的系统,其特征在于,所述结果的顺序基于一通用搜索引擎分级系统和所述子网内所述多个站点的所分配的权值的函数。27.如权利要求12所述的系统,其特征在于,从所述结果中删除所返回的与所述子网内的站点不相匹配的至少一个结果。28.如权利要求12所述的系统,其特征在于,所述用户特征涉及年龄、位置、性别、种族划分、政治党派和宗教信仰中的一个或多个。29.如权利要求12所述的系统,其特征在于,多个子网用于所述搜索,并且依照涉及所述结果的子网对从所述搜索中获得的结果进行分类。30.如权利要求12所述的系统,其特征在于,所述站点集合是因特网和内联网的至少其中之一。31.一种执行聚焦搜索的方法,其特征在于,它包括提供一子网,所述子网由与由所述子网表示的主题和用户特征中的至少一个相关的多个站点来定义,所述站点被分配一指示每一站点与所述主题和用户特征中的至少一个的相关度的相关度权值;选择所述子网;将涉及由所述子网表示所述主题和用户特征中的至少一个的查询中继到一搜索引擎;基于所述查询在站点集合上搜索信息;至少部分地基于所述查询获取搜索结果;以及至少...

【专利技术属性】
技术研发人员:ED布里尔H陈R钱德拉西卡SH科斯顿
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1