当前位置: 首页 > 专利查询>微软公司专利>正文

通过使用页类别信息分散搜索引擎结果制造技术

技术编号:2856809 阅读:209 留言:0更新日期:2012-04-11 18:40
一种用于按类别分散搜索引擎结果的系统和方法。搜索引擎应用程序响应于搜索请求,查询与多个电子文档相关联的文档数据的可搜索索引,以识别具有与包含在该搜索请求中的数据相匹配的文档数据的一个或多个电子文档。该搜索引擎应用程序根据包含在文档数据内的类别数据来分散所识别的电子文档,以向用户显示。

【技术实现步骤摘要】

本专利技术涉及在数据通信网络上搜索电子文档形式的有关数据的领域。更具体而言,本专利技术的实施例涉及根据在搜索中找到的电子文档的类别来分散搜索结果。(2)
技术介绍
因特网有分布在大量计算机上的大量信息,因而向用户提供大量各种主题的信息。对于诸如内联网和外联网等许多其它通信网络来说这也是真实的。尽管在网络上有大量信息可用,然而找到期望的信息可能并不简单或快捷。已开发了搜索引擎,来解决在网络上寻找期望信息的问题。一种常规搜索引擎包括爬虫软件(crawler)(也称为蜘蛛软件(spider)或蝇蛆软件(bot)),它在网络上访问电子文档、“阅读”它、随后沿着链接到网站内的其它电子文档。爬虫软件定期返回到该网站以寻找变化。索引是搜索引擎的另一个部分,它存储关于爬虫软件所找到的电子文档的信息。响应于一个或多个用户指定的搜索词,搜索引擎返回该搜索引擎判定为包括涉及用户所指定的搜索词的电子文档的网络位置(例如,统一资源定位器(URL))列表。某些搜索引擎提供信息的类别(例如新闻,web,图像,等等)以及在那些类别内的类别供用户选择,因而用户可集中在这些类别中某关注的区域。搜索引擎软件通常根据察觉到的相关性,对满足所提交的搜索请求的电子文档进行分级,并提供了依照其等级向用户显示搜索结果的手段。一种典型的相关性分级是对位于一给定网络位置的电子文档与其它电子文档相比,涉及用户指定搜索词的似然性的相对估算。例如,常规搜索引擎可基于特定搜索词在电子文档中出现的次数,及其在该电子文档中的位置(例如,通常认为出现在标题中的词比出现在电子文档结尾处的词更重要)来提供相关性分级。链接分析、锚一文本分析、网页结构分析、使用关键词列表,以及URL文本是对网页及其它超链接文档进行分级的其它已知技术。当前可用的搜索引擎通常局限于根据觉察到的等级来显示搜索结果。不幸的是,这可能向用户提供了不足的信息,因为等级最高的结果可能全部落入单个信息类别中。例如,许多产品的名称具有一个以上的意思(以行星命名汽车、以水果命名个人计算机等等)。对于用户来说,第一页搜索结果的价值可能取决于该用户是对例如土星还是同名的汽车的信息感兴趣。结果是,用户常常需要细化查询或阅读数页搜索结果,因为在第一页上显示的结果中太多涉及单个主题或类别。因而,存在对于独立于常规分级在单页搜索结果上显示涉及各种主题或类别的搜索结果的搜索引擎的需求。通过显示这一分散的搜索结果,用户能在第一页结果上查看各种结果。(3)
技术实现思路
本专利技术的实施例通过提供对数据通信网络上相关数据的改进搜索等等,克服了现有技术的一个或多个不足。通过响应于搜索请求在第一页搜索结果上向用户显示各种搜索结果,本专利技术使用户能更容易地在网络上定位相关文档。具体地,本专利技术的一个实施例按类别分散搜索结果,使得用户可在第一页搜索结果上容易地查看不同类别的搜索结果。通过按类别分散搜索结果,用户无须滚动或转到下一页搜索结果,即可查看各种类别中的结果。并且,通过在第一页搜索结果上按类别分散搜索结果,用户将能够更容易地识别相关结果,并且因而将有更愉快和高产出的搜索体验。此外,此处所描述的本专利技术的各特征比起当前可用的技术来说,较不艰巨并更易于实现,且在经济上是可行的,在商业上是实际的。根据本专利技术的一个方面,提供了一种生成搜索结果的方法。该方法包括从用户接收搜索请求。该方法还包括根据接收到的搜索请求查询可搜索的索引,来识别可能与该搜索请求相关的电子文档。该索引包含与多个电子文档相关联的数据。该文档数据指定与每个电子文档相关联的一个或多个类别。该方法包括根据与所识别的电子文档相关联的一个或多个类别对所述查询的结果进行分类。该方法还包括向用户显示所分类的结果,从而在单页上向用户显示不同类别的一个或多个所识别的电子文档。根据本专利技术的另一方面,一种计算机可读介质包括用于生成搜索结果的计算机可执行指令。搜索形式组件从用户接收搜索请求。搜索引擎组件根据接收到的搜索请求查询可搜索的索引,来识别可能与搜索请求相关联的电子文档,并用于对所述查询的结果进行分类。该索引包含与多个电子文档相关联的文档数据。该文档数据指定与每个电子文档相关联的一个或多个类别。结果根据与所识别的电子文档相关联的一个或多个类别来分类。用户界面组件向用户显示经分类的结果,从而在单页上向用户显示不同类别中的一个或多个所识别的电子文档。根据本专利技术的另一方面,提供了一种响应于经由客户机计算机从用户接收到的搜索请求来生成搜索结果的系统。该系统包括用于经由客户机从用户接收搜索请求的第一服务器。该第一服务器经由通信网络耦合至客户机。该系统还包括一索引,该索引包含与多个电子文档相关联的文档数据。该文档数据指定与每个电子文档相关联的一个或多个类别。所述第一服务器被配置成根据所接收的搜索请求查询该索引,来识别可能与该搜索请求相关的电子文档,并对所述查询的结果进行分类。结果根据与所识别的电子文档相关联的一个或多个类别来分类,用于向位于客户机处的用户显示,从而在单页上向用户显示不同类别中的一个或多个所识别的电子文档。根据本专利技术又一方面,提供了其上存储了可搜索数据结构的一个或多个计算机可读介质。第一字段用于存储表示与位于网络上的电子文档相关联的搜索引擎索引词的数据。该索引词被包括在该电子文档内。第二字段用于存储表示与该电子文档相关联的类别的数据。第三字段用于存储表示该电子文档在网络上的位置的数据。包括在第二字段中的文档数据是根据第一字段来索引的,从而将一个或多个类别与该索引词相关联,且包括在第三字段中的文档数据是根据第二字段来索引的,从而将电子文档的一个或多个位置与一个或多个类别的每一个相关联。(4)附图说明图1所示是其中可使用本专利技术的示例性网络环境的框图。图2所示是根据本专利技术的一个实施例用于填充索引的系统的组件的框图。图3所示是根据本专利技术的一个实施例的系统的组件的框图,该系统用于按照类别分散搜索结果,以供在第一页上搜索结果上显示。图4示出搜索结果页的示例性屏幕截图。图5所示是根据本专利技术的一个实施例的方法的示例性流程图,该方法用于按类别分散搜索结果,以供在第一页搜索结果上向用户显示。图6所示是其中可实现本专利技术的适当的计算系统环境的示例性实施例的框图。在全部附图中,相应参考字符指相应部分。(5)具体实施方式现参考附图,图1示出其中可使用本专利技术的示例性网络环境100。客户机102被耦合至诸如因特网(或万维网)的数据通信网络104。一个或多个服务器用诸如超文本传输协议(HTTP)等协议,经由网络104与客户机102通信,HTTP是一种在因特网上常用的,用于交换信息的协议。在示出的实施例中,前端服务器106及后端服务器108(例如web服务器或网络服务器)被耦合至网络104。客户机102使用网络104、前端服务器106及后端服务器108来访问例如存储在一个或多个服务器节点110上的网页数据。以此方式,客户机102可经由网络104,来请求对由一个或多个服务器节点110维护的网页数据的访问。本专利技术的实施例通过允许响应于用户指定的搜索请求在单页搜索结果上向用户114显示各种搜索结果,提供了对于数据通信网络上相关数据的改进搜索。具体地,本专利技术的一个实施例按类别分散搜索结果,从而用户114能容易地在第一页搜索结果上查看本文档来自技高网
...

【技术保护点】
一种生成搜索结果的方法,其特征在于,包含:    从用户接收搜索请求;    根据接收到的搜索请求查询可搜索索引,以识别可能与所述搜索请求相关的电子文档,所述索引包含与多个电子文档相关联的文档数据,所述文档数据指定与每个电子文档相关联的一个或多个类别;以及    根据与所识别的文档相关联的一个或多个类别对所述查询的结果进行分类;    向用户显示经分类的结果,从而在单页上向用户显示不同类别中的一个或多个所识别的电子文档。

【技术特征摘要】
US 2004-7-1 10/883,4601.一种生成搜索结果的方法,其特征在于,包含从用户接收搜索请求;根据接收到的搜索请求查询可搜索索引,以识别可能与所述搜索请求相关的电子文档,所述索引包含与多个电子文档相关联的文档数据,所述文档数据指定与每个电子文档相关联的一个或多个类别;以及根据与所识别的文档相关联的一个或多个类别对所述查询的结果进行分类;向用户显示经分类的结果,从而在单页上向用户显示不同类别中的一个或多个所识别的电子文档。2.如权利要求1所述的方法,其特征在于,所述文档数据包括与每个电子文档相关联的、相对于一个或多个类别等级值,所述等级值存储在所述索引内,并表示特定电子文档与特定类别的相关性,且其中,所述显示包括根据所述等级值显示每个不同类别中预定数量的的所识别的电子文档。3.如权利要求2所述的方法,其特征在于,所述显示包括根据不同类别的总数以及每个不同类别中每个所识别的电子文档的等级值的来显示经分类的结果。4.如权利要求2所述的方法,其特征在于,所述显示包括按组显示经分类的结果,每个组对应于一特定类别,且每个组基于与该特定类别中每个所识别的电子文档相关联的等级值,按降序列出该特定类别中所识别的电子文档的描述。5.如权利要求2所述的方法,其特征在于,每个电子文档包含以下的一个或多个下列网页和多媒体文件。6.如权利要求1所述的方法,其特征在于,查询可搜索索引还包括查询第三方数据源,以检索与不同类别有关的广告数据,且其中,显示经分类的结果还包括相对于所识别的电子文档的不同类别来显示所检索的广告数据。7.一种包含用于生成搜索结果的计算机可执行指令的计算机可读介质,其特征在于,包含搜索表单组件,用于从用户接收搜索请求;搜索引擎组件,用于根据所接收的搜索请求查询可搜索索引,以识别可能与搜索请求相关的电子文档,并用于对所述查询的结果进行分类,所述索引包含与多个电子文档相关联的文档数据,所述文档数据指定与每个电子文档相关联的一个或多个类别,所述结果是根据与所识别的电子文档相关联的一个或多个类别来分类的;以及用户界面组件,用于向用户显示经分类的结果,从而在单页上向用户显示不同类别内的一个或多个所识别的电子文档。8.如权利要求7所述的计算机可读介质,其特征在于,所述文档数据包括与每个电子文档相关联的、相对于一个或多个类别等级值,所述等级值存储在所述索引内,并表示特定电子文档与特定类别的相关性,且其中,所述用户界面组件被配置成根据所述等级值来显示每个不同类别中的预定数量的的所识别的电子文档。9.如权利要求8所述的计算机可读介质,其特征在于,所述用户界面组件还被配置成根据不同类别的总数以及每个不同类别中的每个所识别的电子文档的等级值来显示经分类的结果。10.如权利要求8所述的计算机可读介质,其特征在于,所述用户界面组件还被配置成按组显示经分类的结果,每个组对应于一特定类别,且每个组基于与该特定类别中每个所识别的电子文档相关联的等级值,以降序列出该特定类别中所识别的电子文档的描述。11.如权利要求7所述的计算机可读介质,其特征在于,所述搜索引擎组件还被配置成查询第三方数据源以检索与不同类别有关的广告数据,且其中,所述用户界面组件还被配置成相对于所识别的电子文档的不同类别来显示所检索的广告数据。12.一种用于响应于从用户接收到搜索请求生成搜索结果的系统,所述用户经由客户机生成所述搜索请求,所述系统包含用于经由客户机从用户接收搜索请求的第一服务器,所述第一服务器经由通信网络耦合到所述客户机;包含与多个电子文档相关联的文档数据的索引,所述文档数据指定与每个电子文...

【专利技术属性】
技术研发人员:B拉马拉斯纳姆DA沙基博GN赫兰德NA哈米尔顿
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1