当前位置: 首页 > 专利查询>微软公司专利>正文

检测web资源的服务区域制造技术

技术编号:2915967 阅读:249 留言:0更新日期:2012-04-11 18:40
提供了用于按照地址、按照查询内容以及按照业务类别来确定web资源的服务区域的方法和系统。一种位置系统可以基于访问web资源的用户的地址来确定该web资源的服务区域。该位置系统可基于导致对网站(或其它web资源)的点进的查询项来确定该网站的服务区域。该位置系统可基于网站(或其它web资源)的业务类别以及与网站相关联的“提供者位置”来确定该网站的服务区域。

【技术实现步骤摘要】
【国外来华专利技术】检测web资源的服务区域背景诸如网页和网站等web资源具有与其相关联的地理服务区域。服务区域 表示对该web资源感兴趣的用户的地理分布。或者,服务区域可被认为是表示 了该web资源预期延伸到的地理区域。例如,列出了一个市内出售的房屋的网 页可具有包含该市的县的服务区域。作为另一示例,具有诸如数学入门等通用 信息的网页可能是来自任何位置的用户都感兴趣的,且因此具有全世界的服务 区域。已经开发了许多基于位置的web应用程序来支持移动设备和本地搜索需 求。此类基于位置的web应用程序包括导航系统、基于位置的搜索系统、本地 广告系统、地理检索系统等等。这些web应用程序通常需要检测web资源的 服务区域并将其与用户的当前位置进行匹配。例如,蜂窝电话用户可能希望找 到本地汽车特许经销商。web应用程序可以将如由蜂窝电话所指示的该用户的 当前位置与汽车经销商的服务区域进行匹配以标识哪些汽车特许经销商可能 是适当的以便建议给用户。通常,web应用程序在web资源中搜索位置信息(例如,城市名),并且 在确定该web资源是否匹配用户的位置时使用该信息。此类web应用程序的 一个困难是web资源的位置信息可能具有不同的目的且具有不同的含义。例 如,关于中国餐馆的网页可能包含地理位置"北京"和"雷蒙德"。地理位置 北京指示了该网页的主题以某种方式与中国有关,但是地理位置雷蒙德指示该 餐馆位于美国华盛顿州的雷蒙德市。如果一 web应用程序试图将用户的当前位 置(可能在北京)与该网页的位置进行匹配,则该web应用程序可能会错误地 确定服务区域是北京。在这一情况下,该web应用程序可能会向在北京的用户 建议在华盛顿州雷蒙德市的餐馆。概述提供了用于按照地址、按照査询内容以及按照业务类别来确定web资源 的服务区域的方法和系统。 一种位置系统可以基于访问web资源的用户的地址 来确定该web资源的服务区域。该位置系统可以通过分析诸如web访问日志、 点进(click-through)日志等web访问信息来标识对web资源的访问。该位置 系统从web访问信息中检索地址,然后确定与该地址相关联的地理位置。在该 位置系统标识了每一用户对该网站的访问的位置之后,它分析所标识的位置以 确定该web资源的服务区域。该位置系统可使用诸如按照大陆、国家、州和城 市来组织的位置分层结构。该位置系统可基于该位置内的用户访问该web资源 的次数,并基于分层地位于该位置内的位置内的用户访问该web资源的次数的 分布,来选择关于该服务区域的位置。该位置系统可基于导致对网站(或其它web资源)的点进的查询项来确 定该网站的服务区域。该位置系统分析导致点进的查询以标识该査询内的"位 置项"。"位置项"以某种方式标识了位置。该位置系统然后生成包含由所标 识的位置项所表示的位置的文档。该位置系统然后向所生成的文档应用内容位 置检测算法以标识该文档的"内容位置",该位置系统使用该"内容位置"来 表示服务区域。该位置系统可基于网站(或其它web资源)的业务类别以及与网站相关 联的"提供者位置"来确定该网站的服务区域。该位置系统可通过向已被训练 来按照业务类别基于其内容对网站分类的分类器提供该网站的内容来确定该 网站的类别。该位置系统为每一业务类别定义一范围,该范围指示该业务类别 内的网站的服务区域的典型大小。为确定网站的服务区域,该位置系统分析该 网站以标识提供者位置。该位置系统然后将该网站的服务区域表示为与所标识 的提供者位置相关联的范围。提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一 些概念。该概述不旨在标识所要求保护的主题的关键特征或必要特征,也不旨 在用于帮助确定所要求保护的主题的范围。附图简述附图说明图1是示出一个实施例中的位置分层结构的图示。6图2是示出一个实施例中的位置系统的组件的框图。图3是示出一个实施例中位置系统的按照IP地址标识服务区域组件的处 理的流程图。图4是示出一个实施例中位置系统的传播访问组件的处理的流程图。图5是示出一个实施例中位置系统的遍历组件的处理的流程图。 图6是示出一个实施例中位置系统的检索位置组件的处理的流程图。 图7是示出一个实施例中位置系统的按照查询内容标识服务区域组件的 处理的流程图。图8-15是示出一个实施例中内容位置组件的各组件的处理的流程图。 图9是示出一个实施例中内容位置组件的计算权重组件的处理的框图。 图10是示出一个实施例中内容位置组件的计算地理位置权重组件的处理 的流程图。图11是示出一个实施例中内容位置组件的计算功效组件的处理的流程图。图12是示出一个实施例中内容位置组件的计算子孙贡献组件的处理的流 程图。图13是示出一个实施例中内容位置组件的计算先辈贡献组件的处理的流 程图。图14是示出一个实施例中内容位置组件的计算展布组件的处理的流程图。图15是示出一个实施例中内容位置组件的遍历组件的处理的流程图。 图16是示出一个实施例中位置系统的按照业务类别标识服务区域组件的 处理的流程图。图17-18是示出一个实施例中位置系统的提供者位置组件的处理的流程图。图18是示出一个实施例中提供者位置组件的提取位置串和特征组件的处 理的流程图。详细描述提供了用于确定web资源的服务区域的方法和系统。在一个实施例中, 一种位置系统基于访问web资源(例如,网站或ftp服务器)的用户的地址(例 如,IP地址)来确定该web资源的服务区域。该位置系统可以通过分析诸如 web访问日志、点进(click-through)日志等web访问信息来标识对web资源 的访问。web访问日志可以由网站生成,并且可以对用户对该网站的每一次访 问包含一条目。每一条目可包括用户的IP地址。点进日志可由搜索引擎生成, 并且可对对于査询结果中所包括的对网站的引用的每一选择包含一条目,该选 择通常被称为"点进"。该位置系统从web访问信息中检索IP地址,然后确 定与该IP地址相关联的地理位置。有许多提供从IP地址到地理位置的映射的 商业产品可用,诸如海科萨软件研发公司(Hexasoft Development)的 IP2LOcation和科沃法公司(Quova Corp)的GeoPoint。在该位置系统标识了 对该网站的每一用户访问的位置之后,它分析所标识的位置以确定该web资源 的服务区域。该位置系统可使用诸如按照大陆、国家、州和城市来组织的位置 分层结构。该位置系统可基于该位置内的用户访问该web资源的次数,并基于 分层地位于该位置内的位置内的用户访问该web资源的次数的分布,来选择用 于该服务区域的位置。例如,如果对一网站的90%的访问是由华盛顿州的金 (King)县的用户做出的,则金县是该网站的一个可能的服务区域。然而,如 果这些访问中的95%是由西雅图市的用户做出的,则西雅图可能是更恰当的服 务区域。由于金县的用户所做出的访问中仅有5%是由西雅图外部的用户做出 的,因此服务区域西雅图而非金县更精确地描述了服务区域。然而,如果金县 中的用户所做出的访问数目均等地分布在该县内的各市之中(对城市人口差别 进行调整),则金县可以实际上是该网站的适当的服务区域。以此方式,该位 置系统可对web资源标识准确的服务区域。在一个实本文档来自技高网...

【技术保护点】
一种用于基于用户的地址来确定web资源的服务区域的计算机系统,包括: 对于对所述web资源的每一次访问包括访问所述web资源的用户的地址的访问信息存储(271); 将所述访问信息的地址映射到一位置分层结构内的位置的地址映射组件(244);以及 基于所述分层结构的一位置内的用户对所述web资源的访问次数,并基于分层地在该位置内的各位置内的用户对所述web资源的访问次数的展布,来将该位置标识为所述web资源的服务区域的标识组件(241)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:X谢L王Q张WY马
申请(专利权)人:微软公司
类型:发明
国别省市:US[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1