提取和传播地理位置信息制造技术

技术编号:20628819 阅读:30 留言:0更新日期:2019-03-20 18:21
本文中公开了一种用于将地理位置分配给网站的新用户的地理位置提取和传播系统。地理位置提取和传播系统的实现基于网站的各种网页的内容以及被分配给与网站相关联的各种用户的地理位置来向网站分配地理位置。地理位置提取和传播系统通过响应于新用户点击网站的网页而将网站的地理位置分配给新用户来进一步将网站的地理位置传播给新用户。

Extraction and dissemination of geographic location information

In this paper, a geographic location extraction and dissemination system for assigning geographic location to new users of a website is disclosed. The implementation of geographic location extraction and dissemination system allocates geographic location to the website based on the content of various web pages and the geographic location assigned to various users associated with the website. Geographic location extraction and dissemination system further disseminates the geographic location of the website to new users by assigning the geographic location of the website to new users in response to new users clicking on the website pages.

【技术实现步骤摘要】
【国外来华专利技术】提取和传播地理位置信息
技术介绍
地理位置数据库基于在线用户的互联网协议(IP)地址和/或在线用户的用户简档来确定在线用户的位置。作为示例,当用户在计算机上的搜索引擎中搜索“天气”时,搜索引擎基于其IP地址或基于其用户简档中的信息来确定用户的地理位置。搜索引擎接着显示如基于IP地址或用户简档确定的地理位置的天气预报。搜索引擎可基于IP地址使用IP地理位置数据库来确定用户的位置。然而,IP地理位置数据库的准确度基于位置而变化。此外,地理位置数据库的使用也是非常昂贵的。
技术实现思路
本文中公开了一种用于将地理位置分配给网站的新用户的地理位置提取和传播系统。地理位置提取和传播系统的实现基于网站的各种网页的内容以及被分配给与网站相关联的各种用户的地理位置来向网站分配地理位置。地理位置提取和传播系统通过响应于新用户点击网站的网页而将网站的地理位置分配给新用户来进一步将网站的地理位置传播给新用户。提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的概念的选集。本概述并不旨在标识所要求保护的主题的关键特征或必要特征,亦非旨在用于限制所要求保护的主题的范围。本文中还描述和列举了其他实现。附图说明图1解说了用于提取和传播地理位置信息的系统的示例实现。图2解说了用于通过网站点击传播用户位置的示例操作。图3解说了用于通过用户点击传播网站位置的示例操作。图4解说了用于从网页提取地理位置的示例操作。图5解说了用于基于来自具有已知位置的用户的点击来确定网页的地理位置的示例操作。图6解说了用于基于搜索引擎中的查询来确定地理位置的示例操作。图7解说了用于基于web托管IP地址确定地理位置的示例操作。图8解说了用于基于链接的网页的地理位置将地理位置分配给网页的示例操作。图9解说了用于基于子页面的地理位置将地理位置分配给网页的示例操作。图10解说了用于在具有区域和全球范围的网站之间消除歧义的示例操作。图11解说了用于消除多个候选地理位置之间的歧义的示例操作。图12解说了被用于消除多个候选地理位置之间的歧义的示例位置树。图13解说了用于基于用户动作传播位置的示例操作。图14解说了可有助于实现所描述的技术的示例系统。具体实施方式搜索引擎通常使用用户的位置来自定义页面上显示的结果。例如,对于查询“天气”,搜索引擎基于用户的位置上下文使用用户的位置来显示天气预报。确定用户位置的一种精确方式是使用诸如地理定位系统(GPS)之类的定位系统。遗憾的是,该信息不适用于大多数用户,因为用户需要使用带有GPS的设备,并且还需要授予搜索引擎对该信息的访问权。确定用户位置的另一种方法是要求用户将其自行报告。尽管这在短期内可能是准确的,但从长远来看,用户可能移动到另一位置而不更新经自行报告的位置。(贯穿本文档,术语地理位置指代要么互联网协议(IP)地址要么用户地理位置的地理位置。本文中所公开的技术涵盖IP地理位置和用户地理位置的两种情形,并且因此,IP级地理位置和用户级地理位置被互换地使用。类似地,贯穿本文档,术语“地理位置”和“位置”也被互换地使用。)为了克服上述限制,用户的位置通过咨询IP地理位置数据库来确定。IP地理位置数据库可包含IP地址及其对应的位置的范围。当用户访问搜索引擎时,地理位置数据库被用来确定它们最有可能的地理位置。地理位置数据库的粒度各不相同,但它们可能降低到街坊或街道级别的粒度。然而,此类地理位置数据库的准确度基于地理区域而显著地变化。此外,对此类地理位置数据库的访问可能是昂贵的。本文中所公开的技术提供了将地理位置分配给用户点击的若干方法。本文中所公开的一种方法描述了将具有已知位置的用户的地理信息传播给具有未知位置的用户或IP地址。该方法基于如下前提:如果具有已知位置的许多用户点击某个网站,则点击同一网站的位置未知的用户也可能与这些其他用户位于同一位置。此处所描述的另一种方法涉及提取网站次或子页面的文本中所提到的地理地址,以及将多个位置分配给网站的主页。随后,当具有未知位置的用户点击该网站的主页时,这样的用户被归到该网站的地理位置。在本申请的上下文中,关于网站或网页的术语“用户点击”、“用户的点击”、“用户进行点击”、“用户所作的点击”等意味着将用户所作的多个各种动作包括在内。例如,此类动作包括用户选择网站的通用资源定位(URL)(在浏览器中、在应用中、从移动应用等)、用户在搜索引擎中提交网站的查询、用户被重定向到网站、用户实际点击网页上的内容或链接等。因此,例如,如果用户已在浏览器上将www.seattle.com的书签保存为“西雅图(Seattle)”,并且响应于用户选择该书签,www.seattle.com的主页被加载到用户的浏览器上,用户被视为已点击了www.seattle.com的主页。类似地,如果用户提交查询并且查询结果之一是到www.seattle.com的链接,则用户选择该查询结果在本文中所公开的技术的上下文中被视为用户点击www.seattle.com。需要注意,对于被认为已点击了网页的用户,该用户不需要执行任何附加动作。因此,用户不需要已查看网页达任何特定时间量,用户不需要已向网页提供任何信息——无论是直接还是间接地经由任何cookie,用户不需要已从网页中选择任何内容、激活该网页上的任何链接等。图1解说了用于提取和传播地理位置信息的系统100的实现。具体而言,图1解说了可被实现在服务器118上的地理位置确定和传播系统120。服务器118可被通信地连接到诸如互连网之类的通信网络102。地理位置确定和传播系统120允许将地理位置分配给各种网站,诸如网站116http://www.guardian.com/。在所解说的实现中,网站116由位于伦敦地铁区域106(其位于英国104)中的web托管服务器112主控。网站116可以由第一用户108访问,其中第一用户108的位置可以基于用户108所使用的移动设备110的GPS位置来确定。第二用户(未示出)也可使用计算机114来访问网站116。地理位置确定和传播系统120包括可以通过各种计算机指令在服务器118上实现的各种模块。下面参考图3-13进一步描述这些模块的各种算法和操作。例如,地理位置确定和传播系统120包括地理位置提取模块122,该地理位置提取模块122分析网站116的一个或多个网页的内容以确定网站116的地理位置。例如,地理位置提取模块122可寻找可被用来标识网站116的地理位置是伦敦地铁区域106的文本字符串,诸如不列颠、温布利、上议院等。地理位置确定和传播系统120的用户点击分析模块124可以分析对网站116的点击,诸如由其在伦敦地铁区域106中的位置基于用户108所使用的移动设备110的GPS参数而已知的用户108所作的点击。因此,用户点击分析模块124可以将用户108的地理位置分配给网站116的地理位置。需要注意,该示例仅将一个用户108的地理位置分配给网站116的地理位置,在替代实现中,网站116的地理位置可以基于对点击网站116的大量用户的分析进行分配。用户查询分析模块126分析用户查询并点击这些查询的结果以确定网站116的地理位置。web托管IP地址分析模块128确定:因为web托管服务器112的位置在伦敦地铁区域106中,所以其将伦敦地铁区域本文档来自技高网...

【技术保护点】
1.一种用于确定用户的地理位置的系统,所述系统包括:存储器;一个或多个处理器单元;被储存在所述存储器中且由所述一个或多个处理器单元执行的地理位置提取模块,所述地理位置提取模块被配置成:基于被分配给多个用户的网页的内容和地理位置来将地理位置分配给所述网页,其中所述多个用户中的每一个与所述网页相关联,以及响应于新用户点击所述网页来将所述网页的地理位置分配给所述新用户。

【技术特征摘要】
【国外来华专利技术】1.一种用于确定用户的地理位置的系统,所述系统包括:存储器;一个或多个处理器单元;被储存在所述存储器中且由所述一个或多个处理器单元执行的地理位置提取模块,所述地理位置提取模块被配置成:基于被分配给多个用户的网页的内容和地理位置来将地理位置分配给所述网页,其中所述多个用户中的每一个与所述网页相关联,以及响应于新用户点击所述网页来将所述网页的地理位置分配给所述新用户。2.根据权利要求1所述的系统,其特征在于,所述多个用户中的每一个通过以下中的至少一者来与所述网页相关联:已查看了所述网页、已搜索了所述网页,以及已点击了所述网页的内容。3.根据权利要求2所述的系统,其特征在于,所述地理位置提取模块被进一步配置成通过将网页的内容转换为纯文本并从所述纯文本中提取表示地理位置的一个或多个字符串来基于所述网页的内容将地理位置分配给所述网页。4.根据权利要求3所述的系统,其特征在于,进一步包括子页面地理位置分配模块,所述子页面地理位置分配模块被配置成分析与所述网页相关的子页面的内容以确定表示地理位置的一个或多个字符串,基于表示地理位置的所述一个或多个字符串来确定子页面地理位置,以及将所述子页面地理位置分配给所述网页。5.根据权利要求3所述的系统,其特征在于,进一步包括web链接分析模块,所述web链接分析模块被配置成分析来自所述网页的传入和传出链接以确定所述网页的地理位置。6.根据权利要求3所述的系统,其特征在于,进一步包括用户点击分析模块,所述用户点击分析模块被储存在所述存储器中且能由所述一个或多个处理器单元执行,所述用户点击分析模块被配置成基于点击所述网页的一个或多个用户的位置来确定所述网页的位置。7.根据权利要求3所述的系统,其特征在于,进一步包括用户查询分析模块,所述用户查询分析模块被储存在所述存储器中且能由所述一个或多个处理器单元执行,所述用户查询分析模块被配置成基于提交导致点击所述网页的查询的用户的位置来确定所述网页的位置。8.一种将地理位置分配给新用户的方法,所述方法包括:基于被分配给多个用户的网页的内容和地理位置来将地理位置分配给所述网页,其中所述多个用户中的每一个与所述网页相关联;以及响应于所述新用户点击所述网页来将所述网页的地理位置分配给所述新用户。9.根据权利要求8所述的方法,其特征在于,所述多个用户中的每一个通过以下中的至少一者来与所述网页相关联:已查看了所述网页、已搜索了所述网页,以及已点击了所述网页的内容。10.根据权利要求8所述的方法,其特征在于,基于所述网页的内容将所述地理位置分配给所述网页进一步包括:将所述网页的内容转换为纯文本;以及从所述纯文本中提取表示地理位置的一个或多个字符串。11.根据权利要求10所述的方法,其特...

【专利技术属性】
技术研发人员:S·阿罗拉V·帕里克R·马O·丹B·程
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1