当前位置: 首页 > 专利查询>谷歌公司专利>正文

基于位置重要性对本地搜索结果评分制造技术

技术编号:2827908 阅读:225 留言:0更新日期:2012-04-11 18:40
系统可以识别与地理区域内的某地理位置有关的第一文档和与地理区域外的某地理位置有关的第二文档。该系统还可以基于第一评分函数将第一得分赋予第一文档,以及基于第二评分函数将第二得分赋予第二文档。

【技术实现步骤摘要】
【国外来华专利技术】基于位置重要性对本地搜索结果评分
在此所述的实现通常涉及信息检索,以及更具体地说,涉及基于 位置重要性的本地搜索结果的评分。
技术介绍
万维网(Web)包含大量信息。然而,査找信息的所需部分可 能很困难。因为Web上的信息量以及对Web搜索不熟练的新用户的数 量正快速增长,使得该问题更复杂。搜索引擎尝试返回指向用户感兴趣网页的超链接。通常,搜索引 擎根据用户输入的搜索术语(称为搜索査询)来判断用户的兴趣。搜 索引擎的目标是基于这些搜索査询,向用户提供指向高质量相关结果 (例如网页)的链接。通常,搜索引擎通过将搜索査询中的词语与预 存储的网页的语料库进行匹配来实现这一点。包含用户搜索词语的网 页是命中并且作为链接返回给用户。本地搜索引擎是试图返回特定地理区域内的企业登记信息和/或相 关网页的搜索引擎。对本地搜索,用户可以输入搜索查询以及指定将 执行搜索査询附近地理区域。本地搜索引擎向用户返回相关结果,诸 如地理区域中的企业的登记信息,和/或属于该地理区域的相关网页。当对结果做评分时,本地搜索引擎可以识别该地理区域内的位置。 可以将这种识别的位置与市政府、城镇中心区或该区域的地理中心的 位置关联。这种本地搜索引擎识别所识别位置的预定半径内的所有企 业登记信息和/或网页。然后,本地搜索引擎可以识别匹配该搜索查询 的那些企业登记信息和/或网页。根据它们距所识别位置的距离,给所识别的企业登记信息和/或网页分配得分,并基于它们的得分来排名。 如果用户不住在所识别的位置附近或对所识别的位置附近的企业登记 信息和/或网页不感兴趣,搜索结果对用户无意义。其他本地搜索引擎可以按城市字母顺序排名企业登记信息和/或网 页。通常,这种排名对用户无意义。
技术实现思路
根据一个方面, 一种系统可以包括用于识别与区域内的地理位置 有关的第一文档的装置;用于识别与区域外的地理位置有关的第二文 档的装置;用于基于第一评分函数,将第一得分赋予第一文档的装置; 以及用于基于第二评分函数,将第二得分赋予第二文档的装置。根据另一方面, 一种方法可以包括接收搜索査询;识别地理区域; 识别与搜索查询有关的地理区域内的地理位置有关的文档;以及基于 与搜索查询无关和与地理区域无关的因素,将得分赋予文档。根据另一方面, 一种系统可以包括存储指令的存储器;以及处理 器,执行指令来由分配给地理区域的邮政编码集,表示地理区域,确 定与文档有关的邮政编码;确定邮政编码是否和在与地理区域有关的 邮政编码集中;当邮政编码包括在与地理区域有关的邮政编码集中时, 基于第一评分函数,评分文档,以及当邮政编码不包括在分配给地理 区域的邮政编码集中时,基于第二评分函数,评分文档。根据另一方面, 一种系统可以包括存储指令的存储器;以及处理 器,执行指令来由与地理区域有关的纬度和经度坐标集,表示地理区 域,确定与文档有关的纬度和经度坐标,确定纬度和经度坐标是否包 括在与地理区域有关的纬度和经度坐标集中,当纬度和经度坐标包括 在与地理区域有关的纬度和经度坐标集中时,基于第一评分函数,评分文档,以及当纬度和经度坐标不包括在与地理区域有关的纬度和经度坐标集中时,基于第二评分函数,评分文档。根据另一方面, 一种方法可以包括基于识别为用于文档的权威的 另一文档有关的得分、引用与文档有关的企业的文档的总数、与引用 企业的文档有关的最高得分、具有企业的评论的文档的总数,或提及 企业的信息文档数的二个或多个的组合,确定用于文档的得分;以及 使用得分来排名文档。附图说明包含在说明书并构成本说明书一部分的附图示例说明本专利技术的实施例,结合描述解释本专利技术。在图中图1A和1B示例说明与本专利技术的原理一致的概念;图2是可实现与本专利技术原理一致的系统和方法的网络的示例图;图3是根据与本专利技术原理一致的实现的图2的客户机或服务器的示例图;图4A和4B是根据与本专利技术原理一致的实现、用于执行本地搜索 的示例性处理的流程图;以及图5至11是根据与本专利技术的原理一致的实现、可执行示例性本地 搜索的图。具体实施方式本专利技术的下述详细描述参考附图。不同图中的相同参考数字可以 识别相同或类似的要素。同时,下述详细描述不限制本专利技术。与本专利技术的原理一致的本地搜索系统可以基于它们的位置重要性 来识别与地理区域相关的文档。位置重要性(location prominence)可 以指根据与文档所关联的地理区域无关的一个或多个因素、由用户执 行的搜索和/或由用户提供的搜索査询为该文档生成的得分。因此,本 地搜索系统可以呈现对用户更有意义的搜索结果。图1A和1B示例说明与本专利技术的原理一致的概念。假定用户已经 对华盛顿特区(Washington, DC)区域中的比萨饼店执行搜索。图1A 表示基于现有技术的经评分的搜索结果。根据现有技术,基于它们离 华盛顿特区中的特定位置的距离来评分搜索结果文档。图1A中的字母 标记表示与文档相关联的地理位置和它们的得分,其中,由于最接近 华盛顿特区中的特定位置,标记A评分最高。图1B表示基于与本专利技术的原理一致的技术评分的搜索结果。根据 该技术,代替根据它们离华盛顿特区中特定位置的距离,或除此之外, 还根据它们的位置重要性,来评分该搜索结果文档。图1B中的字母标 记表示与文档相关联的地理位置和它们的得分,其中,标记A已经获 得最高位置重要性得分。位置重要性可以使用这样的因素,这种因素 倾向于表达该地理区域的最佳文档,而不是那些仅基于它们离地 理区域中特定位置的距离的文档。如在此所使用的术语文档可广义地解释为包括任何机器可读 和机器可存储的工作产品。文档可以包括例如网站、文件(file)、文 件组合或一个或多个文件、具有至其他文件的嵌入链接的一个或多个 文件、新闻组帖子、博客、Web广告、电子邮件等等。在本地搜索的 情况下,常见文档是企业登记信息(business listing)或网页。网页通 常包括文本信息以及可包括嵌入信息(诸如元信息,图像,超级链接等 等)和/或嵌入指令(诸如Javascript等等)。链接,如在此所使用的术 语,广义地解释为包括不同文档之间或同一文档的不同部分之间的任 何引用。示例性网络配置图2是网络200的示例图,其中,可以实现与本专利技术原理一致的 系统和方法。网络200可以包括经网络250连接到多个服务器220-240 的多个客户机210。为简化起见,两个客户机210和三个服务器220-240 己经示例为连接到网络250。实际上,可以具有更多或更少的客户机和服务器。同时,在一些实例中,客户机可以执行服务器的功能以及服 务器可以执行客户机的功能。客户机210可以包括客户机实体。实体可以定义为设备,诸如个 人计算机、无线电话、个人数字助理(PDA)、膝上型电脑或另一类 型的计算或通信设备、在这些设备之一上运行的线程或进程,和/或可 由这些设备之一执行的对象。服务器220-240可以包括服务器实体,以 与本专利技术的原理一致的方式汇集、处理、搜索和/或维护文档。在与本专利技术的原理一致的实现中,服务器220可以包括可由客户 机210使用的本地搜索系统225。另外,服务器220可以爬取文档的语 料库(例如Web文档)、索引文档和将与文档有关的信息存储在文档 库中。服务器220可以收集有关企业的信息本文档来自技高网
...

【技术保护点】
一种方法,包括:    识别地理区域内的地理位置所关联的第一文档集;    识别所述地理区域外的地理位置所关联的第二文档集;    基于第一评分函数将第一得分赋予所述第一文档集;以及    基于第二评分函数将第二得分赋予所述第二文档集,其中,所述第一和第二评分函数不相同。

【技术特征摘要】
【国外来华专利技术】US 2005-5-27 11/138,6701.一种方法,包括识别地理区域内的地理位置所关联的第一文档集;识别所述地理区域外的地理位置所关联的第二文档集;基于第一评分函数将第一得分赋予所述第一文档集;以及基于第二评分函数将第二得分赋予所述第二文档集,其中,所述第一和第二评分函数不相同。2. 如权利要求l所述的方法,其中,所述第一评分函数基于与所 述地理区域无关的因素,以及所述第二评分函数基于与所述地理区域 有关的因素。3. 如权利要求l所述的方法,进一步包括 识别所述地理区域。4. 如权利要求3所述的方法,其中,识别所述地理区域包括 接收包括有关所述地理区域的信息的搜索査询,以及 基于所述搜索查询中的信息,识别所述地理区域。5. 如权利要求4所述的方法,其中,识别所述地理区域进一步包括由所述地理区域所关联的邮政编码集表示所述地理区域。6. 如权利要求5所述的方法,其中,识别地理区域内的地理位置所关联的第一文档集包括-确定所述第一文档集中的一个文档所关联的邮政编码,以及 确定所述邮政编码是否包括在所述地理区域所关联的邮政编码集中。7.如权利要求3所述的方法, 接收有关地图的输入,以及 在地图窗口内提供所述地图, 窗口中的地图的可见部分。其中,识别所述地理区域包括 其中,所述地理区域表示所述地图8. 如权利要求7所述的方法,其中,识别所述地理区域进一步包括识别所述地图的可见部分所关联的纬度和经度坐标集,以及 由所述纬度和经度坐标集表示所述地理区域。9. 如权利要求8所述的方法,其中,识别地理区域内的地理位置所关联的第一文档集包括确定所述第一文档集中一个文档所关联的纬度和经度坐标,以及 确定所述纬度和经度坐标是否包括在表示所述地理区域的纬度和经度坐标集中。10. 如权利要求l所述的方法,进一步包括 识别所述地理区域内的位置;确定以所识别的位置为中心、具有预定半径的搜索区;以及识别所述搜索区内的地理位置所关联的多个文档。11. 如权利要求IO所述的方法,进一步包括 接收搜索査询;以及基于所述搜索査询过滤所述多个文档。12. 如权利要求11所述的方法,其中,过滤所述多个文档包括识别那些在其标题、内容或类别串中包含所述搜索査询的词语的 多个文档的一些。13. 如权利要求12所述的方法,其中,所识别的多个文档的一些包括所述第一文档集和所述第二文档集。14. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于被识别为对所述第一文档集中一个文档具有权威性的另外文 档所关联的得分,确定所述第一文档集中该一个文档的得分。15. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于引用所述第一文档集中一个文档所关联的企业的文档的总 数,确定用于所述第一文档集中该一个文档的得分。16. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于引用所述第一文档集中一个文档所关联的企业的各文档所关 联的最高分,确定用于所述第一文档集中该一个文档的得分。17. 如权利要求1所述的方法,其中,基于第一评分函数将第一得分赋予所述第一文档集包括基于具有所述第一文档集中一个文档所关联的企业的评论的各文档的总数,确定用于所述第一文档集中该一个文档的得分。18. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括.-基于提及所述第一文档集中一个文档所关联的企业的信息文档 数,确定用于所述第一文档集中该一个文档的得分。19. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于下述两个或多个的组合来确定用于所述第一文档集中一个文档的得分被识别为对该一个文档具有权威性的另外文档所关联的得 分、引用该一个文档所关联的企业的文档的总数、引用所述企业的文 档所关联的最高分、具有所述企业的评论的文档的总数或提及所述企 业的信息文档数。20. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括-基于与所述地理区域无关的因素和与所述地理区域有关的因素的 组合,确定用于所述第一文档集中一个文档的得分。21. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于下述的至少一个确定用于所述第一文档集中一个文档的得 分与该一个文档所关联的企业的评论的数值得分有关的因素、与所 述企业的评论的多个得分的函数相关联的因素、与包含所述企业的评 论的文档的类型有关的因素、或与所述企业的评论中的语言类型有关 的因素。22. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于从与所述第一文档集中的文档的用户交互有关的用户日志导 出的因素,确定用于所述第一文档集中一个文档的得分。23. 如权利要求1所述的方法,其中,基于第一评分函数将第一 得分赋予所述第一文档集包括基于下述至少一个确定用于所述第一文档集中一个文档的得分 与该一个文档所关联的企业所关联的财务数据相关的因素,或与所述 企业已运营年数有关的因素。24. 如权利要求1所述的方法,其中,基于第二评分函数将第二得分赋予所述第二文档集包括基于所述第二文档集中一个文档所关联的第一地理位置和所述地 理区域内的第二地理位置...

【专利技术属性】
技术研发人员:布雷恩欧′克莱尔丹尼尔艾尼奥劳伦斯伊莱亚斯格林菲尔德
申请(专利权)人:谷歌公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1