当前位置: 首页 > 专利查询>谷歌公司专利>正文

根据地理关联索引文档制造技术

技术编号:2833490 阅读:178 留言:0更新日期:2012-04-11 18:40
局部搜索引擎通过对每一文档,索引共同定义总的地理区域的多个位置标识符,有效地索引与地理区域有关的文档。当创建该索引时,搜索引擎可以确定在与文档有关的地理区域周围的地理区域的集合以及将地理区域的集合的坐标与文档索引关联。

【技术实现步骤摘要】
【国外来华专利技术】根据地理关联索引文档
在此所述的实现涉及搜索引擎,以及更具体地说,涉及局部搜索 引擎能有效地检索与地理区域相关的文档的技术。
技术介绍
万维网(Web)包含大量信息。然而,定位信息的所需部分 是困难的。由于环球网上的信息量以及环球网搜索不熟练的新用户的 数量日益快速增加,使这一问题更加复杂。搜索引擎试图返回指向用户感兴趣网页的超链接。通常,搜索引 擎根据用户输入的搜索词语(称为搜索查询)来确定用户的兴趣。搜 索引擎的目标是基于搜索查询向用户提供高质量的相关结果(例如, 网页)。通常,搜索査询通过将搜索査询中的词语与预先存储的网页 语料库相匹配来实现这一目标。包含用户搜索词语的网页是命中页 并作为链接返回给用户。为了提高返回给用户的网页的相关性和质量,搜索引擎可能尝试 排序命中页的列表,使得最相关和/或最高质量的页位于返回给用户的 命中页列表的最上部。例如,搜索引擎可以对每一命中页指定等级或 分值,其中,将分值设计成对应于网页的相关性或重要性。局部搜索引擎是尝试返回在指定地理区域内的相关网页和/或企 业登记信息的搜索引擎。对局部搜索,用户可以输入搜索查询并指定 将执行搜索査询的地理区域。局部搜索引擎可以向用户返回相关结果, 诸如属于该该地理区域的相关网页或该地理区域中的企业登记信息。 对于一些局部搜索引擎,感兴趣的局部地理区域是由离起始位置 特定距离或半径范围内地区域,诸如离邮政编码区或街道地址几英里 限定的区域。理想地,局部搜索引擎应当有效地定位和返回在期望地 理区域中的相关结果。
技术实现思路
本专利技术的一个方面是针对索引文档的方法。该方法包括确定与文 档相关的位置,确定环绕与该文档有关的该位置的位置集,以及索引该文档使得包括对该位置和位置集的引用(reference)。本专利技术的另一方面针对索引文档的另一方法。该方法包括识别与 第一地理区域有关的文档,确定环绕第一地理区域的地理区域集,将 对第一地理区域和地理区域集的引用与文档关联,以及利用相关的引 用索引该文档。本专利技术的另一方面针对执行搜索的方法。该方法包括接收与地理 区域有关的搜索查询,确定与地理区域有关的位置标识符,以及基于 搜索查询和位置标识符与文档索引的比较,执行与该搜索査询有关的 文档的搜索。附图说明包含并构成该说明书的一部分的附图示例说明本专利技术的实施例, 并结合该说明书说明本专利技术。在图中图1是可以实现符合本专利技术的原理的系统和方法的网络的示例图;图2是图1所示的客户机或服务器的示例图; 图3A和3B是示例说明分层三角网格(HTM)的图; 图4是示例说明符合用于索引具有地理相关性的文档的本专利技术的 方面的示例性操作的流程图;图5是示例说明图4所示的操作的图6A和6B示例说明具有地理相关性的示例性文档。图7是示例说明具有地理相关性的另一示例性文档的图。图8是示例说明根据符合本专利技术各方面的实现,在处理局部搜索査询中的搜索引擎的示例性操作的流程图;图9是示例说明在根据符合本专利技术各方面的另一实现,处理局部搜索查询中的搜索引擎的示例性操作的流程图;图10是用来示例说明图9所示的动作的示例性HTM网格(grid)的图;以及图11和12是可以呈现给用户的局部搜索用户界面的示例图。具体实施方式本专利技术的下文的详细描述参考附图。详细描述不限制本专利技术。 概述局部搜索引擎可以对局部搜索查询生成限制到期望地理区域的结 果。例如可以通过距指定点或地区的某一距离(例如20英里)限定地 理区域。通过基于文档的内容以及基于多个位置标识符来索引地理相 关文档,从而有效地生成搜索结果。在一个实现中,位置标识符定义 规则间隔的地理区域,并且索引文档以使得选择对每一文档索引的多 个位置标识符,从而定义与该文档有关的区域周围的预定范围。这种 文档索引技术允许按地理区域有效地搜索。示例性网络概述图1是可以实现与本专利技术的原理一致的系统和方法的网络100的 示例图。网络100可以包括经网络140,连接到服务器120的客户机 110。网络140可以包括局域网(LAN)、广域网(WAN)、电话网络, 诸如公用交换电话网(PSTN)、内联网、互联网或网络的组合。为简 化起见,将两个客户机IIO和一个服务器120示例为连接到网络140。 实际上,可以有更多客户机和/或服务器。同时,在一些实例中,客户 机可以执行服务器的功能以及服务器可以执行客户机的功能。客户机U0可以包括设备,诸如无线电话、个人计算机、个人数字助理(PDA)、膝上型计算机或另一类型的计算或通信设备、在这 些设备的一个上运行的线程或进程和/或可由这些设备的一个执行的对 象。服务器120可以包括处理、搜索和/或维护文档的服务器设备。客 户机IIO和服务器120可以经有线、无线或光学连接,连接到网络140。服务器120可以包括可由客户机110使用的搜索引擎125。搜索 引擎125可以是基于査询的文档搜索引擎。可以将搜索引擎125特别 地设计成返回地理区域局部的结果。搜索引擎125可以基于在数据库 135中存储的文档来响应用户搜索査询。在数据库135中存储的文档通 常可以包括确定为与特定地理区域有关的文档。这些文档可以包括例 如位于特定地址的企业的企业登记信息或以某些方式与地理区域有关 的Web文档(例如,提供局部餐馆评论的Web文档)。文档(document),作为在此所使用的词语,广义地解释为包括 任何机器可读和机器可存储工作产品。文档可以是电子邮件、企业登 记信息、Web站点、文件、文件组合、嵌有至其他文件的链接的一个 或多个文件、新闻组帖子等等。在互联网的环境下,常见文档是网页。 网页通常包括内容以及可以包括嵌入信息(诸如元信息、超级链接等 等)和/或嵌入指令(诸如Javascript等等)。示例性客户机/服务器体系结构图2是根据与本专利技术的原理一致的实现、称为计算设备200的客 户机100或服务器120的示例图。计算设备200可以包括总线210、处 理器220、主存储器230、只读存储器(ROM) 240、存储设备250、 输入设备260、输出设备270和通信接口 280。总线210可以包括允许 计算设备200的部件间的通信的路径。处理器220可以包括可以解释和执行指令的任何类型的传统处理器、微处理器或处理逻辑。主存储器230可以包括随机存取存储器(RAM)或存储用于由处理器220执行的信息和指令的另一类型的动 态存储设备。ROM 240可以包括传统的ROM设备或存储由处理器220 使用的静态信息和指令的另一类型的静态存储设备。存储设备250可 以包括磁性和/或光记录介质及其相应的驱动器。输入设备260可以包括允许用户将信息输入到计算设备200的传 统机制,诸如键盘、鼠标、输入笔、语音识别和/或生物识别机制等等。 输出设备270可以包括将信息输出给用户的传统的机制,包括显示器、 打印机、扬声器等等。通信接口 280可以包括允许计算设备200与其 他设备和/或系统通信的任何收发信机型机制。例如,通信接口 280可 以包括用于经网络,诸如网络140与另一设备或系统通信的机制。搜索引擎125可以存储在计算机可读介质,诸如存储器230中。 计算机可读介质可以定义为一个或多个物理或逻辑存储器设备和/或载 波。定义搜索引擎125的软件指本文档来自技高网...

【技术保护点】
一种用于索引文档的方法,包括:    确定与该文档相关联的位置;    确定在与该文档相关联的该位置周围的多个位置;以及    索引该文档使得包括对所述位置和该位置周围的所述多个位置的引用。

【技术特征摘要】
【国外来华专利技术】US 2004-12-30 11/024,7901.一种用于索引文档的方法,包括确定与该文档相关联的位置;确定在与该文档相关联的该位置周围的多个位置;以及索引该文档使得包括对所述位置和该位置周围的所述多个位置的引用。2. 如权利要求l所述的方法,其中,通过定义网格中地理区域的 位置标识符来指定对所述位置和该位置周围的所述多个位置的引用。3. 如权利要求2所述的方法, 层三角网格中的节点的标签。4. 如权利要求l所述的方法,5. 如权利要求l所述的方法, 文档。其中,所述位置标识符包括用于分其中,所述文档是企业登记信息。 其中,所述文档是地理相关性网页6. 如权利要求l所述的方法,其中,在所述位置周围的所述多个 位置包括在与该文档相关联的该位置的预定距离范围内的地理区域。7. 如权利要求l所述的方法,其中,通过位置标识符引用在该位 置周围的所述多个位置,该方法进一步包括-确定多个位置标识符集,每一所述集与不同大小的地理区域相关联。8. —种搜索引擎,包括用于存储文档索引的装置;用于确定与文档相关联的位置的装置; 用于确定在与该文档相关联的该位置周围的多个位置的装置;以及用于索引该文档以使得在该文档索引中包括对所述位置和所述多 个位置的引用的装置。9. 一种用于索引文档的方法,包括 识别具有与第一地理区域的相关性的文档; 确定在该第一地理区域周围的地理区域集;以及 将对所述第一地理区域和所述地理区域集的引用与该文档相关联;以及利用所述相关联的引用来索引文档。10. 如权利要求9所述的方法,进一步包括 把对所述第一地理区域和所述地理区域集的引用确定为对应于分层三角网格中的节点的位置标识符。11. 如权利要求9所述的方法,进一步包括 把在该第一地理区域周围的地理区域集确定为该第一地理区域的预定范围内的所述地理区域集。12. 如权利要求ll所述的方法,进一步包括把在该第一地理区域周围的第二地理区域集确定为该第一地理区 域的第二预定范围内的所述地理...

【专利技术属性】
技术研发人员:丹尼尔艾尼奥
申请(专利权)人:谷歌公司
类型:发明
国别省市:US[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1