当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于位置搜索查询的地理编码制造技术

技术编号:2915970 阅读:252 留言:0更新日期:2012-04-11 18:40
一种用于执行位置搜索的方法,包括接收位置搜索查询、确定与位置搜索查询相对应的关键词、识别与在位置搜索查询中的关键词相对应的一个或多个文档、以及向客户端系统提供识别与一个或多个文档相对应的至少一个位置的信息。

【技术实现步骤摘要】
【国外来华专利技术】
搜索引擎提供强大的工具来定位在大型文档数据库中的文档(诸 如因特网或万维网(WWW)上的文档、和/或存储在内联网的计算机 上的文档)中的内容。响应于搜索査询使用文档的索引来定位文档, 所述搜索查询由用户提交的一个或多个词、词语、关键词和/或短语(此 后称为词语)组成。可以将在文档的索引中的文档与搜索査询中的一 个或多个词语相匹配以确定分值。基于分值,将相关文档或文档位置 的排名的列表提供给用户。搜索查询可能具有各种目的和格式。 一种种类的格式与位置搜索 相对应。传统的位置搜索通常使用诸如模板的固定的格式。现有的模 板通常是固定的或可能仅允许有限数量的变化。例如,在现有的位置 搜索查询中的词或词语可能具有预定的次序(街道名称、州、邮政编 码)和/或预定的拼写。因此,(在传统的位置搜索中)提供包括拼写 错误的宽泛的拼写、用于位置的可选的名称以及诸如在不同的国家创 建的可选的地址格式是困难的或不可能的。响应于位置搜索査询,许多现有的搜索引擎通常返回单个结果。 结合对位置搜索査询的格式灵活性的缺乏,这使得适应在位置搜索查 询和/或返回用户的结果中的不确定性或含混性是困难的。在现有的位置搜索査询中的灵活性的缺乏也通常损害搜索引擎性 能,因为通常以单一数据结构来处理现有的位置搜索查询。无法调整 数据结构并且将该数据结构分发到整个搜索引擎可以导致对位置搜索 査询的处理较慢。克服这样的瓶颈可能导致额外的搜索引擎复杂度及 费用。因此需要用于处理位置搜索査询的改进的格式和技术。另外,也 需要改进向用户报告位置搜索查询的结果。
技术实现思路
通过所公开的过程和搜索引擎的实施例减少或消除了上述不足以 及与位置搜索査询相关联的其它问题。在一些实施例中,用于执行位置搜索的方法包括接收位置搜索 査询;确定与位置搜索査询相对应的关键词;识别与位置搜索查询中 的关键词相对应的一个或多个文档;以及向客户端系统提供识别与一 个或多个文档相对应的至少一个位置的信息。确定关键词可以包括从位置搜索査询中移除标点符号和非位置词 语。关键词可以包括位置搜索查询中的一个或多个词语的一个或多个 同义词。关键词可以包括与一个或多个词语相对应的预定的縮略词。识别一个或多个文档可以包括确定与关键词相对应的典范式 (canonical expression)。识别一个或多个文档可以包括确定一个或多 个文档中的每一个的分值。各个分值可以依据关键词在多个文档中的 词频、在各个文档中的一个或多个词与一个或多个关键词之间的匹配 以及与关键词相对应的地理特征的大小。识别一个或多个文档可以独 立于关键词的次序。一个或多个文档可以被存储在包括与地理特征相对应的多个文档 的索引中。多个文档可以包括与地理特征相对应的参考坐标。提供识别与一个或多个文档相对应的至少一个位置的信息可以包 括如果在一个或多个文档的前N个排名中,相应的文档的最佳分值 大于下一个文档的次(next)最佳分值的预定倍数,则提供识别一个位 置的信息。提供操作可以包括识别出与一个或多个文档相对应的前N 个最高排名的位置,其中最高排名的文档具有在预定范围内的分值。 在一些实施例中,在前N个排名中的每一个位置包括位置标识符。在 一些实施例中,在前N个排名中的每一个位置包括指向地像的相 应的链接。提供操作可以包括提供与至少一个位置相对应的地像。地图 图像可以以至少一个位置为中心,并且可以包括小于在至少一个位置 周围的预定大小的区域。在一些实施例中,至少一个位置可以包括其 相应的文档具有所有共同的关键词的两个或多个不同的位置。地 像可以包括与两个或多个位置相对应的标记。在另一个实施例中,存储在存储器中的数据结构可以被用于执行 位置搜索查询。数据结构可以包括与地理特征相对应的多个文档或记 录(在下文中称为文档)。在多个文档中的各个文档可以包括位置信 息和补充信息。位置信息可以包括与一个或多个位置相对应的关键词 或标志(token)、与一个或多个位置相关联的一个或多个区域以及关 键词的同义词。补充信息可以包括与一个或多个位置相对应的参考坐 标。参考坐标可以包括一个或多个位置的纬度和经度。参考坐标可以 包括围绕一个或多个位置的区域。区域可以小于预定的大小。数据结构可以与超文本标记语言(HTML)相兼容。在各个文档中的位置信息可以对位置搜索查询中的词语的次序不 敏感。在另一个实施例中,图形用户界面包括响应于位置搜索查询而提 供的区域的地像。地像包括与区域中的具有与位置搜索査询 相关联的所有共同的词语的两个或多个不同的位置相对应的两个或多 个标记。在另一个实施例中,图形用户界面包括响应于位置搜索査询而提 供的区域的地像。地像以位置为中心。地像是独立于与 位置搜索查询相关联的词语的次序来提供的。上述的方法、数据结构和图形用户界面可以被包括在具有一个或 多个中央处理单元的搜索引擎系统、在一个或多个计算机中的存储器、 以及存储在存储器中并且由一个或多个中央处理器执行的一个或多个 程序中和/或由它们执行。附图说明为了更好地理解本专利技术的上述实施例以及其另外的实施例,应当 结合附图来参考下面的实施例的描述,其中在所有附图中相同的参考 数字指代对应的部分。图1是示出了位置搜索过程的实施例的流程图。图2是示出了处理位置搜索査询的实施例的框图。 图3是示出了将地理特征文档分布到多个索引上的实施例的框图。 图4是示出了地理特征文档的实施例的框图。 图5A是示出了地像的实施例的框图。 图5B是示出了地像的实施例的框图。图6是示出了响应于位置搜索查询而返回的结果的实施例的框图。图7是示出了搜索引擎系统的实施例的框图。图8是示出了搜索引擎的实施例的框图。图9是示出了客户端系统的实施例的框图。图IO是示出了地理特征文档数据结构的实施例的框图。图11描述了关于当前显示窗口的一组地理区域。图12和图13示出了如何以标准化的(normalized)角距离来测量在地球的表面上的距离和区域,并且也示出了如何将在视口 (viewport)边缘(skirt)区域中的地理特征的位置转换为比值。图14描述了用于根据视口区域的半径确定边缘区域的半径的函数的图。图15描述了用于根据相对于当前视口区域和边缘区域的地理特征 的位置来分配分值衰减因子的函数的图。具体实施例方式现将详细参考实施例,在附图中示出了实施例的示例。在下面的 详细描述中,阐述了大量的特定细节,以提供对本专利技术的全面理解。 然而,对于本领域普通技术人员明显地,没有这些特定的细节也可以 实现本专利技术。在其它的实例中,没有详细描述众所周知的方法、过程、 组件以及电路,以免不必要地模糊本专利技术的各个方面。描述了用于执行位置搜索査询并且向用户提供相应的结果的系统 和方法的实施例。该处理有时被称为地理编码(geocoding)。可以使 用耦接到诸如因特网(也被称为万维网或WWW)和/或一个或多个内 联网的网络的搜索引擎来从用户接收诸如城市中的街道地址的位置搜 索査询。对位置搜索査询进行处理以确定典范式或布尔表达式。处理 可以包括确定在各个位置搜索查询中的一个或多个关键词、从各个位 置搜索査询移除标点符号和非位置词语(诸如物品)、以及确定在各 个位置搜索査询中的一个或多个词语的一个或多个同义词。同义词可 以包括用于本文档来自技高网...

【技术保护点】
一种用于执行位置搜索的方法,包括: 接收位置搜索查询; 确定与所述位置搜索查询相对应的关键词; 识别与在所述位置搜索查询中的所述关键词相对应的一个或多个文档;以及 提供与所述一个或多个文档相对应的至少一个位置。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:弗洛里安米歇尔布龙拉梅什巴拉科利什南詹姆斯克里斯托弗诺利斯詹姆斯罗伯特穆勒泰陈拉尔斯埃尔斯特鲁普拉斯穆森
申请(专利权)人:谷歌公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1