当前位置: 首页 > 专利查询>谷歌公司专利>正文

用于位置搜索查询的地理编码制造技术

技术编号:7122964 阅读:306 留言:0更新日期:2012-04-11 18:40
本申请涉及用于位置搜索查询的地理编码。一种用于执行位置搜索的方法,包括接收位置搜索查询、确定与位置搜索查询相对应的关键词、识别与在位置搜索查询中的关键词相对应的一个或多个文档、以及向客户端系统提供识别与一个或多个文档相对应的至少一个位置的信息。

【技术实现步骤摘要】

搜索引擎提供强大的工具来定位在大型文档数据库中的文档(诸如因特网或万维网(WWW)上的文档、和/或存储在内联网的计算机上的文档)中的内容。响应于搜索查询使用文档的索引来定位文档,所述搜索查询由用户提交的一个或多个词、词语、关键词和 /或短语(此后称为词语)组成。可以将在文档的索引中的文档与搜索查询中的一个或多个词语相匹配以确定分值。基于分值,将相关文档或文档位置的排名的列表提供给用户。搜索查询可能具有各种目的和格式。一种种类的格式与位置搜索相对应。传统的位置搜索通常使用诸如模板的固定的格式。现有的模板通常是固定的或可能仅允许有限数量的变化。例如,在现有的位置搜索查询中的词或词语可能具有预定的次序(街道名称、 州、邮政编码)和/或预定的拼写。因此,(在传统的位置搜索中)提供包括拼写错误的宽泛的拼写、用于位置的可选的名称以及诸如在不同的国家创建的可选的地址格式是困难的或不可能的。响应于位置搜索查询,许多现有的搜索引擎通常返回单个结果。结合对位置搜索查询的格式灵活性的缺乏,这使得适应在位置搜索查询和/或返回用户的结果中的不确定性或含混性是困难的。在现有的位置搜索查询中的灵活性的缺乏也通常损害搜索引擎性能,因为通常以单一数据结构来处理现有的位置搜索查询。无法调整数据结构并且将该数据结构分发到整个搜索引擎可以导致对位置搜索查询的处理较慢。克服这样的瓶颈可能导致额外的搜索引擎复杂度及费用。因此需要用于处理位置搜索查询的改进的格式和技术。另外,也需要改进向用户报告位置搜索查询的结果。
技术实现思路
通过所公开的过程和搜索引擎的实施例减少或消除了上述不足以及与位置搜索查询相关联的其它问题。在一些实施例中,用于执行位置搜索的方法包括接收位置搜索查询;确定与位置搜索查询相对应的关键词;识别与位置搜索查询中的关键词相对应的一个或多个文档; 以及向客户端系统提供识别与一个或多个文档相对应的至少一个位置的信息。确定关键词可以包括从位置搜索查询中移除标点符号和非位置词语。关键词可以包括位置搜索查询中的一个或多个词语的一个或多个同义词。关键词可以包括与一个或多个词语相对应的预定的缩略词。识别一个或多个文档可以包括确定与关键词相对应的典范式(canonical expression) 0识别一个或多个文档可以包括确定一个或多个文档中的每一个的分值。各个分值可以依据关键词在多个文档中的词频、在各个文档中的一个或多个词与一个或多个关键词之间的匹配以及与关键词相对应的地理特征的大小。识别一个或多个文档可以独立于关键词的次序。一个或多个文档可以被存储在包括与地理特征相对应的多个文档的索引中。多个文档可以包括与地理特征相对应的参考坐标。提供识别与一个或多个文档相对应的至少一个位置的信息可以包括如果在一个或多个文档的前N个排名中,相应的文档的最佳分值大于下一个文档的次(next)最佳分值的预定倍数,则提供识别一个位置的信息。提供操作可以包括识别出与一个或多个文档相对应的前N个最高排名的位置,其中最高排名的文档具有在预定范围内的分值。在一些实施例中,在前N个排名中的每一个位置包括位置标识符。在一些实施例中,在前N个排名中的每一个位置包括指向地像的相应的链接。提供操作可以包括提供与至少一个位置相对应的地像。地像可以以至少一个位置为中心,并且可以包括小于在至少一个位置周围的预定大小的区域。在一些实施例中,至少一个位置可以包括其相应的文档具有所有共同的关键词的两个或多个不同的位置。地像可以包括与两个或多个位置相对应的标记。在另一个实施例中,存储在存储器中的数据结构可以被用于执行位置搜索查询。 数据结构可以包括与地理特征相对应的多个文档或记录(在下文中称为文档)。在多个文档中的各个文档可以包括位置信息和补充信息。位置信息可以包括与一个或多个位置相对应的关键词或标志(token)、与一个或多个位置相关联的一个或多个区域以及关键词的同义词。补充信息可以包括与一个或多个位置相对应的参考坐标。参考坐标可以包括一个或多个位置的纬度和经度。参考坐标可以包括围绕一个或多个位置的区域。区域可以小于预定的大小。数据结构可以与超文本标记语言(HTML)相兼容。在各个文档中的位置信息可以对位置搜索查询中的词语的次序不敏感。在另一个实施例中,图形用户界面包括响应于位置搜索查询而提供的区域的地像。地像包括与区域中的具有与位置搜索查询相关联的所有共同的词语的两个或多个不同的位置相对应的两个或多个标记。在另一个实施例中,图形用户界面包括响应于位置搜索查询而提供的区域的地像。地像以位置为中心。地像是独立于与位置搜索查询相关联的词语的次序来提供的。上述的方法、数据结构和图形用户界面可以被包括在具有一个或多个中央处理单元的搜索引擎系统、在一个或多个计算机中的存储器、以及存储在存储器中并且由一个或多个中央处理器执行的一个或多个程序中和/或由它们执行。附图说明为了更好地理解本专利技术的上述实施例以及其另外的实施例,应当结合附图来参考下面的实施例的描述,其中在所有附图中相同的参考数字指代对应的部分。图1是示出了位置搜索过程的实施例的流程图。图2是示出了处理位置搜索查询的实施例的框图。图3是示出了将地理特征文档分布到多个索引上的实施例的框图。图4是示出了地理特征文档的实施例的框图。图5A是示出了地像的实施例的框图。图5B是示出了地像的实施例的框图。图6是示出了响应于位置搜索查询而返回的结果的实施例的框图。图7是示出了搜索引擎系统的实施例的框图。图8是示出了搜索引擎的实施例的框图。图9是示出了客户端系统的实施例的框图。图10是示出了地理特征文档数据结构的实施例的框图。图11描述了关于当前显示窗口的一组地理区域。图12和图13示出了如何以标准化的(normalized)角距离来测量在地球的表面上的距离和区域,并且也示出了如何将在视口(viewport)边缘(skirt)区域中的地理特征的位置转换为比值。图14描述了用于根据视口区域的半径确定边缘区域的半径的函数的图。图15描述了用于根据相对于当前视口区域和边缘区域的地理特征的位置来分配分值衰减因子的函数的图。具体实施例方式现将详细参考实施例,在附图中示出了实施例的示例。在下面的详细描述中,阐述了大量的特定细节,以提供对本专利技术的全面理解。然而,对于本领域普通技术人员明显地, 没有这些特定的细节也可以实现本专利技术。在其它的实例中,没有详细描述众所周知的方法、 过程、组件以及电路,以免不必要地模糊本专利技术的各个方面。描述了用于执行位置搜索查询并且向用户提供相应的结果的系统和方法的实施例。该处理有时被称为地理编码(geocoding)。可以使用耦接到诸如因特网(也被称为万维网或WWW)和/或一个或多个内联网的网络的搜索引擎来从用户接收诸如城市中的街道地址的位置搜索查询。对位置搜索查询进行处理以确定典范式或布尔表达式。处理可以包括确定在各个位置搜索查询中的一个或多个关键词、从各个位置搜索查询移除标点符号和非位置词语(诸如物品)、以及确定在各个位置搜索查询中的一个或多个词语的一个或多个同义词。同义词可以包括用于在各个位置搜索查询中的一个或多个词语的预定的缩略词和/或在各个位置搜索查询中的一个或多个词语的预定的错拼词。典范式可以独立于关键词的次序,即对关键词本文档来自技高网...

【技术保护点】
与所识别的地理特征文档相对应的所述地理特征到客户端系统的地理视口区域的接近性;以及根据所述已排名的地理特征文档提供结果,所述结果识别与所述已排名的地理特征文档的至少一个相对应的至少一个地理特征。1.一种用于执行位置搜索的方法,包括:接收位置搜索查询;识别满足所述位置搜索查询的地理特征文档,其中所述地理特征文档中的每一个与地理特征相对应;以及根据分值对所识别的地理特征文档进行排名以产生一组已排名的地理特征文档,所述分值至少部分地基于

【技术特征摘要】
...

【专利技术属性】
技术研发人员:弗洛里安·米歇尔·布龙拉梅什·巴拉科利什南詹姆斯·克里斯托弗·诺利斯詹姆斯·罗伯特·穆勒泰·陈拉尔斯·埃尔斯特鲁普·拉斯穆森
申请(专利权)人:谷歌公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1