当前位置: 首页 > 专利查询>谷歌公司专利>正文

自动发现受欢迎的地标制造技术

技术编号:7139160 阅读:229 留言:0更新日期:2012-04-11 18:40
在一个实施例中,本发明专利技术是一种用于填充以及更新地标图像数据库的方法,所述方法包括:根据地理接近性对地理标注图像进行地理聚类以生成一个或多个地理集群,以及根据图像相似性对一个或多个地理集群进行视觉聚类以生成一个或多个视觉集群。在另一个实施例中,本发明专利技术是一种用于从数字图像识别地标的系统,其包括以下组件:地理标注图像数据库;地标数据库;地理聚类模块;以及视觉聚类模块。在其它实施例中,本发明专利技术可以是一种增强检索地标图像的用户查询的方法,或一种用文本标记自动标注新的数字图像的方法。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及数字图像集合,更具体地涉及识别大型数字图像集合中的受欢 迎的地标(landmark)。
技术介绍
随着数字图像的使用增加、数字存储介质的容量和可用性增大以及由诸如因特网 的数字传输介质提供的互连性,数量日益增大的人群可访问愈加大型的数字图像库。来自 遍及世界的各种位置的具有广泛兴趣的人拍摄各种主题的照片,并且使那些照片例如在因 特网上可用。例如,来自世界各地的各种地标和旅游地点的数字照片可以由具有拍摄照片 的不同技能水平的人拍摄,并且被张贴(post)到web上。照片可以示出来自不同角度、以 及从相同或不同距离拍摄的相同地标。为了利用包含在这些大型数字图像库中的信息,必要的是,对所述库进行组织。例 如,在诸如Google照片或Picasa的数字图像网站,起始于高级菜单,人们可以向下钻取 (drill down)至对其而言照片可用的详细的主题收录。替选地,人们可以能够搜索具有数 字照片的一个或多个站点。例如,一些旅游信息网站下载了与已公布的受欢迎的旅游地点 列表相关联的地标的图像。然而,没有可以从这些大型集合自动提取诸如最受欢迎的旅游目的地的信息的已 知系统。随着大量新的照片被添加到这些数字图像集合,可能不可行的是,用户以会增加那 些数字图像集合的有用性的完整和一致的方式人工标记照片。因此所需要的是,可以自动 识别并标记大型数字图像集合中的受欢迎的地标的系统和方法。
技术实现思路
在一个实施例中,本专利技术是一种用于填充(populate)以及更新地标图像数据 库的方法,所述方法包括根据地理接近性对地理标注(geo-tagged)图像进行地理聚类 (geo-cluster)以生成一个或多个地理集群(geo-cluster),以及根据图像相似性对一个 或多个地理集群视觉聚类以生成一个或多个视觉集群。在另一个实施例中,本专利技术是一种用于从数字图像识别地标的系统,其包括以下 组件地理标注图像数据库;地标数据库;与所述地理标注图像数据库通信的地理聚类模 块,其中所述地理标注图像被聚组成一个或多个地理集群;以及与所述地理聚类模块通信 的视觉聚类模块,其中所述一个或多个地理集群被聚组成一个或多个视觉集群,以及其中 视觉集群数据被存储在地标数据库中。在一个进一步实施例中,本专利技术是一种增强用来检索地标图像的用户查询的方 法,包括以下阶段接收用户查询;识别用户查询中的一个或多个触发词;从地标数据库中 选择与一个或多个触发词相对应的一个或多个对应的标签(tag);以及用一个或多个对应 的标签增补用户查询,生成增补的用户查询。在又另一个实施例中,本专利技术是一种自动标注新的数字图像的方法,包括以下阶段将新的数字图像与地标图像数据库中的图像进行比较,其中地标图像数据库包括一个 或多个地标的图像的视觉集群;以及基于所述视觉集群中的至少一个用至少一个标签标注 新的数字图像。附图说明将参考本专利技术的实施例,这些实施例的示例可以在附图中图示。这些附图意在说 明而非限制。尽管在这些实施例的语境中一般地描述了本专利技术,但是应当理解的是,这并不 意在将本专利技术的范围限制在这些特定实施例。图1是根据本专利技术的一个实施例的用来填充和更新地标图像数据库的系统。图2示出了实现本专利技术的一个实施例的方法的高层级流程图。图3是示出了在一个实施例中的图2中所示的地理聚类阶段的更详细操作的流程 图。图4是示出了在一个实施例中的图3中所示的地理集群创建阶段的更详细操作的 流程图。图5是示出了在一个实施例中的图2中所示的视觉聚类阶段的更详细操作的流程 图。图6是在本专利技术的一个实施例中使用的图形用户接口。图7是根据本专利技术的一个实施例的更新地标图像数据库的方法。图8是根据本专利技术的一个实施例的使用已存储的地标信息来增强用户查询的方法。图9是根据本专利技术的一个实施例的用来自动注释包含地标的图像的方法。图10是根据本专利技术的一个实施例的示出了关于根据用户指定的选择标准检索的 地标和对应的集群的信息的示例用户界面屏。图11是根据本专利技术的一个实施例图示了用来维护集群和地标的方法的操作的流 程图。图12是根据本专利技术的一个实施例的示出了有关一个视觉集群的细节的示例用户界面屏。图13是根据本专利技术的一个实施例图示了用来维护视觉集群的方法的操作的流程 图。具体实施例方式虽然在此参考用于特定应用的说明性实施例描述了本专利技术,但是应当理解的是, 本专利技术不限于此。本领域的技术人员使用在此的教导将认识到额外修改、应用和在本专利技术 的范围以及本专利技术在其中将是大量利用的额外领域内的实施例。本专利技术包括用于自动识别并分类数字图像中的对象的方法和系统。例如,本专利技术 的实施例可以基于在因特网上可访问的数字图像集合来识别、分类以及排序最受欢迎的旅 游地标。本专利技术的方法和系统可以使得能够对最受欢迎的旅游位置的最新列表和图像集合 的有效维护,其中旅游位置的受欢迎度可以由该位置被用户张贴到因特网上的图像的数量 来估算。在图1中示出了根据本专利技术的一个实施例的受欢迎的地标识别系统100。处理模 块101包括地理聚类模块102和视觉聚类模块103。视觉聚类模块103还可以包括受欢迎 度模块104。在下面描述了模块102-104的处理功能关于图3-4描述了地理聚类模块102 ; 关于图5描述了视觉聚类模块。可以在软件、硬件或以上的组合中实现模块102-104的处理 功能。例如,可以将模块102-104完全实现为软件模块,或可以使用诸如现场可编程门阵列 (FPGA)的硬件来实现地理聚类模块102的一些功能。本领域技术人员将理解的是,处理模 块101可以包括帮助本专利技术的功能的额外组件和模块。例如,处理模块101可以包括一个 或多个处理器、存储器、存储设备、用于连接到包括图形用户接口 130、地理标注图像库110 和地标数据库系统120的外部设备的模块。地标数据库系统120可以包括地标数据库121和相关联的索引122。地标数据库 系统120可以与模块101共同位于同一处理平台或可以分立定位。地标数据库121可以包 括系统100所识别的地标的集合。地标数据库121中的为每一个地标存储的信息可以包括 地标的图像或图像列表、图像和特征模板以及来自图像的包括地理坐标、时间和用户信息 的元数据。地标数据库121还可以包含处理模块101中的处理所需的视觉聚类和地理聚类 数据。索引122可以包括按照例如而非限制受欢迎度、地理区域、时间或如感兴趣的主题的 其它用户定义的标准中的一个或多个的顺序将地标安排在地标数据库121中的索引。链路 141可以是包括例如而非限制,外围组件互连(PCI)总线、IEEE 1394火线接口、以太网接口 或IEEE 802. 11接口的互连机制中的任何一个或组合。用户接口 130允许用户或其它外部实体与处理系统101、地标数据库系统120以及 地理标注图像库110交互。可以使用包括例如而非限制,PCI总线、IEEE 1394火线接口、以 太网接口或IEEE 802. 11接口的互连机制中的任何一个或组合将用户接口 130连接到系统 100的其它实体。可以将图形用户接口、web接口以及应用编程接口中的一个或多个包括在 用户接口 130中。地理标注图像库110可以包括跨一个或多个网络分布的一个或多个数字地理标 注图像本文档来自技高网...

【技术保护点】
一种用于填充以及更新地标图像数据库的方法,包括:(a)根据地理接近性对地理标注图像进行地理聚类以生成一个或多个地理集群;以及(b)根据图像相似性对所述一个或多个地理集群进行视觉聚类以生成一个或多个视觉集群。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:费尔南多·A·布鲁切尔
申请(专利权)人:谷歌公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1