标记图片地理位置信息的方法及装置制造方法及图纸

技术编号:11766422 阅读:201 留言:0更新日期:2015-07-23 18:18
本发明专利技术实施例提供了一种标记图片地理位置信息的方法及装置,所述方法包括:获取图片和与其相应的内容文本;对所述内容文本进行分析,获取至少一个候选词,所述候选词包含地理位置信息;获取与所述候选词相关联的候选兴趣点(POI)信息;根据在所述内容文本中候选词出现的特征选取所述相关联的候选POI信息之一作为所述图片的地理位置标记。本发明专利技术实施例的标记图片地理位置信息的方法及装置,能够自动地对EXIF信息中不包含GPS经纬度坐标的图片进行地理位置标记。

【技术实现步骤摘要】

本专利技术涉及网络通信
,尤其涉及一种标记图片地理位置信息的方法及装 置。
技术介绍
当前有诸如JPEG、TIFF、RAW、BMP、GIF、PNG等的图像格式。此外,可交换图像文件 (ExchangeableImageFile,EXIF)也是遵从JPEG标准的一种图像文件格式。在EXIF文 件的头信息中增加了有关拍摄信息的内容和索引图,具体可包括:拍摄时的光圈、快门、白 平衡、ISO、焦距、日期时间等各种和拍摄条件,相机品牌、型号、色彩编码、拍摄时录制的声 音以及全球定位系统(GPS)等。 当前,对于EXIF信息中不包含GPS经炜度坐标的图片尚无法自动地进行地理位置 记D
技术实现思路
本专利技术实施例的目的在于,提供一种标记图片地理位置信息的方法及装置,从而 能够自动地对EXIF信息中不包含GPS经炜度坐标的图片进行地理位置标记。 为实现上述专利技术目的,本专利技术的实施例提供了一种标记图片地理位置信息的方 法,包括:获取图片和与其相应的内容文本;对所述内容文本进行分析,获取至少一个候选 词,所述候选词包含地理位置信息;获取与所述候选词相关联的候选兴趣点(POI)信息;根 据在所述内容文本中候选词出现的特征选取所述相关联的候选POI信息之一作为所述图 片的地理位置标记。 本专利技术的实施例还提供了一种标记图片地理位置信息的装置,包括:图片和内容 文本获取模块,用于获取图片和与其相应的内容文本;候选词获取模块,用于对所述内容文 本进行分析,获取至少一个候选词,所述候选词包含地理位置信息;候选POI信息获取模 块,用于获取与所述候选词相关联的候选POI信息;图片地理位置标记模块,用于根据在所 述内容文本中候选词出现的特征选取所述相关联的候选POI信息之一作为所述图片的地 理位置标记。 本专利技术实施例提供的标记图片地理位置信息的方法及装置,通过对获取到的内 容文本进行分析得到至少一个候选词,再获取与候选词相关联的候选POI信息,将候选词 在内容文本中出现的特征作为依据,去选取相关联的候选POI信息作为图片的地理位置标 记,从而自动地对EXIF信息中不包含GPS经炜度坐标的图片进行地理位置标记。【附图说明】 图1是示出本专利技术实施例一的标记图片地理位置信息的方法的流程图; 图2是示出本专利技术实施例一的标记图片地理位置信息的方法的语句分析决策树 的示例图; 图3是示出本专利技术实施例一的标记图片地理位置信息的方法的候选词坐标数据 投影及离群点的示例图; 图4是示出本专利技术实施例一的标记图片地理位置信息的方法的待分析页面的示 例图; 图5是示出本专利技术实施例二的标记图片地理位置信息的装置的逻辑框图。【具体实施方式】 本专利技术的基本构思是,对与图片相关的内容文本进行分析得到至少一个包括地理 位置信息的候选词,再获取与候选词相关联的候选POI信息,最后根据候选词在内容文本 中出现的特征,去选取相关联的候选POI信息之一作为图片的地理位置标记,从而实现了 对EXIF信息中不包含GPS经炜度坐标的图片进行地理位置标记。 下面结合附图对本专利技术实施例一种标记图片地理位置信息的方法及装置进行详 细描述。 实施例一 图1是示出本专利技术实施例一的标记图片地理位置信息的方法的流程图。可在例如 地图服务器上执行所述方法。 参照图1,在步骤S110,获取图片和与其相应的内容文本。 具体的,以web页面为例,该web页面是一个包含图片和文本的待分析页面,可以 从所述待分析页面中获取到其中的图片,以及与该图片相应的内容文本,这里,该图片的 EXIF信息中通常不包含GPS经炜度坐标。 在步骤S120,对所述内容文本进行分析,获取至少一个候选词,所述候选词包含地 理位置信息。 根据本专利技术的示例性实施例,首先,步骤S120包括:从所述内容文本获取多个包 含地理位置信息的初选候选词。 具体的,可根据词性、黑白名单以及用于验证的词表中的至少一个从所述内容文 本获取多个包含地理位置信息的初选候选词。 根据本专利技术的示例性实施例,其次,步骤S120还包括:对所述内容文本进行语义 分析,获取所述内容文本的语境,根据所述语境和语句分析决策树遍历所述内容文本的语 句,并依据遍历结果对所述初选候选词进行过滤。 例如语句"这里不是景山公园",对该语句进行语义分析,获得的语境是对前面出 现的包含地理位置信息的候选词做了否定,且该语句是否定情感,再比如语句"天安门对面 的英雄纪念碑集合",语义分析得到的语境是天安门不是与文本相关的候选词,英雄纪念碑 是与文本相关的候选词,并且该语句是陈述情感。图2是示出本专利技术实施例一的标记图片 地理位置信息的方法的语句分析决策树的示例图。以语句"从上海站坐地铁,经过人民广 场、南京西路,从陆家嘴下车走到东方明珠塔,东方明珠塔的南面就是明珠广场了"为例。该 语句为非疑问句,语句中包含多个递进词"从"、"经过"、"南面",根据递进词关系可知,"明 珠广场"是与内容文本相关度最高的候选词。因此,利用语义分析得到的语境和图2所示的 语句分析决策树遍历内容文本中的所有语句,从而能够对初选候选词进行过滤。 根据本专利技术的示例性实施例,最后,步骤S120还包括:获取过滤后的初选候选词 的坐标数据,并根据所述坐标数据在给定地图上进行投影得到坐标点,根据所述坐标点计 算聚类范围,选取位于聚类范围内的坐标点对应的初选候选词作为选定的所述候选词。 图3是示出本专利技术实施例一的标记图片地理位置信息的方法的候选词坐标数据 投影及离群点的示例图,参照图3,图中的圆形代表聚类范围,其中,有四个坐标点位于聚类 范围内,有一个离群点位于聚类范围外,该离群点对应的候选词会被过滤掉,由于初选候选 词中有可能包含与所述内容文本相关度不高的词,因此通过上述过程可以对初选候选词做 进一步筛选,从而得到与所述内容文本相关的候选词。 在步骤S130,获取与所述候选词相关联的候选POI信息。 根据本专利技术的可选实施例,步骤S130包括:根据所述候选词从地理位置信息库提 取多个候选POI信息,通过将所述候选词分别与每个所述候选POI信息进行短文本对比,选 取与所述候选词相关联的候选POI信息。 具体的,首先,对所述候选词与所述多个候选POI信息中的任一候选POI信息,进 行如下处理: 根据所述候选词与所述候选POI信息分别计算所述候选词与所述候选POI信息之 间的编辑距离和相似度值,根据所述候选词的长度、所述编辑距离和所述相似度值计算得 到所述候选词与所述候选POI信息之间的短文本冲突值。这里,编辑距离通常是指两个字 符串之间,由一个字符串转成另一个字符串所需的最少编辑操作次数。上述短文本冲突值 的计算可通过以下公式执行: D=distance(wordl-word2), ratio=jaro(wordl,word2),【主权项】1. 一种标记图片地理位置信息的方法,其特征在于,所述方法包括: 获取图片和与其相应的内容文本; 对所述内容文本进行分析,获取至少一个候选词,所述候选词包含地理位置信息; 获取与所述候选词相关联的候选兴趣点(POI)信息; 根据在所述内容文本中候选词出现的特征选取所述相关当前第1页1 2 本文档来自技高网...
标记图片地理位置信息的方法及装置

【技术保护点】
一种标记图片地理位置信息的方法,其特征在于,所述方法包括:获取图片和与其相应的内容文本;对所述内容文本进行分析,获取至少一个候选词,所述候选词包含地理位置信息;获取与所述候选词相关联的候选兴趣点(POI)信息;根据在所述内容文本中候选词出现的特征选取所述相关联的候选POI信息之一作为所述图片的地理位置标记。

【技术特征摘要】

【专利技术属性】
技术研发人员:范磊王亦乐
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1