当前位置: 首页 > 专利查询>清华大学专利>正文

一种图片拍摄区域识别及地理定位方法及装置制造方法及图纸

技术编号:18668659 阅读:42 留言:0更新日期:2018-08-14 20:44
本发明专利技术公开了一种图片拍摄区域识别及地理定位方法及装置,所述方法包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。本发明专利技术实施例通过识别待测图片的特征向量,进而计算该特征向量所属的特征向量簇,得到地理区域信息,实现简便,效率高;通过测距网络得到待测图片的地理位置,提高了识别准确度和识别速度。

A method and device for image photographing area recognition and geographic location

The invention discloses a method and a device for image shooting area recognition and geographic location, which comprises: input a picture to be measured, extract the feature vector of the picture to be measured using a picture feature extractor, obtain the first feature vector, and calculate the feature vector cluster to which the first feature vector belongs according to the first feature vector. The feature vector cluster to which the eigenvectors belong obtains the photographic region information of the image to be measured; each feature vector cluster represents a geographical region; the distance between the first feature vector and other feature vectors in the feature vector cluster to which the first feature vector belongs is calculated using the ranging network, and the geographical position of the image to be measured is obtained. The embodiment of the invention obtains geographical region information by recognizing the feature vectors of the pictures to be measured and calculating the feature vectors clusters to which the feature vectors belong, and achieves simple and high efficiency; obtains the geographical position of the pictures to be measured through the ranging network, thereby improving the recognition accuracy and speed.

【技术实现步骤摘要】
一种图片拍摄区域识别及地理定位方法及装置
本专利技术涉及定位
,尤指一种图片拍摄区域识别及地理定位方法及装置。
技术介绍
车辆智能化是保证交通安全和提高交通效率的重要途径,而智能驾驶是车辆智能化的终极目标。如何精确定位车辆是实现自动驾驶的重要内容,目前最常见的定位方式主要是通过在车辆上配备的全球定位系统(GlobalPositioningSystem,GPS)进行定位,然而全球定位系统在某些场合下例如建筑物附近、地下通道等信号极弱,因此定位精度远远不能满足定位的要求。目前已有的图片定位方法大致有以下两种。第一种是SLAM(即时定位与地图构建),通过在未知环境下创建地图,同时利用地图进行自主定位和导航;第二种是基于内容(Appearance-based)的方法,最常见的方法是使用SIFT(Scale-invariantfeaturetransform,尺度不变特征转换)特征点描述图片,然后通过这些特征点与数据库中位置已知的特征点进行匹配,确定图片的拍摄位置。然而对于以上两种图片定位方法,SLAM需要实时重建地图,时间和空间消耗较大,难以满足实时定位的需求;基于内容的方法定位,需要一个存储大量特征和地理位置的数据库,并且特征点检索耗时较大。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种图片拍摄区域识别及地理定位方法及装置,以提高识别准确度和识别速度。为了达到本专利技术目的,本专利技术提供了一种图片拍摄区域识别及地理定位方法,包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。可选地,所述输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量之前,所述方法还包括:输入已知的图片集合,训练特征提取网络,得到图片特征提取器;其中,所述图片集合中的图片包含位置信息;通过所述图片特征提取器提取所述图片集合中所有图片的特征向量,得到图片特征向量集,对所述图片特征向量集进行密度聚类,形成多个特征向量簇;使用同一个特征向量簇中的每两个特征向量组成输入对训练测距网络,用于将输入的两个特征向量映射为两个图片拍摄地点的距离。可选地,所述输入已知的图片集合,训练特征提取网络,得到图片特征提取器之前,还包括:在多个区域中每个地点在多种条件下采集多幅图片,对采集到的图片进行预处理,生成预定义尺寸大小的图片,作为已知的图片集合。可选地,所述特征提取网络为卷积神经网络,包括卷积层、池化层和全连接层;所述测距网络为神经网络,包括输入层、隐含层和输出层。可选地,每个所述特征向量簇均包含核心点,所述核心点为一特征向量,以所述核心点为中心,半径为预设值的区域中包含大于预设数量阈值的特征向量。可选地,所述计算所述第一特征向量所属的特征向量簇包括:计算所述第一特征向量与每个特征向量簇的核心点的距离,将所述第一特征向量分配到距离最近的特征向量簇中。可选地,所述使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置包括:获取所述第一特征向量与所属特征向量簇中距离最近的k个特征向量;分别以所述k个特征向量的地理位置为圆心,以与所述第一特征向量的距离为半径确定每个特征向量所覆盖的区域,将所述k个特征向量覆盖的总区域划分成边长为a的网格,并统计每个网格被覆盖的次数,将覆盖次数最多的网格作为所述待测图片的地理位置;其中,k、a为预设值。本专利技术还提供了一种图片拍摄区域识别方法,包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域。可选地,z所述输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量之前,所述方法还包括:输入已知的图片集合,训练特征提取网络,得到图片特征提取器;其中,所述图片集合中的图片包含位置信息;通过所述图片特征提取器提取所述图片集合中所有图片的特征向量,得到图片特征向量集,对所述图片特征向量集进行密度聚类,形成多个特征向量簇。本专利技术还提供了一种图片拍摄区域识别及地理定位装置,包括:特征提取模块,用于输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;区域识别模块,用于计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;地理定位模块,用于使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。本专利技术实施例包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。本专利技术实施例通过识别待测图片的特征向量,进而计算该特征向量所属的特征向量簇,得到地理区域信息,实现简便,效率高;通过测距网络得到待测图片的地理位置,提高了识别准确度和识别速度。进一步地,通过图片特征提取器预先提取所述图片集合中所有图片的特征向量,避免了重复计算,使得区域识别和地理定位的速度有了很大的提高。进一步地,通过在多个区域中每个地点在多种条件下采集多幅图片,能够在多种情况下(例如遮挡、光照变化、背景变化等)快速鲁棒的完成图片特征提取、区域识别和地理定位,而且地理定位的精度较传统的定位方法有所提高。进一步地,本专利技术实施例采用基于卷积神经网络的特征提取网络,以及采用基于神经网络的测距网络,相比复杂的物理方法,计算速度有了很大的提高。进一步地,通过测距网络得到k个近邻特征向量,并将这k个特征向量覆盖最多的区域作为待测图片的地理位置,实现简单快速,并且能够取得较好的精度。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例的图片拍摄区域识别及地理定位方法流程图;图2为本专利技术实施例的图片拍摄区域识别及地理定位装置示意图;图3为本专利技术实施例的图片拍摄区域识别流程图;图4为本专利技术实施例的图片拍摄区域识别装置示意图;图5为本专利技术应用示例的提取图片特征的卷积神经网络结构示意图;图6为本专利技术应用示例的测距网络结构示意图;图7为本专利技术应用示例的区域覆盖算法示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合本文档来自技高网...

【技术保护点】
1.一种图片拍摄区域识别及地理定位方法,包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。

【技术特征摘要】
1.一种图片拍摄区域识别及地理定位方法,包括:输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量;计算所述第一特征向量所属的特征向量簇,根据所述第一特征向量所属的特征向量簇,获知所述待测图片的拍摄区域信息;其中,每个特征向量簇代表一个地理区域;使用测距网络计算所述第一特征向量与所属特征向量簇中其他特征向量的距离,得到所述待测图片的地理位置。2.根据权利要求1所述的方法,其特征在于,所述输入待测图片,使用图片特征提取器提取所述待测图片的特征向量,得到第一特征向量之前,所述方法还包括:输入已知的图片集合,训练特征提取网络,得到图片特征提取器;其中,所述图片集合中的图片包含位置信息;通过所述图片特征提取器提取所述图片集合中所有图片的特征向量,得到图片特征向量集,对所述图片特征向量集进行密度聚类,形成多个特征向量簇;使用同一个特征向量簇中的每两个特征向量组成输入对训练测距网络,用于将输入的两个特征向量映射为两个图片拍摄地点的距离。3.根据权利要求2所述的方法,其特征在于,所述输入已知的图片集合,训练特征提取网络,得到图片特征提取器之前,还包括:在多个区域中每个地点在多种条件下采集多幅图片,对采集到的图片进行预处理,生成预定义尺寸大小的图片,作为已知的图片集合。4.根据权利要求2所述的方法,其特征在于,所述特征提取网络为卷积神经网络,包括卷积层、池化层和全连接层;所述测距网络为神经网络,包括输入层、隐含层和输出层。5.根据权利要求2所述的方法,其特征在于,每个所述特征向量簇均包含核心点,所述核心点为一特征向量,以所述核心点为中心,半径为预设值的区域中包含大于预设数量阈值的特征向量。6.根据权利要求1或2所述的方法,其特征在于,所述计算所述第一特征向量所属的特征向量簇包括:计算所述第一特征向量与每个特征向量簇的核心点的距离,将所述第一...

【专利技术属性】
技术研发人员:李春平高玺艳宋韶旭
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1