一种基于图像特征和GPS定位的城市建筑物识别方法技术

技术编号:21799862 阅读:20 留言:0更新日期:2019-08-07 10:41
一种基于图像特征和GPS定位的城市建筑物识别方法,首先,智能设备系统开始初始化,图像预处理模块处理图像,并将位置信息储存至数据库,同时将图像信息传递至建筑物特征提取模块,对图像进行纹理和颜色特征提取并融合,通过计算机训练降维与分类模块中的极限学习机,然后,通过获取位置信息模块与降维与分类模块识别目标城市建筑物;使用户在导航结束后,能快速找到目标建筑物,解决了导航软件导航结束后,用户从小范围的建筑物群进入目标建筑物这一段距离的导航问题,提高办事效率,有效解决了现代化大都市出行难的问题。

A Method of Urban Building Recognition Based on Image Feature and GPS Positioning

【技术实现步骤摘要】
一种基于图像特征和GPS定位的城市建筑物识别方法
本专利技术涉及计算机视觉识别
,特别是涉及一种基于图像特征和GPS定位的城市建筑物识别方法。
技术介绍
用户想要到达陌生的目的地,其采用传统的导航方法就可以到达。但在城市里,用户到达目标建筑物附近后,导航就结束了,在小范围的建筑物群内,用户需要再次寻找目标建筑物,在高楼林立的市区和建筑物没有明显标志的情况下,用户较难辨别自己的目标建筑物,这种情况下,用户需要浪费很长的时间和精力去寻找目标建筑物,因此,会严重影响办事效率,有时由于时间超时,甚至带来很大的经济损失。目前,还没有一种比较简洁的方法,能够指引用户方便、快捷到达目标建筑物。
技术实现思路
本专利技术针对导航结束后,在小范围的建筑物群内,用户无法方便、快捷寻找到目标建筑物问题,构思了使用移动设备拍摄建筑物图像提取纹理和颜色特征,使用自编码器降维和极限学习机,识别出建筑物的名称,再通过GPS定位信息对识别结果进行确认识别过程,创造性提出了一种基于图像特征和GPS定位的城市建筑物识别方法,使用户在导航结束后,能快速找到目标建筑物,解决了导航软件导航结束后,用户从小范围的建筑物群进入目标建筑物这一段距离的导航问题。本专利技术采用的技术方案是:一种基于图像特征和GPS定位的城市建筑物识别方法,其特征是,它包括以下步骤:(1)系统参数初始化的过程:(1.1)使用智能设备获取城市建筑物中各建筑物的彩色图像,并将其导入智能设备中城市建筑物识别系统,对每一张输入该系统的彩色图像,按照w×h的固定尺寸进行图像缩放,缩放过程为:(1.1.1)城市建筑物识别系统接收到一个尺寸为m×n的彩色图像;(1.1.2)将每张图像的列缩小m/w倍,行缩小n/h倍,生成的w×h的彩色图像,将其传递给数据库模块中的数据库存储;(1.2)使用具有GPS功能的智能设备进行相应建筑物地理位置搜集,其经度和维度分别用度、分、秒的形式进行保存,与步骤(1.1)中采集的对应城市建筑物图像相结合,共同定义建筑物名称,将其放到数据库中存储,并传递给建筑物特征提取模块;(1.3)在建筑物特征提取模块中,将建筑物彩色样本图像统一尺寸为160×120,分别进行以下处理:(1.3.1)对每一张样本图像P,提取该图像P所含有的纹理特征,其过程为:(1.3.1.1)在存储系统中的彩色图像P水平和垂直方向上,分别使用[-1,0,1]和[-1,0,1]T两个梯度算子进行卷积操作,得到图像P在R、G、B三个通道上的水平和垂直方向上的梯度分量,用gradscalx表示R、G、B三个通道上的水平梯度分量,用gradscaly表示R、G、B三个通道上的垂直梯度分量;(1.3.1.2)根据彩色图像P的R、G、B三个通道水平和垂直梯度值,计算图像P中每个像素点(x,y)处梯度的幅值和方向,计算过程如下:由于输入图像P是三维彩色图像,因此需要对图像P的R、G、B三个通道共同计算,分别得到R、G、B三个通道上的梯度值,即一个三维矩阵,用maxgrad表示,然后从maxgrad中选出每一点上的R、G、B三个分量中梯度幅度最大的幅度值,组成的一个梯度值矩阵,maxgrad的计算方式如下:通过从maxgrad中选出每一点上的R、G、B三个分量中梯度幅度最大的幅度值,得到了一个彩色图像的梯度值矩阵,该矩阵是一个二维矩阵,矩阵中的每个点代表图像中该点的梯度幅值,梯度的方向需要通过二维的水平和垂直方向上的梯度分量计算得到,因此首先对三维水平和垂直梯度分量进行R、G、B三通道最大值筛选,计算出二维的水平梯度分量Gx和垂直梯度分量Gy,计算过程需要一个单层循环完成:forn=1,2,3%每个点的RGB分量分别求梯度并取三者最大的值end通过上述操作得到的图像P的二维水平方向上的梯度分量Gx和垂直方向上的梯度分量Gy,计算出P中每个像素处的梯度角度θ:(1.3.1.3)根据图像P的长度和宽度,设置均匀分布于整个图像P的多个采样点,在每个采样点p处都会统计一个关于全局的梯度直方图特征向量,近邻敏感梯度方向直方图特征向量Hp计算如下:其中,m和n分别是图像的宽度和高度,通过q对图像P中的所有像素点进行遍历,α是敏感参数,θq表示像素点q所在位置的梯度角,Vb(θq,b)的计算公式如下:其中,|Gq|代表像素点q处计算的梯度的模,通过判断像素点q处的梯度角是否落在binb中,如果落在binb中,则将像素点q处的梯度的模累乘以α后累加到binb上,公式采用敏感参数α来控制像素q对Hp贡献度的大小,根据像素点与采样点之间距离的远近设置相应的权值,距离越远,对该点的贡献越小,权值也越小,通过这种方式,对每个采样点提取近邻敏感梯度方向直方图纹理特征,将多个采样点出的近邻敏感梯度方向直方图进行组合,共同组成图像P的纹理特征向量。(1.3.2)对每一张样本图像P,提取该图像P所含有的颜色特征,其过程为:(1.3.2.1)将彩色图像P进行颜色量化,量化到更少的颜色空间,首先,将像素点q(r,g,b)中的R、G、B三个分量的像素值转化成8位二进制数,然后根据三个分量设置的量化数量R_BITS、G_BITS、B_BITS进行右移,右移的二进制个数分别为(8-R_BITS、8-G_BITS、8-B_BITS),量化颜色的过程如下:R1=bitshift(R,-(8-R_BITS));G1=bitshift(G,-(8-G_BITS));B1=bitshift(B,-(8-B_BITS));I=R1+G1*2R_BITs+B1*2R_BITS*2G_BITS;使用(R1,G1,B1)表示转换后的十进制数,此时(r,g,b)像素点的三个分量取值范围从0~255的256个颜色,量化成新像素点(r1,g1,b1)的三个分量取值范围为0~2R1-1的2R1个颜色;然后通过公式I=R1+G1*2R_BITS+B1*2R——ITS*2C_BITS将彩色图像P的像素值成功量化成新像素值I,最终将256个颜色量化为(C1,C2,...,Cn)共n个颜色的颜色空间;(1.3.2.2)由于使用的是颜色自相关图提取图像的颜色特征,颜色自相关图只考虑同一图像中相同颜色之间的空间分布关系,因此只需要对量化后的颜色进行数量统计。假设图像为P(x,y),x、y为图像坐标,含有n个量化后的颜色(C1,C2,...,Cn),取距离为d统计颜色自相关图的颜色对数量,做成统计直方图,直方图中的每个bin的大小都是在满足以下公式时进行计算。bin(Ci,Cj)=∑x,y{||I(x,y,Ci)-I(x,y,Cj)||=d}其中,||*||表示像素值为Ci,Cj的两个像素的空间距离,图像自相关图中的Ci=Cj,在整个图像P中统计距离为d的像素对个数。(1.3.2.3)图像自相关图的本质是距离为d的像素对中每个颜色对所占有的概率,将步骤(1.3.2.2)中获得的相同颜色对的数量除以所有距离为d的像素对,获得最终的图像P自相关图的概率;(1.3.3)从图像P中提取出近邻敏感梯度方向直方图和颜色自相关图后,通过特征级融合的方式进行特征融合,其过程为:提取的近邻敏感梯度方向直方图的特征向量为(x1,x2,...,xn),提取的颜色自相关图的特征向量为(y1,y2,...,本文档来自技高网...

【技术保护点】
1.一种基于图像特征和GPS定位的城市建筑物识别方法,其特征是,它包括以下步骤:(1)系统参数初始化的过程:(1.1)使用智能设备获取城市建筑物中各建筑物的彩色图像,并将其导入智能设备中城市建筑物识别系统,对每一张输入该系统的彩色图像,按照w×h的固定尺寸进行图像缩放,缩放过程为:(1.1.1)城市建筑物识别系统接收到一个尺寸为m×n的彩色图像;(1.1.2)将每张图像的列缩小m/w倍,行缩小n/h倍,生成的w×h的彩色图像,将其传递给数据库模块中的数据库存储;(1.2)使用具有GPS功能的智能设备进行相应建筑物地理位置搜集,其经度和维度分别用度、分、秒的形式进行保存,与步骤(1.1)中采集的对应城市建筑物图像相结合,共同定义建筑物名称,将其放到数据库中存储,并传递给建筑物特征提取模块;(1.3)在建筑物特征提取模块中,将建筑物彩色样本图像统一尺寸为160×120,分别进行以下处理:(1.3.1)对每一张样本图像P,提取该图像P所含有的纹理特征,其过程为:(1.3.1.1)在存储系统中的彩色图像P水平和垂直方向上,分别使用[‑1,0,1]和[‑1,0,1]

【技术特征摘要】
1.一种基于图像特征和GPS定位的城市建筑物识别方法,其特征是,它包括以下步骤:(1)系统参数初始化的过程:(1.1)使用智能设备获取城市建筑物中各建筑物的彩色图像,并将其导入智能设备中城市建筑物识别系统,对每一张输入该系统的彩色图像,按照w×h的固定尺寸进行图像缩放,缩放过程为:(1.1.1)城市建筑物识别系统接收到一个尺寸为m×n的彩色图像;(1.1.2)将每张图像的列缩小m/w倍,行缩小n/h倍,生成的w×h的彩色图像,将其传递给数据库模块中的数据库存储;(1.2)使用具有GPS功能的智能设备进行相应建筑物地理位置搜集,其经度和维度分别用度、分、秒的形式进行保存,与步骤(1.1)中采集的对应城市建筑物图像相结合,共同定义建筑物名称,将其放到数据库中存储,并传递给建筑物特征提取模块;(1.3)在建筑物特征提取模块中,将建筑物彩色样本图像统一尺寸为160×120,分别进行以下处理:(1.3.1)对每一张样本图像P,提取该图像P所含有的纹理特征,其过程为:(1.3.1.1)在存储系统中的彩色图像P水平和垂直方向上,分别使用[-1,0,1]和[-1,0,1]T两个梯度算子进行卷积操作,得到图像P在R、G、B三个通道上的水平和垂直方向上的梯度分量,用gradscalx表示R、G、B三个通道上的水平梯度分量,用gradscaly表示R、G、B三个通道上的垂直梯度分量;(1.3.1.2)根据彩色图像P的R、G、B三个通道水平和垂直梯度值,计算图像P中每个像素点(x,y)处梯度的幅值和方向,计算过程如下:由于输入图像P是三维彩色图像,因此需要对图像P的R、G、B三个通道共同计算,分别得到R、G、B三个通道上的梯度值,即一个三维矩阵,用maxgrad表示,然后从maxgrad中选出每一点上的R、G、B三个分量中梯度幅度最大的幅度值,组成的一个梯度值矩阵,maxgrad的计算方式如下:通过从maxgrad中选出每一点上的R、G、B三个分量中梯度幅度最大的幅度值,得到了一个彩色图像的梯度值矩阵,该矩阵是一个二维矩阵,矩阵中的每个点代表图像中该点的梯度幅值,梯度的方向需要通过二维的水平和垂直方向上的梯度分量计算得到,因此首先对三维水平和垂直梯度分量进行R、G、B三通道最大值筛选,计算出二维的水平梯度分量Gx和垂直梯度分量Gy,计算过程需要一个单层循环完成:forn=1,2,3%每个点的RGB分量分别求梯度并取三者最大的值end通过上述操作得到的图像P的二维水平方向上的梯度分量Gx和垂直方向上的梯度分量Gy,计算出P中每个像素处的梯度角度θ:(1.3.1.3)根据图像P的长度和宽度,设置均匀分布于整个图像P的多个采样点,在每个采样点p处都会统计一个关于全局的梯度直方图特征向量,近邻敏感梯度方向直方图特征向量Hp计算如下:其中,m和n分别是图像的宽度和高度,通过q对图像P中的所有像素点进行遍历,α是敏感参数,θq表示像素点q所在位置的梯度角,Vb(θq,b)的计算公式如下:其中,|Gq|代表像素点q处计算的梯度的模,通过判断像素点q处的梯度角是否落在binb中,如果落在bin厶中,则将像素点q处的梯度的模累乘以α后累加到binb上,公式采用敏感参数α来控制像素q对Hp贡献度的大小,根据像素点与采样点之间距离的远近设置相应的权值,距离越远,对该点的贡献越小,权值也越小,通过这种方式,对每个采样点提取近邻敏感梯度方向直方图纹理特征,将多个采样点出的近邻敏感梯度方向直方图进行组合,共同组成图像P的纹理特征向量;(1.3.2)对每一张样本图像P,提取该图像P所含有的颜色特征,其过程为:(1.3.2.1)将彩色图像P进行颜色量化,量化到更少的颜色空间,首先,将像素点q(r,g,b)中的R、G、B三个分量的像素值转化成8位二进制数,然后根据三个分量设置的量化数量R_BITS、G_BITS、B_BITS进行右移,右移的二进制个数分别为(8-R_BITS、8-G_BITS、8-B_BITS),量化颜色的过程如下:R1=bitshift(R,-(8-R_BITS));G1=bitshift(G,-(8-G_BITS));B1=bitshift(B,-(8-B_BITS));I=R1+G1*2R_BITS+B1*2R_BITS*2G-BITS;使用(R1,G1,B1)表示转换后的十进制数,此时(r,g,b)像素点的三个分量取值范围从0~255的256个颜色,量化成新像素点(r1,g1,b1)的三个分量取值范围为0~2R1-1的2R1个颜色;然后通过公式I=R1+G1*2R_BITS+B1*2R_BITS*2G_BITS将彩色图像P的像素值成功量化成新像素值I,最终将256个颜色量化为(C1,C2,...,Cn)共n个颜色的颜色空间;(1.3.2.2)由于使用的是颜色自相关图提取图像的颜色特征,颜色自相关图只考虑同一图像中相同颜色之间的空间分布关系,因此只需要对量化后的颜色进行数量统计。假设图像为P(x,y),x、y为图像坐标,含有n个量化后的颜色(C1,C2,...,Cn),取距离为d统计颜色自相关图的颜色对数量,做成统计直方图,直方图中的每个bin的大小都是在满足以下公式时进行计算。bin(Ci,Cj)=∑x,y{||I(x,y,Ci)-I(x,y,Cj)||=d}其中,||*||表示像素值为Ci,Cj的两个像素的空间距离,图像自相关图中的Ci=Cj,在整个图像P中统计距离为d的像素对个数。(1.3.2.3)图像自相关图的本质是距离为d的像素对中每个颜色对所占有的概率,将步骤(1.3.2.2)中获得的相同颜色对的数量除以所有距离为d的像素对,获得最终的图像P自相关图的概率;(1.3.3)从图像P中提取出近邻敏感梯度方向直方图和颜色自相关图后,通过特征级融合的方式进行特征融合,其过程为:提取的近邻敏感梯度方向直方图的特征向量为(x1,x2,...,xn),提取的颜色自相关图的特征向量为(y1,y2,...,ym),两个特征向量通过特征级融合的方式进行组合,组合后的特征向量(x1,x2,...,xn,y1,y2,...,ym)作为图像P的特征,将两个特征向量通过特征级融合的方式拼接成一个代表图像P的特征向量,将该特征向量传递给降维和分类模块;(1.4)在计算机上完成降维和分类模块的初始化过程,在初始化的过程中,接收到从建筑物特征提取模块传递来的融合特征(x1,x2,...,xn,y1,y2,...,ym),然后进行如下操作:(1.4.1)将高维的特征向量压缩成低维的特征向量,训练一个具有降维效果欠完备自编码器,通过编码器和解码器的共同协作,以尽量实现输出对输入的复现,使用这些特征对自编码器网络进行训练,并通过训练好的自编码器对这些特征进行降维处理,其过程为:(1.4.1.1)初始化一个单层的欠完备自编...

【专利技术属性】
技术研发人员:李斌孙福强张永涵
申请(专利权)人:东北电力大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1