基于带权重的解卷积深度网络学习的场景识别方法技术

技术编号:13793212 阅读:154 留言:0更新日期:2016-10-06 06:06
一种基于带权重的解卷积深度网络学习的场景识别方法,其包括以下步骤:1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度网络模型学习,得到每幅图像不同尺度上的特征图;2)利用空间金字塔模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图像的特征向量表达;3)将原始输入图像分为训练集和测试集,然后将这些图像的特征向量表达分别输入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。本发明专利技术提供的基于带权重的解卷积深度网络学习的场景识别方法,通过建立不同尺度上的场景的表达,以使场景表达更为精细和充分,从而提高场景分类的精度。

【技术实现步骤摘要】

本专利技术属于信息处理
,涉及一种遥感图像的场景识别与理解方法,尤其涉及一种基于带权重的解卷积深度网络学习的场景识别方法
技术介绍
随着我国航天技术的发展,越来越多的高分卫星被发射到太空中以获取地球表面数据,达到灾害监测、农业估产以及军事侦查等目的。通常从卫星传送到地面上的数据画幅巨大,为了充分利用这些大量的大幅高分遥感数据,场景分类是非常重要的预处理手段,它对后续进一步的目标识别、变化检测、图像检索等任务有着重要帮助。目前,对于遥感影像进行场景分类的方法主要分为四类:一是自底向上的分层场景建模的方法,该方法首先从图像像素开始分类,对每个像素赋予一个标签,然后通过迭代区域分割的方法得到图像中不同区域的类别标记,最后通过分析各区域之间的空间关系,得到整幅图像的场景类别。具体方法见参考文献“Learning Bayesian Classifiers for Scene Classification With a Visual Grammar,IEEE Transactions on Remote Sensing,43(3):581-589,2005”。二是基于词包模型(Bag of Words,BOW)的方法,在场景分类中,该方法首先将训练图像打块,提取这些图像块中特征向量;然后对这些特征进行聚类并将聚类中心作为字典,进而计算每幅图像的特征与字典的距离,并统计落入每个字典中的特征点的个数,这样得到每幅图像的特征直方图;最后利用支持向量机(Support Vector Machine,SVM)分类器进行分类得到最终的场景分类结果。具体方法见参考文献“Video Google:a text retrieval approach to object matching in videos,in Proc.9th IEEE Int.Conf.Computer Vision,2:1470-1477,2003”。三是基于主题模型的方法,该方法最初是用于文本分析领域,在场景分类中,将图像特征作为文本分析中的单词,每幅图像即为文档,每幅图像的场景
类别即为文档的主题,因此通过主题模型分析,可以得到每幅图像的场景类别。具体方法见参考文献“Latent Dirichlet Allocation for Spatial Analysis of Satellite Images,IEEE Transactions on Geoscience and Remote Sensing,51(5):2770-2786,2013”。四是稀疏表达的方法,该方法首先利用稀疏字典学习的方法得到一组基,然后将每幅图像特征通过稀疏编码的方法投影到这一组基上得到图像的稀疏表达,最后利用SVM分类器得到场景分类的结果,具体方法见参考文献“Saliency-Guided Unsupervised Feature Learning for Scene Classification,IEEE Transaction on Geoscience and Remote Sensing,53(4):2175-2184,2014”。上述四种方法虽然取得了较好的结果,但是它们均忽略了遥感图像的地物复杂、不同场景类别相似性很大的特点,从而导致分类精度不高。例如,机场场景中不仅有飞机,还有跑道和候机楼等,其中跑道和道路场景难以区分,而候机楼容易与居民区混淆;再如城市和密集活动房,它们属于不同的场景,但是即便是从人类视觉上看,它们也有很大的相似性,因而阻碍了分类精度的进一步提升;此外,这些现有方法中大多数都采用人为设计好的特征,如:尺度不变特征旋转描述子、颜色直方图等,相比于从数据本身学习到的特征来讲,它们的普适性更差。
技术实现思路
为了解决
技术介绍
中存在的上述技术问题,本专利技术提供了一种基于带权重的解卷积深度网络学习的场景识别方法,通过建立不同尺度上的场景的表达,以使场景表达更为精细和充分,从而提高场景分类的精度。本专利技术的技术解决方案是:本专利技术提供了一种基于带权重的解卷积深度网络学习的场景识别方法,其特殊之处在于:包括以下步骤:1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度网络模型学习,得到每幅图像不同尺度上的特征图;2)利用空间金字塔模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图像的特征向量表达;3)将原始输入图像分为训练集和测试集,然后将这些图像的特征向量表达分别输入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。上述基于带权重的解卷积深度网络学习的场景识别方法在步骤3)之后还包括:4)根据步骤3)所得不同场景的识别结果,分别计算分类精度与混淆矩阵。上述步骤1)中构建的带权重的解卷积深度网络模型为: C ( l ) = λ l 2 | | y ^ l - y | | 2 2 + Σ k = 1 K l | z k , l | 1 - - - ( 1 ) ]]>其中,C(l)是带权重的解卷积深度网络模型的目标函数,l是带权重的解卷积深度网络结构的层数,λl是正则项参数,y是原始输入图像,是由第l层的特征图向下重构得到的图像,zk,l是第l层第k个特征图,Kl是第l层的特征图总数,||1是对特征图的稀疏约束;对于带权重的解卷积深度网络结构中的第一层, y ^ 1 = Σ k = 1 K 1 w k , 1 × z k , 1 * f k , 1 - - - 本文档来自技高网
...

【技术保护点】
一种基于带权重的解卷积深度网络学习的场景识别方法,其特征在于:包括以下步骤:1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度网络模型学习,得到每幅图像不同尺度上的特征图;2)利用空间金字塔模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图像的特征向量表达;3)将原始输入图像分为训练集和测试集,然后将这些图像的特征向量表达分别输入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。

【技术特征摘要】
1.一种基于带权重的解卷积深度网络学习的场景识别方法,其特征在于:包括以下步骤:1)构建带权重的解卷积深度网络模型,对原始输入图像利用带权重的解卷积深度网络模型学习,得到每幅图像不同尺度上的特征图;2)利用空间金字塔模型对步骤1)中学习到的特征图进行特征抽样,形成每幅图像的特征向量表达;3)将原始输入图像分为训练集和测试集,然后将这些图像的特征向量表达分别输入到支持向量机分类器中完成分类训练和测试,最终得到不同场景的识别结果。2.根据权利要求1所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征在于:所述基于带权重的解卷积深度网络学习的场景识别方法在步骤3)之后还包括:4)根据步骤3)所得不同场景的识别结果,分别计算分类精度与混淆矩阵。3.根据权利要求2所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征在于:所述步骤1)中构建的带权重的解卷积深度网络模型为: C ( l ) = λ l 2 | | y ^ l - y | | 2 2 + Σ k = 1 K l | z k , l | 1 - - - ( 1 ) ]]>其中,C(l)是带权重的解卷积深度网络模型的目标函数,l是带权重的解卷积深度网络结构的层数,λl是正则项参数,y是原始输入图像,是由第l层的特征图向下重构得到的图像,zk,l是第l层第k个特征图,Kl是第l层的特征图总数,| |1是对特征图的稀疏约束;对于带权重的解卷积深度网络结构中的第一层, y ^ 1 = Σ k = 1 K 1 w k , 1 × z k , 1 * f k , 1 - - - ( 2 ) ]]> y ^ 1 = W 1 F 1 z 1 - - - ( 3 ) ]]>其中,zk,1表示第1层第k个特征图,fk,1表示第1层第k个滤波器,wk,1表示第1层第k个滤波器的权重,表示由第1层的特征图向下重构得到的图像,*表示卷积;公式(3)是将卷积操作和求和操作综合为矩阵的相乘操作,W1是由wk,1组
\t成的向量,F1是由fk,1组成的滤波器组,z1是由zk,1组成的特征图矩阵;对于带权重的解卷积深度网络结构中的其他层, y ^ l = F 1 W 1 U 1 F 2 W 2 U 2 . . . F l W l z l = A l z l - - - ( 4 ) ]]>Al=F1W1U1F2W2U2...FlWl (5)其中,zl表示第l层的特征图,Fl表示第l层的滤波器组,Wl表示第l层滤波器组的权重,Ul表示第l层去融合的过程。4.根据权利要求3所述的基于带权重的解卷积深度网络学习的场景识别方法,其特征在于:所述步骤1)中对原始输入图像利用带权重的解卷积深度网络模型学习的方法包括以下步骤:1.1)通过迭代收缩阈值化方法学习特征图z:1.1.1)对公式(1)求z的偏导,得到特征图z的梯度:其中是Al的逆过程;1.1.2)利用梯度下降更新zl:zl=zl-λlβlgl,其中βl是梯度下降步长;1.1.3)利用收敛操作,使zl中值较小的元素变为0,即zl=max(|zl|-βl,0)sign(zl);1.2)迭代学习滤波器组F:1.2.1)对公式(1)求Fl的偏导,并令求偏导后的结果等于0,得: Σ i = 1 N ( z l ...

【专利技术属性】
技术研发人员:袁媛卢孝强付敏
申请(专利权)人:中国科学院西安光学精密机械研究所
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1