当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于随机卷积神经网络的高分辨率图像场景分类方法技术

技术编号:14235438 阅读:204 留言:0更新日期:2016-12-21 09:09
一种基于随机卷积神经网络的高分辨率图像场景分类方法,包括数据去均值,获得待分类图像集和训练图像集;模型共享的参数库随机初始化;计算待分类图像集和训练图像集的负梯度方向;训练基础卷积神经网络模型,训练基础卷积神经网络模型的权重;更新函数预测,得到加和模型;迭代达到最大训练次时,利用加和模型对待分类图像集进行识别。本发明专利技术使用深度卷积网络对特征进行层次化学习,利用梯度提升方法进行模型的聚合学习,用来克服单个模型容易陷入局部最优解问题,同时提高网络泛化能力;在模型训练过程中,加入了随机参数共享机制,提高模型的训练效率,可以在合理的时间代价下实现对特征的层次化学习,学习到的特征在场景识别中更具有鲁棒性。

A high resolution image scene classification method based on stochastic convolution neural network

A high resolution image scene classification methods based on convolutional neural network, including data to mean, get to be classified image set and training image set; random initialization parameter database sharing model; calculate the classification of image set and training image set the negative gradient direction; training based convolution neural network model, weight training based convolution neural network model; prediction and update function, and iterative model; maximum training time, the addition model to be classified image set recognition. The invention uses convolutional neural networks on characteristics of hierarchical learning, learning model to improve the method of polymerization using gradient, to overcome the single model is easy to fall into local optimal solution of the problem, and improve the network generalization ability; in the model training process, adding random parameter sharing mechanism, improve the efficiency of model training, can achieve the level of learning the characteristics of the price in a reasonable time, the characteristics of learning is more robust in scene recognition.

【技术实现步骤摘要】

本专利技术属于遥感图像处理领域,具体涉及一种基于随机卷积神经网络的高分辨率图像场景分类方法
技术介绍
高分辨率遥感图像(一般指大于1米空间分辨率的遥感图像)由于其具有很高的空间分辨率,丰富的空间信息可以为地物识别提供精细的信息,已被广泛应用于各个领域。然而,由于图像空间分辨率比较高,进行识别的场景通常包含多种不同类别的地物混合得到的像元,这些地物往往有着不同的结构信息,但是由于光谱分辨率较低,往往难以区分。随着高分辨率成像技术的成熟和成本的降低,高分辨率图像被越来越多的使用,但是高分辨率图像的场景识别仍然存在一些限制条件。1)高分辨率的存在使得场景往往有多种复杂地物组成,造成异物同谱现象,使精确解译成为一个难点,因为无法确定这个像元到底属于哪种物质。2)进行场景识别,需要利用获取的图像的空间,结构,纹理和语义信息,从语义的层面上解译图像。但是如何学习图像的层次化特征表达是个难点。3)利用单个网络模型往往容易陷入局部最小值,不能得到最优结果。这些方法不能得到网络的最优结果。因此,需要一种能利用数据本身高层次特征,又有优异的语义信息表达的方法来进行场景的层次化特征学习与识别。
技术实现思路
本专利技术主要是提供了一种基于梯度提升的随机卷积神经网络模型解决现有方法所存在的问题,提供了一种既能层次化提取高层次特征,又能自适应聚合多个网络模型的方法。为了达到上述目的,本专利技术提供的技术方案是一种基于随机卷积神经网络的高分辨率图像场景分类方法,包括以下步骤:步骤a,数据去均值,获得待分类图像集和训练图像集;步骤b,模型共享的参数库随机初始化;步骤c,计算步骤a中所得待分类图像集和训练图像集的负梯度方向,实现方式如下,设图像集x是输入数据,y是对应x的类别标签,N是数据个数,i是数据编号,首先令初始化输出函数f0(x)=0,k=1,...,K,t=1,其中f0(x)是非线性函数f(x)的初始函数,k是类别个数,共K个类别,t为迭代次数,计算优化函数Ψ(y,f(x))如下, p k ( x ) = exp ( f ( k ) ( x ) ) / Σ k = 1 K exp ( f ( k ) ( x ) ) - - - ( 1 ) ]]> Ψ ( y , f ( x ) ) = - Σ k = 1 K y k l o g p k ( x ) - - - ( 2 ) ]]>其中f(k)(x)表示输出函数的第k个类别的输出值,pk(x)表示样本x属于第k个类别的概率,yk表示样本x是否为第k个类别,如果是则为1,不是则为0;然后利用优化函数计算负梯度方向如下, - g t ( x ) = - [ ∂ Ψ ( y , f ( x ) ) ∂ f ( x ) ] f ( x ) = f ^ t - 1 ( x ) = y - p ( x ) - - - ( 3 ) ]]>其中,表示第t-1个f(x)的估计函数,p(x)表示样本x的各类别输出概率;第一次执行步骤c时,f(x)=f0(x);后续执行步骤c时,f(x)为上一次迭代得到的估计函数;步骤d,训练基础卷积神经网络模型,实现方式如下,首先从步骤b所得共享的参数库中随机选取一组卷积神经网络的参数组合θt,构成一个基础卷积神经网络模型h(x,θt), h ( x , θ t ) = Σ i = 1 N ( 1 2 | | h ( x , θ t ) - g t ( x ) | | 2 本文档来自技高网...
一种基于随机卷积神经网络的高分辨率图像场景分类方法

【技术保护点】
一种基于随机卷积神经网络的高分辨率图像场景分类方法,其特征在于,包括以下步骤:步骤a,数据去均值,获得待分类图像集和训练图像集;步骤b,模型共享的参数库随机初始化;步骤c,计算步骤a中所得待分类图像集和训练图像集的负梯度方向,实现方式如下,设图像集x是输入数据,y是对应x的类别标签,N是数据个数,i是数据编号,首先令初始化输出函数f0(x)=0,k=1,...,K,t=1,其中f0(x)是非线性函数f(x)的初始函数,k是类别个数,共K个类别,t为迭代次数,计算优化函数Ψ(y,f(x))如下,pk(x)=exp(f(k)(x))/Σk=1Kexp(f(k)(x))---(1)]]>Ψ(y,f(x))=-Σk=1Kyklog pk(x)---(2)]]>其中f(k)(x)表示输出函数的第k个类别的输出值,pk(x)表示样本x属于第k个类别的概率,yk表示样本x是否为第k个类别,如果是则为1,不是则为0;然后利用优化函数计算负梯度方向如下,-gt(x)=-[∂Ψ(y,f(x))∂f(x)]f(x)=f^t-1(x)=y-p(x)---(3)]]>其中,表示第t‑1个f(x)的估计函数,p(x)表示样本x的各类别输出概率;第一次执行步骤c时,f(x)=f0(x);后续执行步骤c时,f(x)为上一次迭代得到的估计函数;步骤d,训练基础卷积神经网络模型,实现方式如下,首先从步骤b所得共享的参数库中随机选取一组卷积神经网络的参数组合θt,构成一个基础卷积神经网络模型h(x,θt),h(x,θt)=Σi=1N(12||h(x,θt)-gt(x)||2)+λΣl=1Lsum(||θ(l)||2)---(4)]]>其中θ(l)是第l个特征提取阶段的网络参数,设共L个特征提取阶段,l=1,2,…L,θ表示所有阶段的网络参数,θt是第t个非线性函数f(x)的网络参数θ,sum(.)指求和;然后基于步骤a所得的训练图像集,利用传统的反向误差传播算法和步骤c得到的负梯度方向,来最小化基础卷积神经网络模型h(x,θt)的误差,并对h(x,θt)进行训练,得到最优的参数组合θt,更新卷积神经网络参数并存入对应阶段参数库;步骤e,训练基础卷积神经网络模型的权重,实现方式如下,利用步骤d得到的基础卷积神经网络模型h(x,θt)和函数估计计算模型权重如下,ρt,k=argminρΣi=1NΣk=1KΨ(yk,f^t-1,k+ρt,khk(xi,θ))---(5)]]>其中,ρt,k是第t个非线性函数f(x)的第k类别权重,表示第t‑1个f(x)的估计函数,表示第k类别的hk(xi,θ)表示第i个数据xi第k类别的优化函数;权重更新为ρt,k=ρt‑1,k‑▽ρ,其中▽ρt,k=‑(1(c=k)·hc(x)‑pk(x)·hk(x)),▽ρ表示权值梯度,▽ρt,k表示第t次迭代第k类别的权值梯度,c代表某个样本的标签,指示函数1(c=k)表示如果c等于k则取值为1,否则为0,k=1,2,…K;hc(x)表示第c类别的基础卷积神经网络模型h(x,θt)输出值,hk(x)表示第k类别的基础卷积神经网络模型h(x,θt)输出值;步骤f,更新函数预测,得到加和模型,公式如下,f^t←f^t-1+λρth(x,θt)---(6)]]>其中,ρt是基础卷积神经网络的最佳梯度下降乘子,h(x,θt)为基础卷积神经网络模型,λ为缩放因子,且λ=1/(M+1);步骤g,判断迭代是否达到最大训练次数,若达到最大训练次数则转步骤h;否则令t=t+1,转步骤c,重新计算负梯度,并继续从共享的参数库中随机选取另一组参数组合,构成一个基础卷积神经网络模型,进行训练;步骤h,利用步骤f中所得的加和模型对步骤a所得的待分类图像集进行识别。...

【技术特征摘要】
1.一种基于随机卷积神经网络的高分辨率图像场景分类方法,其特征在于,包括以下步骤:步骤a,数据去均值,获得待分类图像集和训练图像集;步骤b,模型共享的参数库随机初始化;步骤c,计算步骤a中所得待分类图像集和训练图像集的负梯度方向,实现方式如下,设图像集x是输入数据,y是对应x的类别标签,N是数据个数,i是数据编号,首先令初始化输出函数f0(x)=0,k=1,...,K,t=1,其中f0(x)是非线性函数f(x)的初始函数,k是类别个数,共K个类别,t为迭代次数,计算优化函数Ψ(y,f(x))如下, p k ( x ) = exp ( f ( k ) ( x ) ) / Σ k = 1 K exp ( f ( k ) ( x ) ) - - - ( 1 ) ]]> Ψ ( y , f ( x ) ) = - Σ k = 1 K y k log p k ( x ) - - - ( 2 ) ]]>其中f(k)(x)表示输出函数的第k个类别的输出值,pk(x)表示样本x属于第k个类别的概率,yk表示样本x是否为第k个类别,如果是则为1,不是则为0;然后利用优化函数计算负梯度方向如下, - g t ( x ) = - [ ∂ Ψ ( y , f ( x ) ) ∂ f ( x ) ] f ( x ) = f ^ t - 1 ( x ) = y - p ( x ) - - - ( 3 ) ]]>其中,表示第t-1个f(x)的估计函数,p(x)表示样本x的各类别输出概率;第一次执行步骤c时,f(x)=f0(x);后续执行步骤c时,f(x)为上一次迭代得到的估计函数;步骤d,训练基础卷积神经网络模型,实现方式如下,首先从步骤b所得共享的参数库中随机选取一组卷积神经网络的参数组合θt,构成一个基础卷积神经网络模型h(x,θt), h ( x , θ t ) = Σ i = 1 N ( 1 2 | | h ( x , ...

【专利技术属性】
技术研发人员:杜博张帆张良培
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1