当前位置: 首页 > 专利查询>长安大学专利>正文

一种多层宽度神经网络及其训练方法和应用技术

技术编号:28872863 阅读:10 留言:0更新日期:2021-06-15 23:06
本发明专利技术属于人工智能和机器学习技术领域,公开了一种多层宽度神经网络及其训练方法和应用,可用高光谱遥感影像和普通图像分类任务。其每一层由滑动窗口的变换核进行非线性变换,向宽方向扩展以充分学习空间和频谱特征,并且引入了排序和下采样操作以减少该层的变换内核层的输出数量,每一层称为宽度滑动窗口和下采样层,即WSWS层,将多个WSWS层级联可以更大视野的更高级别的空间和光谱特征。该网络只需学习全连接层的权值,从而可以轻松的进行训练。

【技术实现步骤摘要】
一种多层宽度神经网络及其训练方法和应用
本专利技术涉及人工智能和机器学习
,具体涉及一种多层宽度神经网络及其训练方法和应用;可用高光谱遥感影像分类任务,也可应用于普通图像分类问题。
技术介绍
高光谱图像(HyperspectralImage,HSI)包含数百个连续光谱带,这使它们具有丰富的信息可对不同的地面物体进行分类。这些图像与分类方法一起可以用于以下应用:包括农业监测、土地覆盖的变化检测、城市制图、森林保护和物体检测。HSI分类的一个困难是由于成像过程中不同的照明、大气环境等而导致具有不同光谱特征的均质地面物体。另一个困难是,尽管大量的光谱带提供了大量的数据,但是训练数据通常非常有限,并且由于混合像素,图像场景变得复杂。在过去的几十年中,研究人员使用了不同的机器学习方法,包括k个最近邻(KNN)、支持向量机(SVM)、多层感知器(MLP)和径向基函数网络(RBF)等,这些方法主要在光谱域内。许多基于CNN的深度学习高光谱图像分类方法可在空间和频谱域中学习特征。与仅使用从空间域或空间域和频谱域两者中手动提取的特征的前述方法相比,这是一个很大的优势。尽管深度学习方法在各个领域都有了很大的改进,但是由于参数众多,它们通常需要很长的训练时间。另一个问题是,随着深度的增加,CNN会实现更高的性能。然而,高光谱图像的训练样本通常数量有限。因此,很难使用包含许多层和大量卷积内核的CNN用于HSI分类以提取空间特征。然而,宽度学习具有自身的诸多优点,这里的宽度是指完全连接卷积层中隐藏的神经元或通道的数量。宽度的全连接神经网络等效于高斯过程,具备很好的泛化能力。
技术实现思路
针对现有技术存在的问题,本专利技术的目的在于提供一种多层宽度神经网络(Multi-layerWideNeuralNetwork,MWNN)及其训练方法和应用,该神经网络的每一层基于具有滑动窗口的变换核,可以向宽度方向扩展以充分了解空间和频谱特征,同时引入了排序和下采样以减少该层的变换核层的输出数量;每一层称为宽度滑动窗口和下采样(WideSlidingWindowandSubsampling,WSWS)层。将多个WSWS层级联能够学习更大视野的更高级别的空间和光谱特征。最后,将具有线性权重的完全连接层与WSWS层组合以预测像素类别。为了达到上述目的,本专利技术采用以下技术方案予以实现。(一)一种多层宽度神经网络,包括多个依次级联的宽度滑动窗口和下采样层及全连接层,每个宽度滑动窗口和下采样层包含多个变换核层;每个变换核层通过宽度滑动窗口模块和下采样模块构造;对于输入数据pWSWS=[p1,p2,…,pN],宽度滑动窗口模块GWWS由N组高斯核表示:GWWS=[G1,…,Gn,…,GN];在滑动过程中,每个高斯核在宽度方向上扩展;即第n次滑动中,每个高斯核Gn由Mn个高斯内核组成其中,表示第n次滑动中的第Mn个高斯内核;宽度表示的是宽度滑动窗口和下采样层中隐藏单元的数量。进一步地,所述多层宽度神经网络中的宽度滑动窗口和下采样层的个数由待学习数据集的数据量和分类精度要求来确定。进一步地,每个高斯核内的高斯内核的数量不同。(二)一种多层宽度神经网络的训练方法,包括以下步骤:步骤1,获取原始HSI数据,对原始HSI数据进行预处理和零填充,得到待训练数据Xnorm_pad;从Xnorm_pad中为每个类别的像素生成对应的训练数据和测试数据,每个训练样本和测试样本分别为三维图像块;将所有训练样本和测试样本的三维图像块逐波段展开串成矢量,对应得到训练矢量Xtr和测试矢量xtest;步骤2,将训练矢量Xtr作为输入对多层宽度神经网络进行训练,即将训练矢量Xtr输入第一个宽度滑动窗口和下采样层,该层输出第一层的高斯变换结果;将第一层的高斯变换结果输入第二个宽度滑动窗口和下采样层,依次类推,直到最后一个宽度滑动窗口和下采样层输出结果;步骤3,使用具有线性权重的全连接层将最后一个宽度滑动窗口和下采样层输出结果进行组合,使用最小二乘法计算全连接层的线性权重,得到训练后的多层宽度神经网络,采用测试矢量对训练后的多层宽度神经网络进行测试,完成多层宽度神经网络的训练过程。进一步地,所述预处理为:对原始HSI数据进行冗余信息去除和归一化处理;即通过主成分分析减少波段数量至BPCA,再对每个减少后的波段进行归一化处理:其中,X(k)表示减少后的第k个波段的数据,Xnorm(k)表示归一化后的第k个波段的数据。进一步地,所述零填充为:对归一化后的整个图像Xnorm分别在宽度和高度方向上进行零填充,两个方向上的填充大小分别为(SW-1)/2和(SH-1)/2,得到零填充后的HSI图像,即为待训练数据Xnorm_pad;其中,每个训练样本的大小为SW×SH×BPCA。进一步地,每个宽度滑动窗口和下采样层的内部训练过程为:2.1,选取滑动窗口的大小为m,滑动步长为l,采用滑动窗口对该层输入的训练数据从上到下依次滑动取样;对于第n次滑动,截取的输入向量pn输入一组高斯核则第n次滑动中的高斯核的输出为:其中,gni(pn),1≤i≤Mn是具有Np分量的列向量,Mn表示第n次滑动中的高斯内核数;1≤n≤N=(M-m+1),M=SW×SH×BPCA为训练矢量Xtr的长度;2.2,对于输入pWSWS=[p1,p2,…,pN],宽度滑动窗口模块由N组高斯核表示:GWSWS=[G1,…,Gn,…,GN]对其输出依次进行排序和下采样,得到该宽度滑动窗口和下采样层的最终输出其中,所述排序是每个高斯核的所有像素求和后,再从最大值排序到最小值;为第n次滑动中高斯核的最终输出。更进一步地,每个宽度滑动窗口和下采样层的内部训练的变换核参数通过无监督学习或者从训练样本中随机选择获得。更进一步地,在滑动过程中,高斯核在宽度方向上扩展,即宽度滑动窗口和下采样层内的高斯内核的数量不同。进一步地,所述使用最小二乘法计算全连接层的线性权重,具体公式为:其中,D∈RN×C是标记的输出,||·||为取范数,为最后一个宽度滑动窗口和下采样层输出结果,W=[W1,W2,…,WC],C是总类别数;所述多层宽度神经网络的最终输出为:其中,上标H表示矩阵的转置,上标-1表示矩阵求逆操作。(三)基于所述多层宽度神经网络的高光谱图像分类方法,包括以下步骤:步骤1,对所述多层宽度神经网络进行训练,得到训练后的多层宽度神经网络;步骤2,对待分类高光谱图像进行预处理和零填充,生成对应的输入矢量;将该输入矢量输入训练后的多层宽度神经网络,输出待分类高光谱图像每个像素块的分类结果。与现有技术相比,本专利技术的有益效果为:(1)本专利技术的每一层基于具有滑动窗口的变换核,可以向宽度方向扩展以充分了解空间和频谱特征,并且引入了排序和下采样操作以减少该层的变换内核层的输出数量。(2)本专利技术可本文档来自技高网
...

【技术保护点】
1.一种多层宽度神经网络,其特征在于,包括多个依次级联的宽度滑动窗口和下采样层及全连接层,每个宽度滑动窗口和下采样层包含多个变换核层;每个变换核层通过宽度滑动窗口模块和下采样模块构造;对于输入数据p

【技术特征摘要】
1.一种多层宽度神经网络,其特征在于,包括多个依次级联的宽度滑动窗口和下采样层及全连接层,每个宽度滑动窗口和下采样层包含多个变换核层;每个变换核层通过宽度滑动窗口模块和下采样模块构造;对于输入数据pWSWS=[p1,p2,…,pN],宽度滑动窗口模块GWWS由N组高斯核表示:GWWS=[G1,…,Gn,…,GN];在滑动过程中,每个高斯核在宽度方向上扩展;即第n次滑动中,每个高斯核Gn由Mn个高斯内核组成
其中,表示第n次滑动中的第Mn个高斯内核;宽度表示的是宽度滑动窗口和下采样层中隐藏单元的数量。


2.根据权利要求1所述的多层宽度神经网络,其特征在于,所述多层宽度神经网络中的宽度滑动窗口和下采样层的个数由待学习数据集的数据量和分类精度要求来确定。


3.根据权利要求1所述的多层宽度神经网络,其特征在于,每个高斯核内的高斯内核的数量不同。


4.一种多层宽度神经网络的训练方法,其特征在于,包括以下步骤:
步骤1,获取原始HSI数据,对原始HSI数据进行预处理和零填充,得到待训练数据Xnorm_pad;从Xnorm_pad中为每个类别的像素生成对应的训练数据和测试数据,每个训练样本和测试样本分别为三维图像块;将所有训练样本和测试样本的三维图像块逐波段展开串成矢量,对应得到训练矢量Xtr和测试矢量Xtest;
步骤2,将训练矢量Xtr作为输入对多层宽度神经网络进行训练,即将训练矢量Xtr输入第一个宽度滑动窗口和下采样层,该层输出第一层的高斯变换结果;将第一层的高斯变换结果输入第二个宽度滑动窗口和下采样层,依次类推,直到最后一个宽度滑动窗口和下采样层输出结果;
步骤3,使用具有线性权重的全连接层将最后一个宽度滑动窗口和下采样层输出结果进行组合,使用最小二乘法计算全连接层的线性权重,得到训练后的多层宽度神经网络,采用测试矢量Xtest对训练后的多层宽度神经网络进行测试,完成多层宽度神经网络的训练过程。


5.根据权利要求4所述的多层宽度神经网络的训练方法,其特征在于,所述预处理为:对原始HSI数据进行冗余信息去除和归一化处理;即通过主成分分析减少波段数量至BPCA,再对每个减少后的波段进行归一化处理:



其中,X(k)表示减少后的第k个波段的数据,Xnorm(k)表示归一化后的第k个波段的数据;
所述零填充为:对归一化后的整个图像Xnorm分别在宽度和高度方向上进行零填充,两个方向上的填充大小分别为...

【专利技术属性】
技术研发人员:席江波姜万冬谢大帅丛铭房建武吴田军赵超英
申请(专利权)人:长安大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1