一种多层宽度神经网络及其训练方法和应用技术

技术编号：28872863 阅读：10 留言：0更新日期：2021-06-15 23:06

本发明专利技术属于人工智能和机器学习技术领域，公开了一种多层宽度神经网络及其训练方法和应用，可用高光谱遥感影像和普通图像分类任务。其每一层由滑动窗口的变换核进行非线性变换，向宽方向扩展以充分学习空间和频谱特征，并且引入了排序和下采样操作以减少该层的变换内核层的输出数量，每一层称为宽度滑动窗口和下采样层，即WSWS层，将多个WSWS层级联可以更大视野的更高级别的空间和光谱特征。该网络只需学习全连接层的权值，从而可以轻松的进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种多层宽度神经网络及其训练方法和应用
本专利技术涉及人工智能和机器学习
，具体涉及一种多层宽度神经网络及其训练方法和应用；可用高光谱遥感影像分类任务，也可应用于普通图像分类问题。
技术介绍
高光谱图像(HyperspectralImage，HSI)包含数百个连续光谱带，这使它们具有丰富的信息可对不同的地面物体进行分类。这些图像与分类方法一起可以用于以下应用：包括农业监测、土地覆盖的变化检测、城市制图、森林保护和物体检测。HSI分类的一个困难是由于成像过程中不同的照明、大气环境等而导致具有不同光谱特征的均质地面物体。另一个困难是，尽管大量的光谱带提供了大量的数据，但是训练数据通常非常有限，并且由于混合像素，图像场景变得复杂。在过去的几十年中，研究人员使用了不同的机器学习方法，包括k个最近邻(KNN)、支持向量机(SVM)、多层感知器(MLP)和径向基函数网络(RBF)等，这些方法主要在光谱域内。许多基于CNN的深度学习高光谱图像分类方法可在空间和频谱域中学习特征。与仅使用从空间域或空间域和频谱域两者中手动提取的特征的前述方法相比，这是一个很大的优势。尽管深度学习方法在各个领域都有了很大的改进，但是由于参数众多，它们通常需要很长的训练时间。另一个问题是，随着深度的增加，CNN会实现更高的性能。然而，高光谱图像的训练样本通常数量有限。因此，很难使用包含许多层和大量卷积内核的CNN用于HSI分类以提取空间特征。然而，宽度学习具有自身的诸多优点，这里的宽度是指完全连接卷积层中隐藏的神经元或通道的数量。宽...

【技术保护点】
1.一种多层宽度神经网络，其特征在于，包括多个依次级联的宽度滑动窗口和下采样层及全连接层，每个宽度滑动窗口和下采样层包含多个变换核层；每个变换核层通过宽度滑动窗口模块和下采样模块构造；对于输入数据p

【技术特征摘要】
1.一种多层宽度神经网络，其特征在于，包括多个依次级联的宽度滑动窗口和下采样层及全连接层，每个宽度滑动窗口和下采样层包含多个变换核层；每个变换核层通过宽度滑动窗口模块和下采样模块构造；对于输入数据pWSWS＝[p1，p2，…，pN]，宽度滑动窗口模块GWWS由N组高斯核表示：GWWS＝[G1，…，Gn，…，GN]；在滑动过程中，每个高斯核在宽度方向上扩展；即第n次滑动中，每个高斯核Gn由Mn个高斯内核组成
其中，表示第n次滑动中的第Mn个高斯内核；宽度表示的是宽度滑动窗口和下采样层中隐藏单元的数量。

2.根据权利要求1所述的多层宽度神经网络，其特征在于，所述多层宽度神经网络中的宽度滑动窗口和下采样层的个数由待学习数据集的数据量和分类精度要求来确定。

3.根据权利要求1所述的多层宽度神经网络，其特征在于，每个高斯核内的高斯内核的数量不同。

4.一种多层宽度神经网络的训练方法，其特征在于，包括以下步骤：
步骤1，获取原始HSI数据，对原始HSI数据进行预处理和零填充，得到待训练数据Xnorm_pad；从Xnorm_pad中为每个类别的像素生成对应的训练数据和测试数据，每个训练样本和测试样本分别为三维图像块；将所有训练样本和测试样本的三维图像块逐波段展开串成矢量，对应得到训练矢量Xtr和测试矢量Xtest；
步骤2，将训练矢量Xtr作为输入对多层宽度神经网络进行训练，即将训练矢量Xtr输入第一个宽度滑动窗口和下采样层，该层输出第一层的高斯变换结果；将第一层的高斯变换结果输入第二个宽度滑动窗口和下采样层，依次类推，直到最后一个宽度滑动窗口和下采样层输出结果；
步骤3，使用具有线性权重的全连接层将最后一个宽度滑动窗口和下采样层输出结果进行组合，使用最小二乘法计算全连接层的线性权重，得到训练后的多层宽度神经网络，采用测试矢量Xtest对训练后的多层宽度神经网络进行测试，完成多层宽度神经网络的训练过程。

5.根据权利要求4所述的多层宽度神经网络的训练方法，其特征在于，所述预处理为：对原始HSI数据进行冗余信息去除和归一化处理；即通过主成分分析减少波段数量至BPCA，再对每个减少后的波段进行归一化处理：

其中，X(k)表示减少后的第k个波段的数据，Xnorm(k)表示归一化后的第k个波段的数据；
所述零填充为：对归一化后的整个图像Xnorm分别在宽度和高度方向上进行零填充，两个方向上的填充大小分别为...

【专利技术属性】
技术研发人员：席江波，姜万冬，谢大帅，丛铭，房建武，吴田军，赵超英，
申请(专利权)人：长安大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人