一种基于改进的VGG卷积神经网络模型的图像分类方法技术

技术编号：30321177 阅读：17 留言：0更新日期：2021-10-09 23:43

本发明专利技术公开了一种基于改进的VGG卷积神经网络模型的图像分类方法，包括：步骤1：建立注意力机制模块；步骤2：在VGG卷积神经网络模型中添加注意力机制，得到基于注意力机制的VGG卷积神经网络模型；步骤3:采用预处理后的训练集对基于注意力机制的VGG卷积神经网络模型进行训练，采用预处理后的测试集测试基于注意力机制的VGG卷积神经网络模型的分类结果；当训练次数达到预设的最大迭代次数或者基于注意力机制的VGG卷积神经网络模型收敛，则停止训练得到最后训练好的基于注意力机制的VGG卷积神经网络模型；步骤4：采用训练好的基于注意力机制的VGG卷积神经网络模型对图像进行分类。本发明专利技术能够提高图像分类精度。本发明专利技术能够提高图像分类精度。本发明专利技术能够提高图像分类精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进的VGG卷积神经网络模型的图像分类方法

[0001]本专利技术属于图像分类领域。

技术介绍

[0002]由于硬件技术的飞速发展，深度学习在计算机视觉方面获得了极大的关注。作为深度学习的一个分支，卷积神经网络在处理图像时，表现出了极强的处理能力。在图像分类方面，卷积神经网络，如VGG，ResNet，以一种端到端的方式实现图像从提取特征再到分类的监督学习过程。然而，卷积神经网络由大量的卷积层实现特征从低级到高级语义的转换。其中不可避免的会有大量特征冗余，注意力机制旨在让卷积神经网络有效的学习有用信息，剔除多余信息，即网络更加注重鲜明特征，抑制冗余特征。但通道注意力SENet通过全局平均池化获取全局关系，却损失了很多空间信息。混合注意力BAM试图在空间域和通道域各自建立注意力，在空间域上采用卷积核获取局部感受野，全局依赖关系仍然很难获取。

技术实现思路

[0003]专利技术目的：为了解决上述现有技术存在的问题，本专利技术提供了一种基于改进的VGG卷积神经网络模型的图像分类方法。
[0004]技术方案：本专利技术提供了一种基于改进的VGG卷积神经网络模型的图像分类方法，具体包括如下步骤：
[0005]步骤1：建立注意力机制；
[0006]步骤2：在VGG卷积神经网络模型中添加注意力机制，从而得到基于注意力机制的VGG卷积神经网络模型；
[0007]步骤3：预设训练集和测试集，对训练集和测试集中的图像进行预处理，采用预处理后的训练集对基于注意力机制的VGG卷积神经网络...

【技术保护点】

【技术特征摘要】
1.一种基于改进的VGG卷积神经网络模型的图像分类方法，其特征在于，具体包括如下步骤：步骤1：建立注意力机制；步骤2：在VGG卷积神经网络模型中添加注意力机制，从而得到基于注意力机制的VGG卷积神经网络模型；步骤3：预设训练集和测试集，对训练集和测试集中的图像进行预处理，采用预处理后的训练集对基于注意力机制的VGG卷积神经网络模型进行训练，并采用预处理后的测试集测试基于注意力机制的VGG卷积神经网络模型的分类结果，从而调整基于注意力机制的VGG卷积神经网络模型的参数；当训练次数达到预设的最大迭代次数或者基于注意力机制的VGG卷积神经网络模型收敛，则停止训练得到最后训练好的基于注意力机制的VGG卷积神经网络模型；步骤4：采用步骤3中训练好的基于注意力机制的VGG卷积神经网络模型对图像进行分类。2.根据权利要求1所述的一种基于改进的VGG卷积神经网络模型的图像分类方法，其特征在于，所述步骤1中注意力机制模块包括平均池化层，第一维度置换模块，第一自注意力模块，第二维度置换模块，第二自注意力模块，归一化层和校准模块；所述平均池化层对输入至注意力机制的特征在空间上进行平均池化得到C为输入特征的通道数，H表示输入特征的空间高度，W表示输入特征的空间宽度；所述第一维度置换模块对进行维度置换具体为：将在空间上平均分为Q个特征组，一组中有P个元素，P和Q均为超参数且P
×
Q＝H
×
W；将Q个特征组中第t个元素组成第t个列向量所述第一自注意力模块的个数为P个，将作为第t个第一自注意力模块的输入，得到输出输出其中
·
为内积，Softmax为概率分布的函数，为转置符号；所述第二维度置换模块对Z
L
进行维度置换具体为：将Z
L...

【专利技术属性】
技术研发人员：刘一柳，王志胜，马瑞，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人