一种基于改进的VGG卷积神经网络模型的图像分类方法技术

技术编号:30321177 阅读:17 留言:0更新日期:2021-10-09 23:43
本发明专利技术公开了一种基于改进的VGG卷积神经网络模型的图像分类方法,包括:步骤1:建立注意力机制模块;步骤2:在VGG卷积神经网络模型中添加注意力机制,得到基于注意力机制的VGG卷积神经网络模型;步骤3:采用预处理后的训练集对基于注意力机制的VGG卷积神经网络模型进行训练,采用预处理后的测试集测试基于注意力机制的VGG卷积神经网络模型的分类结果;当训练次数达到预设的最大迭代次数或者基于注意力机制的VGG卷积神经网络模型收敛,则停止训练得到最后训练好的基于注意力机制的VGG卷积神经网络模型;步骤4:采用训练好的基于注意力机制的VGG卷积神经网络模型对图像进行分类。本发明专利技术能够提高图像分类精度。本发明专利技术能够提高图像分类精度。本发明专利技术能够提高图像分类精度。

【技术实现步骤摘要】
一种基于改进的VGG卷积神经网络模型的图像分类方法


[0001]本专利技术属于图像分类领域。

技术介绍

[0002]由于硬件技术的飞速发展,深度学习在计算机视觉方面获得了极大的关注。作为深度学习的一个分支,卷积神经网络在处理图像时,表现出了极强的处理能力。在图像分类方面,卷积神经网络,如VGG,ResNet,以一种端到端的方式实现图像从提取特征再到分类的监督学习过程。然而,卷积神经网络由大量的卷积层实现特征从低级到高级语义的转换。其中不可避免的会有大量特征冗余,注意力机制旨在让卷积神经网络有效的学习有用信息,剔除多余信息,即网络更加注重鲜明特征,抑制冗余特征。但通道注意力SENet通过全局平均池化获取全局关系,却损失了很多空间信息。混合注意力BAM试图在空间域和通道域各自建立注意力,在空间域上采用卷积核获取局部感受野,全局依赖关系仍然很难获取。

技术实现思路

[0003]专利技术目的:为了解决上述现有技术存在的问题,本专利技术提供了一种基于改进的VGG卷积神经网络模型的图像分类方法。
[0004]技术方案:本专利技术提供了一种基于改进的VGG卷积神经网络模型的图像分类方法,具体包括如下步骤:
[0005]步骤1:建立注意力机制;
[0006]步骤2:在VGG卷积神经网络模型中添加注意力机制,从而得到基于注意力机制的VGG卷积神经网络模型;
[0007]步骤3:预设训练集和测试集,对训练集和测试集中的图像进行预处理,采用预处理后的训练集对基于注意力机制的VGG卷积神经网络模型进行训练,并采用预处理后的测试集测试基于注意力机制的VGG卷积神经网络模型的分类结果,从而调整基于注意力机制的VGG卷积神经网络模型的参数;当训练次数达到预设的最大迭代次数或者基于注意力机制的VGG卷积神经网络模型收敛,则停止训练得到最后训练好的基于注意力机制的VGG卷积神经网络模型;
[0008]步骤4:采用步骤3中训练好的基于注意力机制的VGG卷积神经网络模型对图像进行分类。
[0009]进一步的,所述步骤1中注意力机制模块包括平均池化层,第一维度置换模块,第一自注意力模块,第二维度置换模块,第二自注意力模块,归一化层和校准模块;
[0010]所述平均池化层对输入至注意力机制的特征在空间上进行平均池化得到C为输入特征的通道数,H表示输入特征的空间高度,W表示输入特征的空间宽度;
[0011]所述第一维度置换模块对进行维度置换具体为:将在空间上平均分为Q个特征组,一组中有P个元素,P和Q均为超参数且P
×
Q=H
×
W;将Q个特征组中第t个元素组成第t个
列向量
[0012]所述第一自注意力模块的个数为P个,将作为第t个第一自注意力模块的输入,得到输出
[0013][0014]其中
·
为内积,Softmax为概率分布的函数,为转置符号;
[0015]所述第二维度置换模块对Z
L
进行维度置换具体为:将Z
L
在空间上平均分为P个特征组,一组中有Q个元素,将P个特征组中第k个元素组成第k个列向量组,一组中有Q个元素,将P个特征组中第k个元素组成第k个列向量
[0016]所述第二自注意力模块的个数为Q个,将输入至第k个第二自注意力模块,得到第k个第二自注意力模块的输出:
[0017][0018]其中,
[0019]所述归一化层采用sigmoid函数对Y
S
进行归一化,得到进行归一化,得到
[0020]所述校准模块对输入特征U按照如下公式进行校准,最终得到注意力机制的输出
[0021][0022]其中表示对和U中相应空间位置相乘,并沿着通道方向传播。
[0023]进一步的,所述步骤2中的基于注意力机制的VGG卷积神经网络模型包括:依次连接的第一特征提取模块,第二特征提取模块,第三特征提取模块,第四特征提取模块,第五特征提取模块,全连接层和Softmax分类器;所述第一、二特征提取模块结构相同均包括依次连接的第一卷积操作模块,第二卷积操作模块,第一注意力机制和第一最大池化层;所述第三特征提取模块包括依次连接的第三卷积操作模块,第四卷积操作模块,第五卷积操作模块,第二注意力机制和第二最大池化层;所述第四、五特征提取模块结构相同均包括依次连接的第六卷积操作模块,第七卷积操作模块,第八卷积操作模块和第三最大池化层;所述第一~八卷积操作模块的结构相同均包括依次连接的卷积层,ReLU激活函数和批量归一化层;所述第一、二注意力机制均为步骤1中的注意力机制。
[0024]进一步的,所述步骤3中预处理具体为对训练集和测试集中的每个图像依次进行水平翻转,镜像,裁剪以及标准归一化。
[0025]有益效果:
[0026]1、本专利技术在VGG卷积神经网络中引入了注意力机制,使得卷积神经网络可以更有
效地注重有用信息,剔除冗余信息,从而提高了网络分辨特征的能力。
[0027]2、本专利技术的注意力机制在空间域中利用长短距离两次形成自注意力分组,最终建立全局依赖关系,能够更好的获取上下文信息。
[0028]3、卷积神经网络中的卷积是一种获取局部关系的操作,感受野受到限制,而本专利技术的注意力机制通过长短距离关系结合的方式获得了全局关系,感受野的范围为整个特征图的大小,弥补了VGG卷积神经网络中卷积局部性的缺陷,使得网络获得更好的上下文信息,提高了网络分类的性能。
附图说明
[0029]图1是本专利技术的注意力机制的网络模型图。
[0030]图2是基于注意力机制的VGG卷积神经网络分类模型结构图。
具体实施方式
[0031]构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0032]本实施例提供了一种基于改进的VGG卷积神经网络模型的图像分类方法,包括以下步骤:
[0033](1)从CIFAR

10数据集中获取带有标签的自然彩色图像,将所有图像进行预处理,并将数据集分为训练集和测试集。本实施例的训练集中有10种不同类型的图像。
[0034](2)将注意力机制与VGG卷积神经网络模型结合,得到一种基于注意力机制的VGG卷积神经网络。
[0035](3)将预处理后的训练集的图像输入基于注意力机制的VGG的卷积神经网络中,同时对网络参数进行调节,完成网络模型训练。之后将测试集的图像输入到已经训练完成的网络模型中,通过分类准确性这一指标来评估网络模型的优劣;最后采用训练好的基于注意力机制的VGG卷积神经网络模型对图像进行分类。
[0036]所述步骤1中对图像预处理为依次将图像水平翻转,镜像,裁剪以及标准归一化。目的是数据增强,提高泛化能力。
[0037]所述步骤2中将注意力机制与VGG卷积神经网络模型结合步骤,具体是将注意力机制嵌入到VGG卷积神经网络模型中。其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的VGG卷积神经网络模型的图像分类方法,其特征在于,具体包括如下步骤:步骤1:建立注意力机制;步骤2:在VGG卷积神经网络模型中添加注意力机制,从而得到基于注意力机制的VGG卷积神经网络模型;步骤3:预设训练集和测试集,对训练集和测试集中的图像进行预处理,采用预处理后的训练集对基于注意力机制的VGG卷积神经网络模型进行训练,并采用预处理后的测试集测试基于注意力机制的VGG卷积神经网络模型的分类结果,从而调整基于注意力机制的VGG卷积神经网络模型的参数;当训练次数达到预设的最大迭代次数或者基于注意力机制的VGG卷积神经网络模型收敛,则停止训练得到最后训练好的基于注意力机制的VGG卷积神经网络模型;步骤4:采用步骤3中训练好的基于注意力机制的VGG卷积神经网络模型对图像进行分类。2.根据权利要求1所述的一种基于改进的VGG卷积神经网络模型的图像分类方法,其特征在于,所述步骤1中注意力机制模块包括平均池化层,第一维度置换模块,第一自注意力模块,第二维度置换模块,第二自注意力模块,归一化层和校准模块;所述平均池化层对输入至注意力机制的特征在空间上进行平均池化得到C为输入特征的通道数,H表示输入特征的空间高度,W表示输入特征的空间宽度;所述第一维度置换模块对进行维度置换具体为:将在空间上平均分为Q个特征组,一组中有P个元素,P和Q均为超参数且P
×
Q=H
×
W;将Q个特征组中第t个元素组成第t个列向量所述第一自注意力模块的个数为P个,将作为第t个第一自注意力模块的输入,得到输出输出其中
·
为内积,Softmax为概率分布的函数,为转置符号;所述第二维度置换模块对Z
L
进行维度置换具体为:将Z
L...

【专利技术属性】
技术研发人员:刘一柳王志胜马瑞
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1