基于生成对抗网络和注意力网络的细粒度图像分类方法技术

技术编号：22817678 阅读：40 留言：0更新日期：2019-12-14 13:21

本发明专利技术公开了一种基于生成对抗网络和注意力网络的细粒度图像分类方法，确定图像分类类别，建立相应类别的训练图像集；设计图像细粒度分类的深度注意力卷积网络，该网络包含VGG16全卷积层、SS注意力区域生成、空间金字塔池化层ROI pooling layer、整体与局部特征结合分类全连接层四部分；设计生成对抗网络DAC‑GAN的结构，生成网络与判别网络；使用训练样本集，进行训练DAC‑GAN网络，保存判别网络模型；使用判别网络模型，进行图像类别进行分类预测。本发明专利技术提高了图像分类网络的准确度，解决了小样本量的数据不足的问题。

Fine-grained image classification method based on generative countermeasure network and attention network

全部详细技术资料下载

【技术实现步骤摘要】
基于生成对抗网络和注意力网络的细粒度图像分类方法
本专利技术涉及一种细粒度图像分类方法，特别是一种基于生成对抗网络和注意力网络的细粒度图像分类方法，属于图像处理领域。
技术介绍
随着深度学习的技术研究深入，卷积神经网络(CNN)作为神经网络的一种，它能够提取输入的不同特征并进行分类，准确度不断提高，由80%提升到95%。CNN的网络结构由输入层、卷积层、池化层和全连接层、输出层组成。其中，卷积层通过卷积操作提取输入的不同特征，浅层的卷积层提取诸如边缘、线条的低级特征，深层的卷积层提取高级特征；池化层接在卷积层之后，对局部接受域进行池化操作以获取具有空间不变性的特征；全连接层一般位于多个卷积层和池化层之后，整合卷积层或池化层中具有类别区分性的局部信息。卷积神经网络在图像分类上取得了良好的成果，但目前的分类比较粗，在大类下细分的子类间分类识别率较低。细粒度图像分析任务相对通用图像任务的区别和难点在于其图像所属类别的粒度更为精细。通用图像分类其任务诉求是将物体大类分开，可见无论从样貌、形态等方面，二者还是能很容易被区分；而细粒度图像分类任务则要求对一个类类别下细粒度的子类图像分辨开来。相同的子类中物体的动作姿态可能大不相同，不同的子类中物体可能又有着相同的动作姿态，这是识别的一大难点。正因同类别物种的不同子类往往仅在耳朵形状、毛色等细微处存在差异，可谓“差之毫厘，谬以千里”。不止对计算机，对普通人来说，细粒度图像任务的难度和挑战无疑也更为巨大。因此，细粒度图像识别作为现在图像分类中一个颇具挑战性的任务，它的目标是在...

【技术保护点】
1.一种基于生成对抗网络和注意力网络的细粒度图像分类方法，其特征在于包含以下步骤：/n步骤一：确定图像分类类别，建立相应类别的训练图像集；/n步骤二：设计图像细粒度分类的深度注意力卷积网络，该网络包含VGG16全卷积层、SS注意力区域生成、空间金字塔池化层ROI pooling layer、整体与局部特征结合分类全连接层四部分；/n步骤三：设计生成对抗网络DAC-GAN的结构，生成网络与判别网络；/n步骤四：使用训练样本集，进行训练DAC-GAN网络，保存判别网络模型；/n步骤五：使用判别网络模型，进行图像类别进行分类预测。/n

【技术特征摘要】
1.一种基于生成对抗网络和注意力网络的细粒度图像分类方法，其特征在于包含以下步骤：
步骤一：确定图像分类类别，建立相应类别的训练图像集；
步骤二：设计图像细粒度分类的深度注意力卷积网络，该网络包含VGG16全卷积层、SS注意力区域生成、空间金字塔池化层ROIpoolinglayer、整体与局部特征结合分类全连接层四部分；
步骤三：设计生成对抗网络DAC-GAN的结构，生成网络与判别网络；
步骤四：使用训练样本集，进行训练DAC-GAN网络，保存判别网络模型；
步骤五：使用判别网络模型，进行图像类别进行分类预测。

2.按照权利要求1所述的基于生成对抗网络和注意力网络的细粒度图像分类方法，其特征在于：所述步骤一具体为
1.1确定要分类图像类别的清单；
1.2对每个类别建立图像文件夹，向文件夹收集包含目标的图像，基本保证每种类别图像样本数至少为10000张；
1.3使用目标检测的方法，将目标从图像中检测其位置,基于位置将各个子类别图像从全局图像中分割出来。

3.按照权利要求1所述的基于生成对抗网络和注意力网络的细粒度图像分类方法，其特征在于：所述步骤二中
VGG16全卷积层：基于经典的VGG16模型，该网络一共有五段卷积，每段卷积之后紧接着最大池化层；深度网络中LRN的作用并不明显，去掉了LRN层；采用更小的卷积核3x3；池化核变小，VGG中的池化核是2x2，stride为2；VGG是一个良好的特征提取器，充分利用其卷积部分；
SS注意力区域生成：采用SelectiveSearch策略生成200个局部区域；首先图像上n个预分割的区域,R={R1,R2,...,Rn}，计算每个reg...

【专利技术属性】
技术研发人员：车少帅，刘大伟，胡笳，
申请(专利权)人：江苏鸿信系统集成有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人