一种利用DCGAN提高基于CNN图像识别性能的方法技术

技术编号:19178746 阅读:1061 留言:0更新日期:2018-10-17 00:37
本发明专利技术公开了一种利用DCGAN提高基于CNN图像识别性能的方法,该方法将DCGAN出色的数据生成能力与基于CNN图像识别框架进行了二度结合,并且DCGAN是在GAN的基础上经过改进后的新型对抗生成网络,所述方法将CNN应用到了原始结构中,使得GAN具有了深度卷积的特性,并在数据生成方面拥有更好的特征表示形式。本发明专利技术很好的解决了图像识别过程中训练样本数据难以收集、样本相似度过大等问题,冲破了样本数量与质量在分类模型优化问题上的限制,进一步强化分类模型,提高图像识别的准确性。

A method of improving the performance of CNN based image recognition using DCGAN

The invention discloses a method for improving CNN image recognition performance by using DCGAN. The method combines the excellent data generation ability of DCGAN with the CNN-based image recognition framework, and DCGAN is a new type of antagonistic generation network improved on the basis of GAN. The method applies CNN to the original structure. In this way, GAN has the characteristics of deep convolution, and has a better feature representation in data generation. The invention solves the problems of difficult collection of training sample data and excessive similarity of sample in the process of image recognition, breaks through the limitation of sample quantity and quality in the optimization of classification model, further strengthens classification model and improves the accuracy of image recognition.

【技术实现步骤摘要】
一种利用DCGAN提高基于CNN图像识别性能的方法
本专利技术属于图像识别处理,具体涉及一种基于深度机器学习的图像识别改进,尤其涉及一种利用DCGAN提高基于CNN图像识别性能的方法。
技术介绍
随着深度学习的发展,人们越来越追求图像识别的精确度。目前,很多研究都采用了卷积神经网络(CNN)作为切入点来提高图像识别的精度。CNN可以直接使用图像的原始像素作为输入,不必先提取特征,另外,CNN训练的模型对放缩、平移、旋转等畸变具有不变性,具有很强的泛化能力。其中卷积的局部感知和权值共享性可以大幅度减少神经网络的参数量,防止过拟合的同时又降低了神经网络模型的复杂度,给予了分类精准度很大的优化空间。本专利技术所研究的雷达剖面图主要由光谱、色块等底层语义组成。传统方法例如纹理检测、统计学方法等对于这种特殊的图像并不能发挥太多优势,原因主要有以下三点:1、无法有效学习雷达剖面图内在的特征,包括像素点的分布和渐变等;2、雷达剖面图包含信息量太大,传统方法处理过慢,无法解决大数据问题;3、缺乏高效的学习策略,难以提高识别的准确性。CNN的上层对语义更敏感,而中间层则特别敏感于底层模式,如颜色和梯度,因此使用CNN解决雷达剖面图识别问题是一个科学且可行的实践。CNN图像分类大多数都是基于有监督学习,这种学习方式在训练过程中需要大量的数据作为训练样本才能得到比较精确的分类。在雷达剖面图识别过程中,由于天气条件的限制,导致像雷雨大风等灾害天气的样本收集工作异常艰难。不仅如此,样本间过度的相似性也会影响训练效果,导致特征难以被有效学习。针对样本数量少和样本过度相似度的问题,我们采用设计深度卷积生成对抗网络(DCGAN)的方法来解决。DCGAN的实质是在GAN的基础上实现拓展,保留了出色生成数据能力的同时,也融合了CNN特征提取的优点,使它在图像分析和处理能力上得到提升。本专利技术tchNormalization实现局部归一化,从而解决了网络模型在训练时梯度消失和梯度弥散等问题。经检测,DCGAN在celebA、LSUN和GoogleImageNet这种现实世界的真实大规模数据集上训练,结果令人满意。本专利技术基于DCGAN的网络结构进行样本生成操作,并结合基于CNN的图像识别系统有效提高了识别的准确度,使得DCGAN与CNN的二次结合能更好地为科研、生产和决策服务。
技术实现思路
专利技术目的:针对上述现有技术的不足,本专利技术提供一种利用DCGAN提高基于CNN图像识别性能的方法,该方法将DCGAN出色的数据生成能力与基于CNN图像识别框架进行了二度结合,很好的解决了图像识别过程中训练样本数据难以收集、样本相似度过大等问题,冲破了样本数量与质量在分类模型优化问题上的限制、强化分类模型、提高图像识别的准确性。技术方案:一种利用DCGAN提高基于CNN图像识别性能的方法,步骤如下:(1)定义DCGAN中生成模型和判别模型的结构;(2)建立学习率加速策略;(3)生成样本检测;(4)构建基于CNN的图像识别框架;(5)性能优化。进一步的,步骤(1)中所述的生成模型包括数据转化层和反卷积层,所述数据转化层和反卷积层之间的激活函数为LeakyReLu函数。数据转化层主要将噪声向量通过reshape方法转化为图像类型的向量。反卷积将数据维度进一步转化为图像格式,之间都使用LeakyReLu作为激活函数。进一步的,步骤(1)所述的判别模型包括卷积层和全连接层,所述卷积层和全连接层之间激活函数为ReLu函数,所述全连接层末端使用Sigmoid或SoftMax函数做二分类;优选的,识别模型包括四层卷积层和全连接层。更进一步的,步骤(1)包括训练生成器G,所述的生成器具有能生成与真实样本相差无几数据的能力。其作用是把一个噪声包装成另一个逼真的样本,使得判别器误认为是真实样本。判别器D是一个二分类器,用于判断样本的真伪,是生成器学习的来源。进一步的,步骤(1)包括建立网络损失函数,所述的网络损失函数包括网络总体损失函数、生成模型损失函数和判别模型损失函数,定义如下:所述网络总体损失函数计算表公式如下:所述生成模型损失函数计算表公式如下:LOSS(G)=-(log(D2(G(z))));所述判别模型损失函数计算表公式如下:LOSS(D)=-(log(D1(x))+log(1-D2(G(z))));其中:D(x)为根据数据x的判别函数,G(z)为根据噪声z的生成函数;表示x来源于数据概率分布,同理中z来源于噪声分布;D1(x)与D2(x)运算方式是等价的。进一步的,步骤(2)包括使用mini-batch梯度下降的方式优化网络参数,所述的网络参数包括批量大小batch,迭代次数epoch,学习率α,需要调整的权重和偏置值W和b,以及优化梯度下降法时所要增加的动量因子m和v。进一步的,步骤(2)具体包括以下步骤:(21)设置学习率,所述学习率初始值范围为[0.9,1.0],其反向传播更新权值和偏置值遵循如下计算公式:W=W-α(学习率)·[损失函数对权值求偏导的值],其中,W表示更新权值或偏置值,α为学习率;(22)通过迭代逐步减少学习率,在每次循环中调用反向传播机制来调整权值和偏置值,进而求取损失函数的最小值,将学习率衰减幅度放入迭代操作中,其学习率衰减策略减遵循如下公式:其中:decay_rate大小取0.1到1.0范围,epochi为第i次迭代训练,α0为初始学习率,取值范围为0.1到1.0。进一步的,步骤(4)中的识别模型采用4层卷积层和3层全连接层的神经网络,输出的结果为四种分类,分别为有雨有风类、有雨无风类、无雨有风类和无雨无风类。有益效果:本专利技术相比现有技术,其显著地效果在于:第一,本专利技术将DCGAN出色的数据生成能力与基于CNN图像识别框架进行了二度结合,很好的解决了图像识别过程中训练样本数据难以收集、样本相似度过大等问题;第二,可以自动学习雷达剖面图中的隐藏细节,不必通过手工提取;第三,能够应对大数据批量处理问题;第四,冲破了样本数量与质量在分类模型优化问题上的限制,通过有效的算法,多次训练逐步提高图像识别的准确性。附图说明图1是本专利技术方法系统流程图;图2是本专利技术自定义DCGAN的结构;图3是本专利技术样本数据中真实图像与生成图像效果;图4是本专利技术识别模型框架图;图5是本专利技术四类的概率化结果示意图;图6是本专利技术识别网络与原始CNN性能对比图;图7是本专利技术识别框架预训练后的4分类结果示意图;图8是本专利技术模型强化后的识别结果示意图。具体实施方式为了详细的说明本专利技术公开的技术方案,下面结合说明书附图和具体实施理做进一步的阐述。本专利技术主要针对雷达剖面图像做识别。雷达剖面图不同于一般物体图像,它是靠类似于光谱的区域分布以及颜色来描述类别的,因此这种级别的语义利用CNN可以更好的进行特征提取。在识别系统中,提取特征后还需进行具体的分类。为了使特征提取与分类归一化,本专利技术没有使用传统的SVM作为分类器,而是通过全连接层和Softmax进行分类操作。本专利技术公开的是一种利用DCGAN提高基于CNN图像识别性能的方法,该方法的系统流程图如图1所示,具体步骤如下:步骤1:构建自定义DCGAN根据训练数据的规模,自定义DCGAN中生成模型和判别模型的结构,其中包括参数设定和深本文档来自技高网
...

【技术保护点】
1.一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:包括以下步骤:(1)定义DCGAN中生成模型和判别模型的结构;(2)建立学习率加速策略;(3)生成样本检测;(4)构建基于CNN的图像识别框架;(5)性能优化。

【技术特征摘要】
1.一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:包括以下步骤:(1)定义DCGAN中生成模型和判别模型的结构;(2)建立学习率加速策略;(3)生成样本检测;(4)构建基于CNN的图像识别框架;(5)性能优化。2.根据权利要求1所述的一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:步骤(1)中所述的生成模型包括数据转化层和反卷积层,所述数据转化层和反卷积层的激活函数为LeakyReLu函数。3.根据权利要求1所述的一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:步骤(1)所述的判别模型包括卷积层和全连接层,所述卷积层和全连接层之间激活函数为ReLu函数,所述全连接层末端二分类函数为Sigmoid或SoftMax函数。4.根据权利要求1所述的一种利用DCGAN提高基于CNN图像识别性能的方法,其特征在于:步骤(1)包括建立网络损失函数,所述的网络损失函数包括网络总体损失函数、生成模型损失函数和判别模型损失函数,上述函数表达式定义如下所示:所述网络总体损失函数表达式如下:所述生成模型损失函数表达式如下:LOSS(G)=-(log(D2(G(z))));所述判别模型损失函数表达式如下:LOSS(D)=-(log(D1(x))+log(1-D2(G(z))));其中:D(x)为根据数据x的判别函数,G(z)为根据噪声z的生成函数,表示x来源于数...

【专利技术属性】
技术研发人员:方巍张飞鸿丁叶文
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1