一种基于VGG深度卷积网络的自然场景图像识别方法技术

技术编号:18668590 阅读:21 留言:0更新日期:2018-08-14 20:43
本发明专利技术提供了一种基于VGG深度卷积网络的自然场景图像识别方法,本发明专利技术方法通过在VGG19网络前两个最大池化层前分别加入BatchNorm策略,使训练网络更容易拟合;通过训练好的网络在训练样本和验证样本上作检测,以类别概率区间为节点对样本重新细分类,并对细分样本进行增广重训练,达到精细区分不同自然场景图像,提高难分场景和错分场景的识别率,进而提高整个网络对自然场景图像的识别率。

A natural scene image recognition method based on VGG deep convolutional network

The invention provides an image recognition method for natural scenes based on VGG depth convolution network, in which BatchNorm strategy is added in front of the first two largest pool layers of VGG 19 network to make the training network easier to fit, and the training sample and the verification sample are detected by the trained network to obtain the class probability region. In order to distinguish different natural scenes, the recognition rate of difficult scenes and wrong scenes is improved, and then the recognition rate of natural scenes is improved.

【技术实现步骤摘要】
一种基于VGG深度卷积网络的自然场景图像识别方法
本专利技术属于图像目标识别领域,具体涉及一种基于VGG深度卷积网络的自然场景图像识别方法。
技术介绍
自然场景目标识别在图像视频检索、旅游导航、城区监控及规划等方面都有着非常重要的应用。然而,不同于一般具有较为固定几何特征的目标,自然场景图像目标更为复杂,往往由多类小目标构成一类场景,不同场景的复杂性和多变性无疑增加了分类识别难度,特别对于相似的不同类场景。目前对于自然场景图像分类方法主要为基于低层特征结合传统机器学习分类器的方法和基于卷积神经网络的机器学习方法。前者一般需要人为构造有效底层特征,如颜色特征:颜色直方图、颜色矩、颜色相关图等,形状特征:HOG、SIFT、BOVW等,纹理特征:LBP、灰度共生矩阵等,然后将提取得到的特征送入分类器(如贝叶斯分类器、支持向量机等)进行分类识别。此类方法对一些简单场景目标往往有较好的识别率,然而,其构造的低层特征对场景描述不够精细,很难对所有场景(特别是复杂场景)都能有效适应,且传统分类器对场景目标拟合能力也有限,导致此类方法泛化能力不足,在很多场景下的目标分类识别很难得到较高的精度。基于卷积神经网络的机器学习方法以其强大的特征提取和场景目标拟合能力,成为近年来图像各领域都使用较为热门的方法,此方法不需要人为进行针对性的设计特征,而是通过逐层卷积、池化交替的方式由低层特征逐渐构造高级复杂语义特征,对图像目标或场景有较强的特征描述能力,因此在图像分类识别领域获得了较高的识别率。然而,对于较为相似的难分的不同类型目标或场景,单纯的深度卷积网络对于小数据集仍然会有较高的误识别率。
技术实现思路
有鉴于此,本专利技术提供了一种基于VGG深度卷积网络的自然场景图像识别方法,能够解决复杂自然场景图像识别率不高,特别是难分场景的识别率较低的问题。实现本专利技术的技术方案如下:一种基于VGG深度卷积网络的自然场景图像识别方法,包括以下步骤:步骤一、对n类样本Si,i=1,2,...,n进行数据增广,将增广后的样本分成训练样本集Ii和验证样本集Ii;步骤二、在经数据集训练过的VGG19网络的前两个最大池化层前分别加入BatchNorm批量标准化策略;步骤三、对步骤二得到的网络设置网络学习率和每批次的训练数据量得到改进后的VGG19网络,利用改进后的VGG19网络对训练样本集Ii进行迁移学习训练,并对验证样本集Ii进行验证;步骤四、根据步骤三中的训练精度、验证精度和损失函数曲线选择相对最优一代训练网络参数代入改进后的VGG19网络得到识别网络I,利用识别网络I对每类样本进行检测识别,记录每个样本的正确识别概率;步骤五、根据每个样本的正确识别概率将每类样本分成q小类,并将错分样本加入到正确识别概率最低区间类别;步骤六、根据每一小类数据量情况对每一小类样本进行数据增广,并对增广后的每一小类样本随机分成训练样本集IIj、验证样本集IIj和测试样本集j,j=1,2,...,qn;步骤七、冻结识别网络I的卷积层的网络参数,以只调节识别网络I的全连接层网络参数的方式训练训练样本集IIj,并验证验证样本集IIj;步骤八、根据步骤七中的训练精度、验证精度和损失函数曲线选择相对最优代训练网络参数代入识别网络I构成识别网络II,利用识别网络II对测试样本集j进行识别。进一步地,所述数据增广为利用旋转、平移和微小扭曲的仿射变换及亮度、对比度变换的方法进行数据增广。进一步地,步骤二中加入BatchNorm批量标准化策略具体为:对训练中某个batch数据xp,P∈[1,m],计算均值μ和标准差σ,利用均值μ和标准差σ对xp进行归一化得到然后作线性变换得到输出结果。有益效果:1.本专利技术对VGG19网络加入BatchNorm策略,能有效针对小数据集,防止网络在训练参数调优时陷入局部最优状态,从而使网络快速拟合收敛,得到更优的识别网络。2.本专利技术针对难分样本,以训练网络本身对所有样本进行识别检测,以识别概率区间为标准对样本进行细分再训练,有效提高了难分场景的识别能力,进而提高了整个网络针对具体场景的识别准确率。附图说明图1为本专利技术方法流程图。图2(a)为Google光学遥感图像UCMercedLandUse数据集中森林样本图片。图2(b)为Google光学遥感图像UCMercedLandUse数据集中森林样本图片。图3(a)为Google光学遥感图像UCMercedLandUse数据集中河流样本图片。图3(b)为Google光学遥感图像UCMercedLandUse数据集中河流样本图片。图4(a)为Google光学遥感图像UCMercedLandUse数据集中密集居民区样本图片。图4(b)为Google光学遥感图像UCMercedLandUse数据集中密集居民区样本图片。图5(a)为Google光学遥感图像UCMercedLandUse数据集中活动房屋公园样本图片。图5(b)为Google光学遥感图像UCMercedLandUse数据集中活动房屋公园样本图片。图6(a)为Google光学遥感图像UCMercedLandUse数据集中交叉路口样本图片。图6(b)为Google光学遥感图像UCMercedLandUse数据集中交叉路口样本图片。图7(a)为Google光学遥感图像UCMercedLandUse数据集中天桥样本图片。图7(b)为Google光学遥感图像UCMercedLandUse数据集中天桥样本图片。具体实施方式下面结合附图并举实施例,对本专利技术进行详细描述。本专利技术提供了一种基于VGG深度卷积网络的自然场景图像识别方法,本专利技术方法通过在VGG19网络前两个最大池化层前分别加入BatchNorm策略,使训练网络更容易拟合;通过训练好的网络在训练样本和验证样本上作检测,以类别概率区间为节点对样本重新细分类,并对细分样本进行增广重训练,达到精细区分不同自然场景图像,提高难分场景和错分场景的识别率,进而提高整个网络对自然场景图像的识别率。具体包括以下步骤:步骤一、对n类样本Si,i=1,2,...,n进行数据增广,将数据增广后的每类样本均分成训练样本集I和验证样本集I,即得到训练样本集Ii和验证样本集Ii;根据图1的流程图,选择Google光学遥感图像UCMercedLandUse数据集中森林、河流、密集居民区、活动房屋公园、十字路口、天桥6类自然场景作为目标样本,如图2(a)—图7(b)所示,并进行数据增广,然后将每类样本分成训练样本集和验证样本集。具体为:步骤1.1、数据集中每类样本有100幅图像,通过旋转、平移、缩放等仿射变换和亮度、对比度变换等操作将每类场景样本增广1倍。步骤1.2、以7:1的比例将每类样本分成训练样本集和验证样本集,并将二者置乱打包成网络需要的数据格式(本文是.rec数据格式)。步骤二、在经数据集训练过的VGG19网络的前两个最大池化层前分别加入BatchNorm批量标准化策略;在经ImageNet大数据集训练过的VGG19网络前两个最大池化层前分别加入BatchNorm(批量标准化)策略。即对训练中某个batch数据xP,P∈[1,m],有:其中,μ为均值,σ2为方差,为xp进行标准化后的结果,为xp对应的BatchNorm后的最终本文档来自技高网
...

【技术保护点】
1.一种基于VGG深度卷积网络的自然场景图像识别方法,其特征在于,包括以下步骤:步骤一、对n类样本Si,i=1,2,...,n进行数据增广,将增广后的样本分成训练样本集Ii和验证样本集Ii;步骤二、在经数据集训练过的VGG19网络的前两个最大池化层前分别加入BatchNorm批量标准化策略;步骤三、对步骤二得到的网络设置网络学习率和每批次的训练数据量得到改进后的VGG19网络,利用改进后的VGG19网络对训练样本集Ii进行迁移学习训练,并对验证样本集Ii进行验证;步骤四、根据步骤三中的训练精度、验证精度和损失函数曲线选择相对最优一代训练网络参数代入改进后的VGG19网络得到识别网络I,利用识别网络I对每类样本进行检测识别,记录每个样本的正确识别概率;步骤五、根据每个样本的正确识别概率将每类样本分成q小类,并将错分样本加入到正确识别概率最低区间类别;步骤六、根据每一小类数据量情况对每一小类样本进行数据增广,并对增广后的每一小类样本随机分成训练样本集IIj、验证样本集IIj和测试样本集j,j=1,2,...,qn;步骤七、冻结识别网络I的卷积层的网络参数,以只调节识别网络I的全连接层网络参数的方式训练训练样本集IIj,并验证验证样本集IIj;步骤八、根据步骤七中的训练精度、验证精度和损失函数曲线选择相对最优代训练网络参数代入识别网络I构成识别网络II,利用识别网络II对测试样本集j进行识别。...

【技术特征摘要】
1.一种基于VGG深度卷积网络的自然场景图像识别方法,其特征在于,包括以下步骤:步骤一、对n类样本Si,i=1,2,...,n进行数据增广,将增广后的样本分成训练样本集Ii和验证样本集Ii;步骤二、在经数据集训练过的VGG19网络的前两个最大池化层前分别加入BatchNorm批量标准化策略;步骤三、对步骤二得到的网络设置网络学习率和每批次的训练数据量得到改进后的VGG19网络,利用改进后的VGG19网络对训练样本集Ii进行迁移学习训练,并对验证样本集Ii进行验证;步骤四、根据步骤三中的训练精度、验证精度和损失函数曲线选择相对最优一代训练网络参数代入改进后的VGG19网络得到识别网络I,利用识别网络I对每类样本进行检测识别,记录每个样本的正确识别概率;步骤五、根据每个样本的正确识别概率将每类样本分成q小类,并将错分样本加入到正确识别概率最低区间类别;步骤六、根据每一小类数据量情况对每一小类样本进行数据增广,并对增广...

【专利技术属性】
技术研发人员:曾大治董安冉赵艳霞刘英杰
申请(专利权)人:北京理工雷科电子信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1