一种基于深度Gabor网络的图像目标识别方法技术

技术编号:21142075 阅读:16 留言:0更新日期:2019-05-18 05:26
本发明专利技术涉及一种基于深度Gabor网络的图像目标识别方法,包括:对图像或者视频进行单帧分解得到单帧图像,利用深度Gabor网络进行特征提取与融合,而后利用全连接网络达到目标识别的目的。目标识别过程分为训练和测试两个过程。在训练中,以训练样本的图像作为深度Gabor网络的输入,通过最小化损失函数来训练整个深度Gabor网络,得到深度Gabor网络的权重值。同时对易错的训练样本进行困难样本挖掘,以提高深度Gabor网络的性能。在测试阶段,以测试样本的图像作为输入,利用训练好的深度Gabor网络提取测试样本的图像特征,然后利用训练好的全连接网络进行测试样本的分类,由此实现目标的识别。

【技术实现步骤摘要】
一种基于深度Gabor网络的图像目标识别方法
本专利技术涉及图像处理技术,特别是涉及一种基于深度Gabor网络的图像目标识别方法。
技术介绍
针对图像的目标识别可以用于各方面,包括网络上图像目标的理解、智慧城市、监控场景中的目标的发掘、人机交互中的场景理解等。深度学习技术给图像目标的识别提供了强有力的手段,并在多个社会领域上取得了成功。包括基于图像内容的搜索、以图搜图、监控中的人物再识别等。目前面向图像目标识别的深度学习主要采用基于卷积神经网络的结构,并在结构、网络的层数、网络的参数量上逐渐提高,对系统提高了要求。为了将网络的参数量降低,研究一种小参数量的网络具有重要意义。现有图像目标识别的网络采用卷积核作为基本的结构,由于该结构靠大量的参数的学习来拟合训练数据,其确实理论的解释也是被大家诟病的地方。本专利技术创新性的提出采用Gabor滤波器来提取图像的特征,由于Gabor滤波器模拟人脑对于纹理的响应,有理论分析与支撑。并提出紧接Gabor层的激活层、批标准化层和池化层,完成参数的学习和训练。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种基于Gabor算子的目标识别方法,并且能相比现有方法具有更小的参数量与适应范围。为了达到上述目的,本专利技术提出的技术方案为:一种基于深度Gabor网络的图像目标识别方法,包括如下步骤:步骤1、读取需要进行目标识别的图像或视频数据,如果数据为视频数据,则视频数据分解成单帧图像序列;将图像数据,或者视频分解出的单帧图像序列,分为训练数据和测试数据,分别构成训练数据集与测试数据集。步骤2、在目标识别的算法中包含训练和测试两个过程,在训练过程中,将对于步骤1得到的训练数据进行标记,根据图像中目标种类对图像进行标记,将图像数据打上类别标签,得到标记后的训练数据。步骤3、针对步骤2得到的标记后的训练数据进行数据增广,将增广后的数据加到原始数据中,得到的数据增广后的训练数据。步骤4、将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络,得到深度Gabor网络。利用Gabor网络对训练数据进行分类,对比数据标签,得到分类正确的训练数据与分类错误的训练数据,分类错误的训练数据被认为是困难数据。步骤5、对于步骤4得到的深度Gabor网络,针对分类错误的训练数据进行困难数据挖掘,采用生成对抗网络生成类似的困难数据,将困难数据通过深度Gabor网络进行训练,提升深度Gabor网络的性能,至此完成训练阶段。步骤6、在测试阶段中,利用训练好的深度Gabor网络作为测试过程的网络,对于输入的图像利用Gabor网络提取图像的特征,输出对该图像数据的识别结果,从而对图像目标识别。本专利技术与现有技术相比的优点在于:(1)本专利技术具有模型可解释的特点。由于传统的深度学习都是采用卷积核来对图像进行处理,并没有很强的理论的解释性。本专利技术由于采用Gabor滤波器作为基础来构建神经网络,利用Gabor模拟人的视觉感知中对于纹理与边界敏感的特点,具有可解释的理论基础。(2)本专利技术具有参数量小的特点。由于采用Gabor滤波器,每个的滤波器的参数量相比卷积核的参数小。在相同的层数与识别准确率的要求下,本专利技术所提的网络参数量小。(3)本专利技术具有是用范围广的特点。本专利技术所提的网络具有参数量小的特点,而且具有可解释性。所以具体的任务其能有针对性的调整,且能部署在服务器已经算力小的端上,具有广泛的应用范围。附图说明图1为本专利技术深度Gabor网络结构示意图。具体实施方式下面结合附图以及具体实施方式进一步说明本专利技术。如图1所示,本专利技术一种用于图像目标识别的基于Gabor网络,具体实现步骤如下:步骤1、读取需要进行目标识别的图像或视频数据,如果数据为视频数据,则视频数据分解成单帧图像序列;将图像数据,或者视频分解出的单帧图像序列,分为训练数据和测试数据,分别构成训练数据集与测试数据集。步骤2、在目标识别的算法中包含训练和测试两个过程,在训练过程中,将对于步骤1得到的训练数据进行标记,根据图像中目标种类对图像进行标记,将图像数据打上类别标签,得到标记后的训练数据。步骤3、针对步骤2得到的标记后的训练数据进行数据增广,将增广后的数据加到原始数据中,得到的数据增广后的训练数据。步骤i)针对步骤2得到的标记后的训练数据,利用图像旋转、局部裁剪、上下对称翻转、左右对称翻转、颜色抖动方式进行图像数据增广。步骤ii)对数据增广后得到的更多的数据,加到原始数据中,增大训练数据集的规模,提高神经网络的训练的有效性。步骤iii)图像目标识别的训练过程,为一个多分类问题,利用标签对数据进行分类,对于数据扩展后的标签,其值与进行变换前标签相同。步骤4、将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络,得到深度Gabor网络。利用Gabor网络对训练数据进行分类,对比数据标签,得到分类正确的训练数据与分类错误的训练数据,分类错误的训练数据被认为是困难数据。步骤i)训练过程为有监督学习过程,图像目标识别的数据为多类别的数据,神经网络采用交叉熵作为损失函数:loss=-y′logy式中y为预测结果,y’为实际结果。并通过随机梯度下降法完成对于深度Gabor网络参数的调整。步骤ii)对于图像目标识别的深度Gabor网络的组成均为Gabor滤波器,其表示如下:x′=xcosθ+ysinθy′=-xsinθ+ycosθ其中x,y为二维卷积核坐标,λ为波长,θ为滤波器方向,σ为高斯核标准差。步骤iii)深度Gabor网络核心为4个Gabor层,每个Gabor层由多个不同参数的Gabor滤波器组成,Gabor滤波器中θ与λ为可训练参数,随机初始化取值如下:θ∈(-π,π)λ∈(2,0.2×min(height,width))height与width为输入图像长和宽。步骤iv)深度Gabor网络具体结构如下:(1)Input:输入层为原始数据;(2)Gabor1:本层针对不同的输入通道采用相同Gabor滤波器,滤波器数量取64;(3)P1:本层为池化层,采用步长为2,大小为2*2的最大池化,可提高网络的训练速度并避免过拟合现象;(4)S1:本层为激活层,采用“relu”函数作为激活函数,可有效避免过拟合现象;(5)N1:本层为批标准化层,其用于将本层的输入归一化为均值为0,标准差为1的数据,这对避免过拟合现象有很好的效果,其计算方法如下,yi=γx′i+β其中m为每批样本个数,则显然μB为样本平均值,为样本标准差,∈理论上为正无穷小,实验中一般选取0.0001,γ和β为可训练参数,初始值选取γ=1.0,β=0.1,yi为输出;(6)Gabor2:本层针对不同的输入通道采用相同Gabor滤波器,滤波器数量取256;(7)P2:本层为池化层,具体同P1;(8)S2:本层为激活层,具体同S1;(9)N2:本层为批标准化层,具体同N1;(10)Gabor3:本层针对不同的输入通道采用相同Gabor滤波器,滤波器数量取256;(11)P3:本层为池化层,具体同P1;(12)S3:本层为激活层,具体同S1;(13)N3:本层为批标准化层本文档来自技高网...

【技术保护点】
1.一种基于深度Gabor网络的图像目标识别方法,其特征在于:实现步骤如下:步骤1:读取需要进行目标识别的图像或视频数据,如果数据为视频数据,则视频数据分解成单帧图像序列;将图像数据,或者视频分解出的单帧图像序列,分为训练数据和测试数据,分别构成训练数据集与测试数据集;步骤2:在目标识别的算法中包含训练和测试两个过程,在训练过程中,将对于步骤1得到的训练数据进行标记,根据图像中目标种类对图像进行标记,将图像数据打上类别标签,得到标记后的训练数据;步骤3:针对步骤2得到的标记后的训练数据进行数据增广,将增广后的数据加到原始数据中,得到的数据增广后的训练数据;步骤4:将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络,得到深度Gabor网络。利用Gabor网络对训练数据进行分类,对比数据标签,得到分类正确的训练数据与分类错误的训练数据,分类错误的训练数据被认为是困难数据;步骤5:对于步骤4得到的深度Gabor网络,针对分类错误的训练数据进行困难数据挖掘,采用生成对抗网络成类似的困难数据,将困难数据通过深度Gabor网络进行训练,提升深度Gabor网络的性能,至此完成训练阶段;步骤6:在测试阶段中,利用训练好的深度Gabor网络作为测试过程的网络,对于输入的图像利用Gabor网络提取图像的特征,输出对所述图像的识别结果,从而对图像目标识别。...

【技术特征摘要】
1.一种基于深度Gabor网络的图像目标识别方法,其特征在于:实现步骤如下:步骤1:读取需要进行目标识别的图像或视频数据,如果数据为视频数据,则视频数据分解成单帧图像序列;将图像数据,或者视频分解出的单帧图像序列,分为训练数据和测试数据,分别构成训练数据集与测试数据集;步骤2:在目标识别的算法中包含训练和测试两个过程,在训练过程中,将对于步骤1得到的训练数据进行标记,根据图像中目标种类对图像进行标记,将图像数据打上类别标签,得到标记后的训练数据;步骤3:针对步骤2得到的标记后的训练数据进行数据增广,将增广后的数据加到原始数据中,得到的数据增广后的训练数据;步骤4:将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络,得到深度Gabor网络。利用Gabor网络对训练数据进行分类,对比数据标签,得到分类正确的训练数据与分类错误的训练数据,分类错误的训练数据被认为是困难数据;步骤5:对于步骤4得到的深度Gabor网络,针对分类错误的训练数据进行困难数据挖掘,采用生成对抗网络成类似的困难数据,将困难数据通过深度Gabor网络进行训练,提升深度Gabor网络的性能,至此完成训练阶段;步骤6:在测试阶段中,利用训练好的深度Gabor网络作为测试过程的网络,对于输入的图像利用Gabor网络提取图像的特征,输出对所述图像的识别结果,从而对图像目标识别。2.根据权利要求1所述的一种基于深度Gabor网络的图像目标识别方法,其特征在于:所述步骤3中,进行数据增广的过程如下:步骤i)针对步骤2得到的标记后的训练数据,利用图像旋转、局部裁剪、上下对称翻转、左右对称翻转、颜色抖动方式进行图像数据增广;步骤ii)对数据增广后得到的更多的数据,加到原始数据中,增大训练数据集的规模,提高深度Gabor网络的训练的有效性。3.根据权利要求1所述的一种基于深度Gabor网络的图像目标识别方法,其特征在于:所述步骤4中,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络的过程:步骤i)训练过程为有监督学习过程,图像目标识别的数据为多类别的数据,深度Gabor...

【专利技术属性】
技术研发人员:王田李嘉锟单光存文博文社欣
申请(专利权)人:北京航空航天大学博恒科技杭州有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1