【技术实现步骤摘要】
一种联合结构相似性和类信息的图像分类方法
本专利技术涉及深度学习、机器学习
,涉及一种图像分类方法,特别涉及一种联合结构相似性和类信息的图像分类方法。
技术介绍
自2012年Alex等设计卷积神经网络在ImageNet大规模图像分类比赛中获得冠军以来,深度学习在图像分类方面就不断取得新的突破。卷积神经网络通过分层的方式提取图像从低级别到高级别的信息,对图像的表示能力超过视觉词袋模型(bagofvisualwords,BoVW)和局部聚集描述子向量(vectoroflocallyaggregateddescriptor,VLAD)等基于手工特征表示的方法。然而,针对特定大小的图像或者特定的数据集,需要设计特定的卷积神经网络才能获得指定任务下的良好性能。在图像分类中,由于计算机存储和计算速度的限制,为了能将卷积神经网络应用于实际任务中,以较少的参数和计算量获得较好的分类性能是当前卷积神经网络设计方面的研究重点。在当前主流的卷积神经网络中,模型的参数大多都需要花费较大的存储空间,同时需要配置较好的计算设备(GPU)才能用于实际任务中。Simonyan等利用3×3的 ...
【技术保护点】
1.一种联合结构相似性和类信息的图像分类方法,其特征在于,包括以下步骤:步骤1:获取N×N原始图像;步骤2:对步骤1中获取额原始图像进行预处理;步骤3:将预处理后的图像输入卷积神经网络中的第一个卷积层Conv1,激活函数为ReLU;步骤4:将上一层的输出结果输入第二个卷积层Conv2,激活函数为ReLU,再进行dropout操作,将输出结果输入池化层;步骤5:将上一层的输出结果输入第三个卷积层Conv3,激活函数为ReLU,再进行dropout操作;步骤6:将上一层的输出结果输入第四个卷积层Conv4,激活函数为ReLU,再进行dropout操作,将输出结果输入池化层;步骤 ...
【技术特征摘要】
1.一种联合结构相似性和类信息的图像分类方法,其特征在于,包括以下步骤:步骤1:获取N×N原始图像;步骤2:对步骤1中获取额原始图像进行预处理;步骤3:将预处理后的图像输入卷积神经网络中的第一个卷积层Conv1,激活函数为ReLU;步骤4:将上一层的输出结果输入第二个卷积层Conv2,激活函数为ReLU,再进行dropout操作,将输出结果输入池化层;步骤5:将上一层的输出结果输入第三个卷积层Conv3,激活函数为ReLU,再进行dropout操作;步骤6:将上一层的输出结果输入第四个卷积层Conv4,激活函数为ReLU,再进行dropout操作,将输出结果输入池化层;步骤7:将上一层的输出结果输入第五个卷积层Conv5,激活函数为ReLU,再进行dropout操作;步骤8:将上一层输出结果输入第一个全连接层fc1,并进行dropout操作,然后进行L2型Normalization操作;步骤9:将上一层输出结果输入到struct1,其中struct1中的损失函数为度量损失函数;步骤10:将第8步的输出结果输入第二个全连接层fc2,即softmax层;步骤11:将步骤2中经过预处理的图像传送到步骤9和步骤10中,联合度量损失和softmax损失训练网络,获得总的损失函数;步骤12:经过softmax分类器得到图像属于各个类别的概率;步骤13:根据图像属于各个类别的概率,得出图像分类结果,最后输出图像分类结果。2.根据权利要求1所述的联合结构相似性和类信息的图像分类方法,其特征在于:步骤2中,所述预处理是对原始图像进行左右翻转,同时每次从每幅图像中随机裁剪一副M×M大小的图像,M<N,并通过caffe内置的逻辑机构转为lmdb型数据格式进行训练。3.根据权利要求1所述的联合结构相似性和类信息的图像分类方法,其特征在于,步骤9中所述度量损失函数是联合度量损失和图像类别信息建立的损失函数,其度量损失函数为:式中p是一个批量的图像数量,α是监督信息;si,j∈{0,1},如果yi=yj,则si,j=1,否则si,j=0;度量学习的目的是通过优化(1)式学习参数G;dWi,j为xi和xj之间的平方距离,如下式所示:dWi,j=(xi-xj)TW(xi-xj)(2)式中W=GGT,且其中G是Conv5和fc1之间待学习的参数矩阵。4.根据权利要求1所述的联合结构...
【专利技术属性】
技术研发人员:熊炜,刘豪,王娟,曾春艳,张凡,冯川,王鑫睿,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。