【技术实现步骤摘要】
一种结合注意力混合裁剪的细粒度图像识别方法
本专利技术属于计算机视觉
,特别涉及了一种结合注意力混合裁剪的细粒度图像识别方法。
技术介绍
细粒度图像识别不同于通用图像识别,旨在区分同属某一大类下更为精细的子类,如区分鸟的种类,狗的种类,车的类型等等,在智能安防,智能零售等领域有着重要的应用,其具有类间差距小和类内差距大的特点,识别具有不小的难度;同时细粒度数据集往往种类多,而数据量较少,容易产生训练时的过拟合。近年来,在传统图像分类任务已达到了一个较高的精确度之后,研究人员将自己的目光放在了细粒度图像识别上。Part-basedR-CNN方法借鉴了目标检测领域的R-CNN方法,利用部件级别标注信息训练出一个部件检测器,进行目标的头部和躯干的检测,之后将检测到的头部和躯干的特征与图像整体分别通过卷积神经网络提取特征,并依据该特征通过SVM分类器得到最终的分类结果。双线性卷积神经网络B-CNN率先提出了利用BilinearPooling双线性池化操作融合两个不同的卷积神经网络提取到的特征,融合之后的高阶特征被证明更 ...
【技术保护点】
1.一种结合注意力混合裁剪的细粒度图像识别方法,其特征在于,包括以下步骤:/n(1)图像采集过程:采集待识别的细粒度图像;/n(2)数据增强过程:采用数据增强方法来扩大所述图像数据量,与原本采集得到的图像一起形成细粒度图像数据库;/n(3)细粒度分类网络训练过程:使用获得的细粒度图像数据库送入细粒度分类网络进行学习,直到损失函数收敛;/n(4)测试图像检测过程:利用训练好的细粒度分类网络和权重文件来获取目标图像中细粒度目标的精确分类。/n
【技术特征摘要】
1.一种结合注意力混合裁剪的细粒度图像识别方法,其特征在于,包括以下步骤:
(1)图像采集过程:采集待识别的细粒度图像;
(2)数据增强过程:采用数据增强方法来扩大所述图像数据量,与原本采集得到的图像一起形成细粒度图像数据库;
(3)细粒度分类网络训练过程:使用获得的细粒度图像数据库送入细粒度分类网络进行学习,直到损失函数收敛;
(4)测试图像检测过程:利用训练好的细粒度分类网络和权重文件来获取目标图像中细粒度目标的精确分类。
2.根据权利要求1所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(1)具体包括以下步骤:对采集到的图像进行清洗处理,过滤掉不满足要求的照片,之后对余下图像进行标注。
3.根据权利要求1所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(3)中所述细粒度分类网络为结合注意力混合裁剪的细粒度图像识别网络,结合了注意力混合裁剪。
4.根据权利要求1或3所述的结合注意力混合裁剪的细粒度图像识别方法,其特征在于,步骤(3)具体包括以下步骤:
(31)将细粒度图像数据送入结合注意力混合裁剪的细粒度网络中,使用ImageNet预训练权重作为初始权重,设置学习率为0.002,设置最大迭代轮次为200轮,设置batchsize为32,使用StepLR策略进行学习率衰减,每两个epoch将学习率衰减为原来的0.9;
(32)采用卷积神经网络进行特征的提取,提取到图像的高阶语义信息;
(33)对于获取到的特征图,使用1*1大小的卷积核将特征图映射为注意力图;
(34)对于获取到的注意力图,将其与原特征图通过注意力双线性池化操作获取二阶特征,并拼接成特征矩阵之后通过SoftMax层计算交叉熵分类损失;
(35)对于注意力图中得到的位置信息,进行注意力混合裁剪,并将混合...
【专利技术属性】
技术研发人员:刘宁钟,白瑜颖,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。