一种基于软阈值惩罚机制的弱监督细粒度图像分类方法技术

技术编号:34334613 阅读:50 留言:0更新日期:2022-07-31 02:44
本发明专利技术提供了一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,包括:步骤1:基于软阈值惩罚机制,构建二级级联网络结构的细粒度图像分类网络;步骤2:获取待分类图像;步骤3:对所述待分类图像进行预处理;步骤4:基于所述细粒度图像分类网络,对预处理结果进行图像分类,并输出图像分类结果。本发明专利技术的基于软阈值惩罚机制的弱监督细粒度图像分类方法,优化了MMAL

A weakly supervised fine-grained image classification method based on soft threshold penalty mechanism

【技术实现步骤摘要】
一种基于软阈值惩罚机制的弱监督细粒度图像分类方法


[0001]本专利技术涉及图像分类和智能优化
,特别涉及一种基于软阈值惩罚机制的弱监督细粒度图像分类方法。

技术介绍

[0002]MMAL

Net是多分支多尺度学习网络,基于全局特征的弱监督细粒度分类方法。沿用了另一种局部特征分类所用到的方法,以三级级联作为整体架构。MMAL

Net模型分类的准确性较高,在诸多的数据集上能够到达SOTA的准确率,甚至在飞行器数据集上达到94.7%,是目前该数据集的最高准确率。MMAL

Net的算法流程如图2所示。
[0003]MMAL

Net以RA

CNN网络作为基础结构,选用了三级级联网络的方式来进行,在每一级网络上,采用ResNet进行特征的提取与分类,与之不同的是,在每一级网络之间,穿插有两个模块,分别是AOLM(Attention Object Location Module)和APPM(Attention Part Proposal Mod本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,其特征在于,包括:步骤1:基于软阈值惩罚机制,构建二级级联网络结构的细粒度图像分类网络;步骤2:获取待分类图像;步骤3:对所述待分类图像进行预处理;步骤4:基于所述细粒度图像分类网络,对预处理结果进行图像分类,并输出图像分类结果。2.如权利要求1所述的一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,其特征在于,所述步骤1:基于软阈值惩罚机制,构建二级级联网络结构的细粒度图像分类网络,包括:构建第一网络分支,所述第一网络分支包括:依次连接的Input448*448*3、第一ResNet50、Feature14*14*2048、第一GAP、第一FC和第一Softmax;构建第二网络分支,所述第二网络分支包括:依次连接的Input224*224*3*mult、第二ResNet50、Feature*7*7*2048*mult、第二GAP、第二FC和第二Softmax;将所述第二网络分支中的Input224*224*3*mult通过crop与所述第一网络分支中的Input448*448*3连接;将所述第一网络分支中的Feature14*14*2048通过APPM与所述crop连接;为所述第一网络分支设置第一损失函数RawLoss;为所述第二网络分支设置第二损失函数PartLoss;在所述APPM中设置软阈值惩罚机制;所述第一网络分支、第二网络分支、APPM和crop组成二级级联网络结构的细粒度图像分类网络。3.如权利要求2所述的一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,其特征在于,所述APPM是基于SCDA形成,将所述APPM对特征提取出来的所述Feature14*14*2048沿着池化层的通道方向进行合拢,得到14*14*1的二维图,用预设的多个不同尺寸的滑窗对所述二维图进行滑窗计算,计算过程如公式(2

1)所示:其中,H和W分别为滑窗的高度和宽度,A(x,y)为合拢好的二维图的坐标位置对应的数值,a
w
为滑窗计算结果。4.如权利要求2所述的一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,其特征在于,所述第一损失函数RawLoss的公式如公式(2

2)所示:其中,m
i
为第i个样本图像,n
i
为第一卷积神经网络CNN对应于第i个样本图像的预测概率。5.如权利要求2所述的一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,其特征在于,所述第二损失函数PartLoss的公式如公式(2

3)所示:
其中,q为由所述第二ResNet50筛选出的局部特征区域个数,m
iq
为第i个样本图像对应的第q个局部特征区域个数,n
iq
为第二卷积神经网络CNN对应于第i个样本图像对应的第q个局部特征区域个数的预测概率。6.如权利要求2所述的一种基于软阈值惩罚机制的弱监督细粒度图像分类方法,其特征在于,所述软阈值惩罚机制包括:设F(x,y)为不含噪声的图像,N(x,y)为噪声,G(x,y)为噪声影响之后的图像,选用L
1/2
范式进行模型的建立如公式(2

5)所示:i表示的是图像的序号,当进行图像迭代处理时,G(x
i
,y
i
)

F(x
i
,y
i
)出现残差,说明图像中出现噪声,并造成影响;通过软阈值来限定残差状态,先构造惩罚因子||G(x
i
,y
i
)

F(x
i
,y
i
)||
h
,来限制G(x
i
,y
i
)

F(x
i
,y
i
)不大于0,从而降低图像被噪声干扰的程度,如公式(2

【专利技术属性】
技术研发人员:董琴范浩楠刘柱杨国宇
申请(专利权)人:盐城工学院技术转移中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1