【技术实现步骤摘要】
本专利技术涉及图像识别,具体涉及一种细粒度图像识别分类方法、系统、存储介质及设备。
技术介绍
1、细粒度图像分类(fgvc)是一个极具挑战的任务,其主要目标是发现并根据图像的具有判别性的区域及特征,对物体进行分类。此项任务在区分外观极为相似的类别时更为困难。由于大多数图像存在较高的类间相似性和较低的类内差异性,以及包括像环境、姿态等不一致的问题,无论是人类还是机器都面临识别的瓶颈。
2、过去,卷积神经网络(cnn)在该领域取得了显著的成绩。然而,随着视觉transformer(vit)模型的引入,vit在多个视觉任务中的表现已经超越了cnn,并成为新的前沿技术。近年来,vit在fgvc任务中的应用逐渐增多。例如,有些模型利用注意力机制来提取图像的局部特征,并优化其辨别能力。然而,不论是cnn类还是vit类模型,其本质都是基于黑盒的学习机制,其模型存在可解释性的问题。
3、在细粒度图像分类任务中,模型需要从微小的视觉差异中识别出图像类别。这类任务具有高度的挑战性,因为在细粒度图像中,不同类别的视觉特征往往存在细微差
...【技术保护点】
1.一种细粒度图像识别分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的细粒度图像识别分类方法,其特征在于,将每个阶段特征图导入所述视觉模型的特征金字塔网络模块中,得到融合浅层信息的第一目标特征图的步骤,包括:
3.根据权利要求1所述的细粒度图像识别分类方法,其特征在于,将所述第一目标特征图导入所述视觉模型的弱监督采样模块中,筛选出对分类有益的目标特征,基于所述目标特征堆叠成目标向量与第二目标特征图的步骤,包括:
4.根据权利要求3所述的细粒度图像识别分类方法,其特征在于,所述方法还包括:
5.根据权利要求1
...【技术特征摘要】
1.一种细粒度图像识别分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的细粒度图像识别分类方法,其特征在于,将每个阶段特征图导入所述视觉模型的特征金字塔网络模块中,得到融合浅层信息的第一目标特征图的步骤,包括:
3.根据权利要求1所述的细粒度图像识别分类方法,其特征在于,将所述第一目标特征图导入所述视觉模型的弱监督采样模块中,筛选出对分类有益的目标特征,基于所述目标特征堆叠成目标向量与第二目标特征图的步骤,包括:
4.根据权利要求3所述的细粒度图像识别分类方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的细粒度图像识别分类方法,其特征在于,将所述第二目标特征图与未经激活函数处理的初始预测值导入所述视觉模型的神经决策森林模块中,分别得到每一个粒度对应的目标预测值并存入输...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。