【技术实现步骤摘要】
本专利技术涉及图像识别,尤其涉及一种基于transformer的细粒度图像分类方法及系统。
技术介绍
1、细粒度视觉分类(fine-grained visual classification,fgvc)是计算机视觉中的一项具有挑战性的任务,它涉及将图像分类为非常具体和详细的类别,例如不同种类的鸟类、狗、车辆模型和医学图像。如图1所示,这四种麻雀的外观几乎相同,但从不同的角度看,同一种麻雀的外观也有很大的不同。细粒度图像分类在现实生活中具有广泛的应用前景。例如,在安全监控领域中,细粒度图像分类可以用于人脸识别、行为分析等任务;在智能交通领域中,细粒度图像分类可以用于车辆品牌和型号的识别等任务。因此,开展细粒度图像分类的研究具有重要的理论和实践意义。
2、fgvc在计算机视觉中的目标是检索和识别属于超类别(又名元类别或基本类别)的多个下属类别的图像,例如,不同物种的动物/植物,不同型号的汽车,不同种类的零售产品等。因此,关键的挑战在于理解细粒度的视觉差异,以充分区分在整体外观上高度相似但在细粒度特征上不同的对象。自近20年前开始
...【技术保护点】
1.一种基于Transformer的细粒度图像分类系统,其特征在于,所述系统包括细粒度图像分类模型和全连接层,所述细粒度图像分类模型包括骨干网络、特征金字塔网络和细粒度特征提取模块;所述细粒度特征提取模块包括细节增强子模块、局部特征细化子模块和自适应特征融合模块;
2.根据权利要求1所述的基于Transformer的细粒度图像分类系统,其特征在于,所述细节增强子模块具体利用如下计算式输出细节增强后的特征图:
3.根据权利要求1所述的基于Transformer的细粒度图像分类系统,其特征在于,所述局部特征细化子模块具体利用如下计算式输出局部特征细
...【技术特征摘要】
1.一种基于transformer的细粒度图像分类系统,其特征在于,所述系统包括细粒度图像分类模型和全连接层,所述细粒度图像分类模型包括骨干网络、特征金字塔网络和细粒度特征提取模块;所述细粒度特征提取模块包括细节增强子模块、局部特征细化子模块和自适应特征融合模块;
2.根据权利要求1所述的基于transformer的细粒度图像分类系统,其特征在于,所述细节增强子模块具体利用如下计算式输出细节增强后的特征图:
3.根据权利要求1所述的基于transformer的细粒度图像分类系统,其特征在于,所述局部特征细化子模块具体利用如下计算式输出局部特征细化后的特征图:
4.根据权利要求1所述的基于transformer的细粒度图像分类系统,其特征在于,所述自适应特征融合模块具体利用如下计算式输出融合特征:
5.根据权利要求1所述的基于transformer的细粒度图像分类系统,其特征在于,所述系统的损失函数为将加权交叉熵损失和区域...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。