一种基于图像块评分的细粒度图像分类方法和装置制造方法及图纸

技术编号：33072225 阅读：35 留言：0更新日期：2022-04-15 10:06

本发明专利技术公开了一种基于图像块评分的细粒度图像分类方法和装置，包括以下步骤：步骤S1：构建分类数据集；步骤S2：构建局部标识；步骤S3：构建分类标识；步骤S4：获得图像分类特征信息和各个图像块特征信息；步骤S5：构建关联性局部标识；步骤S6：生成选择标识；步骤S7：特征处理；步骤S8：训练；步骤S9：将所述全局标识和所述关联性局部标识拼接，训练最后一个transformer层。本发明专利技术解决类内差异大、类间相似程度高的细粒度图像分类的问题，实现在transformer网络中即插即用，效果提升明显。效果提升明显。效果提升明显。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像块评分的细粒度图像分类方法和装置

[0001]本专利技术涉及一种图像分类
，尤其涉及一种基于图像块评分的细粒度图像分类方法和装置。

技术介绍

[0002]细粒度分类是建立在同一大类图像基础上，进行更精细的子类划分，如划分鸟的品种、衣服的款式、狗的种类等。在实际生活中，识别不同子类存在着巨大的应用需求，例如在生态环境中识别不同类别的生物用于更高效地生态保护；零售行业中自动识别商品被顾客拿取/试穿次数，统计数据支撑产品迭代；监控行业中通过对过往车辆类型进行分类，实现更好的城市管理。细粒度分类任务广泛的应用价值使其成为计算机视觉领域一个火热的研究方向，由此在细粒度图像分析方向产生了诸多经典数据集，包括：狗类数据集Stanford Dogs、花类数据集Oxford Flowers、飞机数据集Aircrafts、汽车数据集Stanford Cars等等。
[0003]同大类物种的不同子类往往仅在细微局部存在微小区别，如鸟的嘴巴，而相同子类往往因为姿态、背景、光照、遮挡等影响导致较大的差异。细粒度图像较大的类内差异和类间相似的特点加大了其分类任务的难度和挑战。目前现有的细粒度分类方法主要从两方面考虑：基于定位区域的方法和基于特征编码的方法。基于定位区域的方法主要是利用强监督或者弱监督方法定位有助于区分子类的判别性区域，将这些判别性区域从原图中扣取出来重新送入网络，再将判别性区域特征和图像全局特征融合用于分类。基于特征编码的方法多使用双线性池化方法获取图像高阶信息，从而获取图像更多细节特征。这些方法主要用...

【技术保护点】

【技术特征摘要】
1.一种基于图像块评分的细粒度图像分类方法，其特征在于，包括以下步骤：步骤S1：获取待分类的目标图像，构建分类数据集；步骤S2：将所述分类数据集分割为若干个不交叠的图像块，对所述图像块编码构建局部标识；步骤S3：利用所述局部标识构建分类标识；步骤S4：将所述局部标识和所述分类标识共同送入transformer网络，利用transformer网络中除最后一个transformer层以外的网络层获得用于表征所述分类标识的图像分类特征信息和用于表征各个图像块的局部标识的图像块特征信息；步骤S5：根据所述图像分类特征信息和所述图像块特征信息，确定所述局部标识和所述分类标识的关联性，并挑选与所述分类标识关联性的大小靠前的若干个所述局部标识以构建所述分类标识的关联性局部标识；步骤S6：构建图像块评分系统，对所述关联性局部标识评分，基于所述评分获得的分值将所述关联性局部标识的特征叠加，生成选择标识；步骤S7：将所述分类标识和所述选择标识的特征拼接，送入所述transformer网络中的最后一个transformer层做特征处理；步骤S8：利用所述步骤S7的特征处理结果构建全连接层和交叉熵损失并进行分类训练，同时利用步骤S6中所述关联性局部标识的分值分布构建相对熵散度损失函数进行辅助训练；步骤S9：对所述步骤S8训练完的模型，固定所述transformer网络中除最后一个transformer层外的其他网络层，仅对所述transformer网络中的最后一个transformer层进行微调操作，所述微调操作过程中，将所述分类标识和所述关联性局部标识拼接，训练最后一个transformer 层。2.如权利要求1所述的一种基于图像块评分的细粒度图像分类方法，其特征在于，所述步骤S1中，所述分类数据集包括样本和属性分类标签。3.如权利要求1所述的一种基于图像块评分的细粒度图像分类方法，其特征在于，所述步骤S2中，所述分类数据集通过滑动窗口的方式分割为若干个不交叠的图像块，并对所述图像块做卷积操作构建局部标识，卷积层的核宽、核高、步...

【专利技术属性】
技术研发人员：苏慧，程乐超，杨非，鲍虎军，宋明黎，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人