图像分类模型的训练方法、图像分类方法及装置制造方法及图纸

技术编号：37067601 阅读：15 留言：0更新日期：2023-03-29 19:45

本公开提供了图像分类模型的训练方法、图像分类方法及装置，涉及计算机技术领域，尤其涉及深度学习、计算机视觉等人工智能领域。方案为：获取互为镜像的第一图像和第二图像；分别对第一图像和第二图像进行特征提取，获取第一图像对应的第一特征图和第二图像对应的第二特征图；分别对第一特征图和第二特征图按通道维度进行池化操作，获取第一特征图对应的第一空间注意力权重图和第二特征图对应的第二空间注意力权重图；根据第一空间注意力权重图与第二空间注意力权重图，确定第一约束损失；根据第一约束损失对图像分类模型进行训练。该方法根据互为镜像的第一图像和第二图像的空间注意力权重图，进行注意力一致性约束，提高了模型的分类效果。了模型的分类效果。了模型的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
图像分类模型的训练方法、图像分类方法及装置

[0001]本公开涉及计算机
，尤其涉及深度学习、计算机视觉等人工智能领域，具体涉及一种图像分类模型的训练方法、图像分类方法及装置。

技术介绍

[0002]在人工智能领域，注意力机制是在原来神经网络结构上加入一个注意力模块，作用是让神经网络更加关注图片中对类别划分更具影响力的区域，例如在识别不同动物的任务中，注意力模块希望神经网络更关注到图像中动物主体的区域而忽略干扰的背景项。
[0003]相关技术中，通常注意力机制模块的训练是和分类任务一同进行的，通过分类任务的损失反向传导来更新注意力模块的权重。但是，这种权重更新方式依赖于训练数据本身的分布情况，可能会影响分类效果。

技术实现思路

[0004]本公开提供了一种图像分类模型的训练方法、图像分类方法及装置。具体方案如下：
[0005]根据本公开的一方面，提供了一种图像分类模型的训练方法，包括：
[0006]获取第一图像和第二图像，其中，所述第二图像与所述第一图像互为镜像；
[0007]分别对所述第一图像和所述第二图像进行特征提取，以获取所述第一图像对应的第一特征图和所述第二图像对应的第二特征图；
[0008]分别对所述第一特征图和所述第二特征图按通道维度进行池化操作，以获取所述第一特征图对应的第一空间注意力权重图和所述第二特征图对应的第二空间注意力权重图；
[0009]根据所述第一空间注意力权重图与所述第二空间注意力权重图，确定第一约束损失；
[0...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型的训练方法，包括：获取第一图像和第二图像，其中，所述第二图像与所述第一图像互为镜像；分别对所述第一图像和所述第二图像进行特征提取，以获取所述第一图像对应的第一特征图和所述第二图像对应的第二特征图；分别对所述第一特征图和所述第二特征图按通道维度进行池化操作，以获取所述第一特征图对应的第一空间注意力权重图和所述第二特征图对应的第二空间注意力权重图；根据所述第一空间注意力权重图与所述第二空间注意力权重图，确定第一约束损失；根据所述第一约束损失对图像分类模型进行训练。2.如权利要求1所述的方法，其中，所述根据所述第一约束损失对图像分类模型进行训练，包括：根据所述第一空间注意力权重图和所述第一特征图，获取所述第一图像对应的第一注意力特征图；对所述第一注意力特征图进行解码，以获取所述第一图像对应的预测类别；根据所述预测类别与所述第一图像的标注类别之间的差异，确定标签损失；根据所述标签损失和所述第一约束损失对所述图像分类模型进行训练。3.如权利要求1所述的方法，其中，所述根据所述第一约束损失对图像分类模型进行训练，包括：在所述第一图像具有标注框的情况下，根据所述标注框生成第三空间注意力权重图；根据所述第一空间注意力权重图和所述第三空间注意力权重图之间的差异，确定第二约束损失；根据所述第一约束损失和所述第二约束损失对所述图像分类模型进行训练。4.如权利要求3所述的方法，其中，所述根据所述标注框生成第三空间注意力权重图，包括：根据所述标注框的长度和宽度，确定高斯分布函数中的标准差；根据所述标注框的中心点坐标，确定所述高斯分布函数中的均值；根据所述标准差和所述均值，利用所述高斯分布函数，确定所述第一图像中各坐标点的权重；根据所述各坐标点的权重，生成所述第三空间注意力权重图。5.权利要求3所述的方法，其中，所述根据所述第一约束损失和所述第二约束损失对所述图像分类模型进行训练，包括：根据所述第一空间注意力权重图和所述第一特征图，获取所述第一图像对应的第一注意力特征图；对所述第一注意力特征图进行解码，以获取所述第一图像对应的预测类别；根据所述预测类别与所述第一图像的标注类别之间的差异，确定标签损失；根据所述标签损失、第一约束损失及所述第二约束损失对所述图像分类模型进行训练。6.如权利要求1所述的方法，其中，所述分别对所述第一特征图和所述第二特征图按通道维度进行池化操作，以获取所述第一特征图对应的第一空间注意力权重图和所述第二特征图对应的第二空间注意力权重图，包括：
分别对所述第一特征图和所述第二特征图按空间维度进行池化操作，以获取所述第一特征图对应的第一通道注意力权重图和所述第二特征图对应的第二通道注意力权重图；根据所述第一通道注意力权重图和所述第一特征图，获取所述第一图像对应的第三注意力特征图；根据所述第二通道注意力权重图和所述第二特征图，获取所述第二图像对应的第四注意力特征图；分别对所述第三注意力特征图和所述第四注意力特征图按通道维度进行池化操作，以获取所述第一空间注意力权重图和所述第二空间注意力权重图。7.如权利要求1所述的方法，其中，所述获取第一图像，包括：获取当前训练阶段的前一训练阶段的模型评价指标及各类别的第一样本数量；根据所述模型评价指标及所述第一样本数量，确定当前训练阶段所述各类别的第二样本数量；根据所述第二样本数量，从所述各类别的样本集中获取所述第一图像。8.如权利要求7所述的方法，其中，所述模型评价指标包括所述各类别中目标类别对应的召回率和精度，所述根据所述模型评价指标及所述第一样本数量，确定当前训练阶段所述各类别的第二样本数量，包括：在所述召回率大于第一阈值且所述精度小于第二阈值的情况下，根据第一预设比例，降低所述目标类别的第一样本数量，以得到所述目标类别的第二样本数量；根据所述第一预设比例和所述目标类别的第一样本数量，增加所述各类别中除所述目标类别外的其他类别的第一样本数量，以得到所述其他类别的第二样本数量。9.如权利要求8所述的方法，还包括：在所述召回率小于第三阈值且所述精度大于第四阈值的情况下，根据第二预设比例，增加所述目标类别的第一样本数量，以得到所述目标类别的第二样本数量；根据所述第二预设比例和所述目标类别的第一样本数量，降低所述其他类别的第一样本数量，以得到所述其他类别的第二样本数量。10.如权利要求1所述的方法，其中，所述获取第一图像，包括：利用当前训练阶段的前一训练阶段得到的图像分类模型，对每个类别对应的样本集中每个样本图像进行类别预测，以获取所述每个样本图像所属预测类别的预测概率；根据所述每个样本图像对应的预测概率，确定所述每个类别的样本图像的预测概率位于各概率区间的数量占比；根据所述数量占比，确定所述各概率区间内样本图像的采样概率；根据所述采样概率在所述样本集中进行采样，以获取所述每个类别的第一图像。11.如权利要求1所述的方法，所述根据所述第一空间注意力权重图与所述第二空间注意力权重图，确定第一约束损失，包括：确定所述第一空间注意力权重图与所述第二空间注意力权重图在空间上的距离；根据所述距离、所述第一空间注意力权重图的高度及宽度，确定所述第一约束损失。12.一种图像分类方法，包括：获取待分类图像；将所述待分类图像输入图像分类模型，以获取所述待分类图像对应的预测类别，其中，
所述图像分类模型是采用权利要求1
‑
11中任一项所述的方法训练得到的。13.一种图像分类模型的训练装置，包括：第一获取模块，用于获取第一图像和第二图像，其中，所述第二图像与所述第一图像互为镜像；第二获取模块，用于分别对所述第一图像和所述第二图像进行特征提取，以获取所述第一图像对应的第一特征图和所述第...

【专利技术属性】
技术研发人员：吕一，常战国，李理，赵鑫，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人