一种图像分类模型的训练方法及装置制造方法及图纸

技术编号：37715590 阅读：11 留言：0更新日期：2023-06-02 00:11

本公开涉及人工智能技术领域，提供了一种图像分类模型的训练方法、装置、计算机设备及计算机可读存储介质。该方法在模型训练过程中仅对第一特征提示词向量和分类器的参数进行调整，这样不需要让图像分类模型中的主干网络适应新的训练样本，而通过在训练样本中增加可学习的第一特征提示词向量，让增加预设的第一特征提示词向量的训练样本适应主干网络，由于可学习的第一特征提示词向量能够适应预训练模型的内部参数，能够让预训练模型根据添加的可学习的第一特征提示词向量理解任务，在一定程度上调整训练样本数据的分布，从而适应图像分类模型，实现图像分类模型的预测结果的精度提升，同时实施成本相对较低且计算复杂度低、数据计算量低。数据计算量低。数据计算量低。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类模型的训练方法及装置

[0001]本公开涉及人工智能
，尤其涉及一种图像分类模型的训练方法及装置。

技术介绍

[0002]一直以来，自然语言任务非常依赖预训练模型。Transformer模型在NLP领域获得了巨大的成功，以此为基本训练方法获得的超大规模预训练模型BERT、GPT
‑
3在NLP各个任务中都大放异彩，达到最佳精度。受到NLP中Transformer的启发，计算机视觉分析任务也尝试借鉴了Transformer模型的思想和方法，对大量已有数据进行预训练。
[0003]当前在下游任务上应用预训练模型的主要策略是，对预训练好的模型使用较小的学习率(learning rate)，对全部参数进行精调。但是，对一些很大的模型来说，全量精调是不现实的，至少全量精调预训练的主干网络(backbone)运算开销很大，而且有时候会因为迁移数据集数据量不够，导致效果提升有限。所以，对于很大的模型来说，如果也想使用预训练模型迁移策略，且希望既能够降低精精调的运算开销，又能获得很好的模型精度，甚至想达到更高的模型精度，就需要有新的模型训练策略。

技术实现思路

[0004]有鉴于此，本公开实施例提供了一种图像分类模型的训练方法、装置、计算机设备及计算机可读存储介质，以实现既能够降低模型训练的运算开销，又能获得较好的模型精度。
[0005]本公开实施例的第一方面，提供了一种图像分类模型的训练方法，所述方法包括：
[0006]获取训练样本图像和所述训练样本图像对应...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型的训练方法，其特征在于，所述方法包括：获取训练样本图像和所述训练样本图像对应的的真实类别标签；根据所述训练样本图像，确定所述训练样本图像对应的图片块序列；根据所述训练样本图像对应的图片块序列、预设的第一特征提示词向量和分类标识，得到第一调整图片块序列；将所述第一调整图片块序列输入图像分类模型，得到所述训练样本图像对应的预测类别标签；其中，所述图像分类模型包括主干网络和分类器；根据所述训练样本图像对应的预测类别标签和真实类别标签，对所述第一特征提示词向量和所述分类器的参数进行调整，且固定所述主干网络的参数，得到已训练的图像分类模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本图像，确定所述训练样本图像对应的图片块序列，包括：将所述训练样本图像划分为若干图片块；根据所述若干图像块，确定所述训练样本图像对应的图片块序列。3.根据权利要求1所述的方法，其特征在于，所述根据所述训练样本图像对应的图片块序列、预设的第一特征提示词向量和分类标识，得到第一调整图片块序列，包括：将所述分类标识、所述第一特征提示词向量和所述训练样本图像对应的图片块序列进行相加，得到第一调整图片块序列。4.根据权利要求3所述的方法，其特征在于，所述分类标识位于所述第一调整图片块序列中的首位，所述第一特征提示词向量位于所述第一调整图片块序列中所述分类标识的位置之后且所述训练样本图像对应的图片块序列的位置之前。5.根据权利要求1所述的方法，其特征在于，所述主干网络包括第一神经网络编码器层和第二神经网络编码器层；其中，所述主干网络为Vision Transformer模型；所述第一神经网络编码器层为基于自注意力的多头注意力网络，所述第二神经网络编码器层为基于自注意力的多头注意力网络，所述第一神经网络编码器层和所述第二神经网络编码器层的网络结构是相同的。6.根据权利要求5所述的方法，其特征在于，所述将所述第一调整图片块序列输入图像分类模型，得到所述训练样本图像对应的预测类别标签，包括：将所述第一调整图片块序列输入所述第一神经网络编码器层，得到所述第一调整图片块序列对应的局部特征序列；其中，所述局部特征序列包括所述分类标识对应的局部特征、所述第一特征提示词向量对应的局部特征和所述训练样本图像对应的图片块序列的局部特征序列；将...

【专利技术属性】
技术研发人员：王芳，暴宇健，
申请(专利权)人：北京龙智数科科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人