图像识别模型的训练方法、装置及电子设备制造方法及图纸

技术编号：24757870 阅读：59 留言：0更新日期：2020-07-04 09:32

本发明专利技术提供了一种图像识别模型的训练方法、装置及电子设备，涉及深度学习技术领域，该方法包括：将预先标注有样本标签的训练样本输入图像识别模型；在图像识别模型的迭代训练过程中，基于图像识别模型的网络层确定训练样本对应的细粒度特征图，将细粒度特征图输入至预设的深度学习网络，以使深度学习网络从细粒度特征图中学习到细粒度特征信息，并将学习到的细粒度特征信息蒸馏至图像识别模型中；其中，细粒度特征图为标注有样本标签对应的判别性区域的图像；重复执行上述训练步骤，直至训练结束，得到训练后的图像识别模型。本发明专利技术能够提升训练后的图像识别模型的图像识别效率。

Training method, device and electronic equipment of image recognition model

全部详细技术资料下载

【技术实现步骤摘要】
图像识别模型的训练方法、装置及电子设备
本专利技术涉及深度学习
，尤其是涉及一种图像识别模型的训练方法、装置及电子设备。
技术介绍
现有的人体动作识别任务中，在进行图像识别模型的训练时，为了获取到训练样本的细节特征，需要精确地定位到样本图像中的判别性区域(即动作发生区域)，传统的图像识别模型训练方式中主要依靠人工标注判别性区域，费时费力，为了节省人工标注判别性区域的时间，研究人员开始采用自监督注意力机制挖掘判别性区域的方式定位样本图像中的判别性区域，从而获取细粒度特征，然而，采用注意力机制挖掘判别性区域进行模型训练时，需要使用多个模型，且使用训练后的模型进行图像识别时也需要使用多个模型进行分阶段识别，计算量较大。因此，现有的模型训练方式得到的图像识别模型还存在因图像识别计算量较大而导致的图像识别效率较低的问题。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种图像识别模型的训练方法、装置及电子设备，能够提升训练后的图像识别模型的图像识别效率。为了实现上述目的，本专利技术实施例采用的技术方案如下：第一方面，本专利技术实施例提供了一种图像识别模型的训练方法，包括：将预先标注有样本标签的训练样本输入图像识别模型；在所述图像识别模型的迭代训练过程中，基于所述图像识别模型的网络层确定所述训练样本对应的细粒度特征图，将所述细粒度特征图输入至深度学习网络，以使所述深度学习网络从所述细粒度特征图中学习到细粒度特征信息，并将学习到的所述细粒度特征信息蒸馏至所述图像识别模型中；其中，所述细粒...

【技术保护点】
1.一种图像识别模型的训练方法，其特征在于，包括：/n将预先标注有样本标签的训练样本输入图像识别模型；/n在所述图像识别模型的迭代训练过程中，基于所述图像识别模型的网络层确定所述训练样本对应的细粒度特征图，将所述细粒度特征图输入至深度学习网络，以使所述深度学习网络从所述细粒度特征图中学习到细粒度特征信息，并将学习到的所述细粒度特征信息蒸馏至所述图像识别模型中；其中，所述细粒度特征图为标注有所述样本标签对应的判别性区域的图像；/n重复执行上述训练步骤，直至训练结束，得到训练后的图像识别模型。/n

【技术特征摘要】
1.一种图像识别模型的训练方法，其特征在于，包括：
将预先标注有样本标签的训练样本输入图像识别模型；
在所述图像识别模型的迭代训练过程中，基于所述图像识别模型的网络层确定所述训练样本对应的细粒度特征图，将所述细粒度特征图输入至深度学习网络，以使所述深度学习网络从所述细粒度特征图中学习到细粒度特征信息，并将学习到的所述细粒度特征信息蒸馏至所述图像识别模型中；其中，所述细粒度特征图为标注有所述样本标签对应的判别性区域的图像；
重复执行上述训练步骤，直至训练结束，得到训练后的图像识别模型。

2.根据权利要求1所述的方法，其特征在于，所述图像识别模型包括卷积神经网络；
所述在所述图像识别模型的迭代训练过程中，基于所述图像识别模型的网络层确定所述训练样本对应的细粒度特征图的步骤，包括：
基于所述训练样本及所述细粒度特征信息对所述图像识别模型进行迭代训练，并在迭代训练中基于所述图像识别模型的最后一层卷积层获取所述训练样本的掩码图像；
基于所述掩码图像确定所述训练样本对应的细粒度特征图。

3.根据权利要求2所述的方法，其特征在于，所述基于所述训练样本及所述细粒度特征信息对所述图像识别模型进行迭代训练，并在迭代训练中基于所述图像识别模型的最后一层卷积层获取所述训练样本的掩码图像的步骤，包括：
基于所述图像识别模型的各个卷积层及所述细粒度特征信息从所述训练样本中提取特征；
基于提取的特征及所述样本标签对所述训练样本进行预设次数的下采样，直至所述训练样本达到预设尺寸；
在所述图像识别模型的最后一层卷积层中，利用弱监督目标检测算法对下采样得到的预设尺寸的训练样本进行检测，得到所述训练样本的掩码图像；其中，所述掩码图像为各像素点上标有预测得分的图像，所述掩码图像的大小为所述预设尺寸。

4.根据权利要求3所述的方法，其特征在于，所述基于所述掩码图像确定所述训练样本对应的细粒度特征图的步骤，包括：
将所述掩码图像上采样至目标尺寸，得到目标掩码图像；其中，所述目标尺寸为所述训练样本进行目标次数的下采样后得到的目标图像的尺寸；
将所述目标掩码图像中所述预测得分大于预设分数的各像素点作为所述样...

【专利技术属性】
技术研发人员：王彬，
申请(专利权)人：北京迈格威科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人