【技术实现步骤摘要】
一种图像分类模型生成方法、装置、设备及存储介质
[0001]本专利技术实施例涉及人工智能
,尤其涉及一种图像分类模型生成方法、装置、设备及存储介质。
技术介绍
[0002]随着计算机技术的快速发展,神经网络模型在图像处理、语音处理以及自然语言处理等领域得到广泛的应用。一般来说,神经网络模型的性能越好,神经网络模型的参数量和计算量越大。以图像处理领域中的ResNet
‑
50进行举例说明,将大小为224*224的RBG图片输入ResNet
‑
50时,ResNet
‑
50需要25.6MB的参数量以及4.1B的浮点计算量,因此,终端设备需具备较大的存储资源和计算资源,才能搭载训练好的ResNet
‑
50。
[0003]为了使得终端设备不具备较大的存储资源和计算资源的情况下,仍可以搭载任意的神经网络模型,常常使用剪枝方法对神经网络模型进行剪枝。然而,目前常用的剪枝方法是在神经网络模型训练结束后,对训练好的神经网络模型进行剪枝,再对剪枝后的神经网络模型 ...
【技术保护点】
【技术特征摘要】
1.一种图像分类模型生成方法,其特征在于,包括:采用带有预设标签的待分类图像对图像分类模型进行训练;所述图像分类模型包括多个特征提取层,每个特征提取层包括多个滤波器以及相对应的多个掩码矩阵,每个滤波器和相对应的掩码矩阵的大小是相同的,所述多个滤波器用于对所述待分类图像提取不同的特征,每个掩码矩阵用于调整相对应的滤波器所提取的特征,所述多个滤波器中的参数以及所述多个掩码矩阵中的参数在训练过程中被调整;在至少一次训练结束后,针对任一特征提取层,从所述特征提取层的多个掩码矩阵中,获取所述特征提取层对应的失活掩码矩阵,所述失活掩码矩阵用于指示所述特征提取层中不参与后续训练的掩码矩阵;在训练结束后,针对任一特征提取层,基于所述特征提取层对应的失活掩码矩阵,从所述特征提取层删除失活掩码矩阵对应的滤波器,从而得到训练好的图像分类模型。2.如权利要求1所述的方法,其特征在于,所述图像分类模型还包括分类层和损失函数层;所述采用带有预设标签的待分类图像对图像分类模型进行训练,包括:在所述至少一次训练中的任一次训练中,执行以下步骤:基于所述多个特征提取层的滤波器和掩码矩阵对所述待分类图像进行特征提取,获得第一特征;将所述第一特征输入至所述分类层,获得第一预测类别;将所述第一预测类别和所述预设标签输入至所述损失函数层,获得第一损失函数值;基于所述第一损失函数值,对每个特征提取层的多个滤波器中的参数进行更新;针对任一特征提取层,基于所述特征提取层的多个掩码矩阵,确定所述特征提取层对应的第二损失函数值;并基于所述第一损失函数值以及所述第二损失函数值,对所述特征提取层的多个掩码矩阵中的参数进行更新。3.如权利要求2所述的方法,其特征在于,所述基于所述多个特征提取层的滤波器和掩码矩阵对所述待分类图像进行特征提取,获取第一特征,包括:针对第j个特征提取层,执行以下步骤:基于所述第j个特征提取层的滤波器和掩码矩阵,确定所述第j个特征提取层的稀疏滤波器;采用所述第j个特征提取层的稀疏滤波器对所述第j
‑
1个特征提取层对应的特征向量进行特征提取,获得所述第j个特征提取层对应的特征向量;其中,j>=1;将最后一个特征提取层对应的特征向量作为第一特征。4.如权利要求2所述的方法,其特征在于,所述基于所述特征提取层的多个掩码矩阵,确定所述特征提取层对应的第二损失函数值,包括:采用第二范数对所述特征提取层的多个掩码矩阵进行处理,获得所述特征提取层的第一掩码数组;采用第一范数对所述特征提取层的第一掩码数组进行处理,获得所述特征提取层的第二损失函数值。5.如权利要求1所述的方法,其特征在于,所述特征提取层包括M*N个掩码矩阵;所述M*N个掩码矩阵组成第一矩阵;所述从所述特征提取层的多个掩码矩阵中,获取所述特征提取层对应的失活掩码矩
阵,包括:针对所述至少一次训练中的第i次训练,确定所述特征提取层在所述第i次训练对应的剪枝量L;其中,i>=1,1<=L<=N;从所述第一矩阵中,获取所述特征提取层在所述第i次训练对应的失活掩码矩阵,所述失活掩码矩阵包括M*L个掩码矩阵。6.如权利要求5所述的方法,其特征在于,还包括:在所述至少一次训练包括第i次训练和第i+1次训...
【专利技术属性】
技术研发人员:张园,周宏扬,唐乾坤,祝敏航,黎晨阳,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。