【技术实现步骤摘要】
模型处理方法、装置、电子设备以及存储介质
本申请涉及深度学习
,更具体地,涉及一种模型处理方法、装置、电子设备以及存储介质。
技术介绍
随着科学技术的快速发展,以神经网络模型为基础的深度学习技术得到快速发展,在包括图片识别、目标检测、语义分割、语音识别和自然语言处理等多个应用领域都取得了突破性成果。例如,相对于传统图像处理存在的诸多局限,深度学习对于复杂的图像处理任务有着得天独厚的优势。然而,伴随着计算能力的不断增强,模型也变得越来也大,参数量也几近爆炸式增长,使得深度学习对运算资源要求越来越高。这种对计算资源的严重依赖,限制了其在边缘设备上的应用。
技术实现思路
鉴于上述问题,本申请提出了一种模型处理方法、装置、电子设备以及存储介质,以改善上述问题。第一方面,本申请实施例提供了一种模型处理方法,所述方法包括:在当轮的当次处理过程中,获取确定的待处理网络模型包括的卷积层中的当前待加载冗余层;若所述当前待加载冗余层满足删除条件,在所述待处理网络模型加载的过程中取消加载所述当前待加载冗余层,以删除所述当前待加载冗余层;进入所述当轮的下一次所述处理过程,直到完成对所述卷积层中的所有待加载冗余层的判断,得到待调整网络模型;对所述待调整网络模型进行微调训练,并获取微调训练后的所述待调整网络模型的准确度,并判断所述准确度是否满足目标条件;若不满足目标条件,进入下一轮所述处理过程,直到获取准确度满足目标条件对应的待调整网络模型,将所述待调整模型作为压缩后得到的目标网络模型,其中,将当轮的微调训练后 ...
【技术保护点】
1.一种模型处理方法,其特征在于,所述方法包括:/n在当轮的当次处理过程中,获取确定的待处理网络模型包括的卷积层中的当前待加载冗余层;/n若所述当前待加载冗余层满足删除条件,在所述待处理网络模型加载的过程中取消加载所述当前待加载冗余层,以删除所述当前待加载冗余层;/n进入所述当轮的下一次所述处理过程,直到完成对所述卷积层中的所有待加载冗余层的判断,得到待调整网络模型;/n对所述待调整网络模型进行微调训练,并获取微调训练后的所述待调整网络模型的准确度,并判断所述准确度是否满足目标条件;/n若不满足目标条件,进入下一轮所述处理过程,直到获取准确度满足目标条件对应的待调整网络模型,将所述待调整模型作为压缩后得到的目标网络模型,其中,将当轮的微调训练后的所述待调整网络模型,作为下一轮处理过程中的确定的待处理网络模型。/n
【技术特征摘要】
1.一种模型处理方法,其特征在于,所述方法包括:
在当轮的当次处理过程中,获取确定的待处理网络模型包括的卷积层中的当前待加载冗余层;
若所述当前待加载冗余层满足删除条件,在所述待处理网络模型加载的过程中取消加载所述当前待加载冗余层,以删除所述当前待加载冗余层;
进入所述当轮的下一次所述处理过程,直到完成对所述卷积层中的所有待加载冗余层的判断,得到待调整网络模型;
对所述待调整网络模型进行微调训练,并获取微调训练后的所述待调整网络模型的准确度,并判断所述准确度是否满足目标条件;
若不满足目标条件,进入下一轮所述处理过程,直到获取准确度满足目标条件对应的待调整网络模型,将所述待调整模型作为压缩后得到的目标网络模型,其中,将当轮的微调训练后的所述待调整网络模型,作为下一轮处理过程中的确定的待处理网络模型。
2.根据权利要求1所述的方法,其特征在于,所述待处理网络模型包括多个卷积层,所述获取确定的待处理网络模型的卷积层包括的当前待加载冗余层,包括:
获取与确定的待处理网络模型的所述多个卷积层分别对应的第一权值参数,所述第一权值参数用于表征与卷积层对应的模板矩阵;
分别获取基于所述第一权值参数确定的与所述卷积层对应的重要性参数,并基于所述重要性参数对所述多个卷积层进行排序,所述重要性参数用于表征卷积层的重要程度,所述重要性参数的值越高对应的卷积层的排列顺序越靠前;
将所述重要性参数的值低于预设阈值的对应卷积层作为待加载冗余层;
若所述待加载冗余层包括一个冗余层,将所述待加载冗余层作为确定的待处理网络模型的卷积层包括的当前待加载冗余层;
若所述待加载冗余层包括多个冗余层,将所述多个待加载冗余层中排列顺序在前的冗余层作为确定的待处理网络模型的卷积层包括的当前待加载冗余层。
3.根据权利要求2所述的方法,其特征在于,每个卷积层包括多个第二权值参数,所述获取与确定的待处理网络模型的所述多个卷积层分别对应的第一权值参数,包括:
获取通过文件指针加载所述多个第二权值参数的移动范围,所述文件指针指向所述第二权值参数所表征的网络结构的存储位置;
基于所述移动范围获取与确定的待处理网络模型的所述多个卷积层分别对应的第一权值参数。
4.根据权利要求3所述的方法,其特征在于,所述分别获取基于所述第一权值参数确定的与所述卷积层对应的重要性参数,包括:
获取每个卷积层的所述多个第二权值参数之间的范式距离参数;
获取与所述范式距离参数对应的绝对值分布直方图;
获取基于所述绝对值分布直方图确定的加权平均参数;
基于所述加权平均参数获取第一权值参数;
将所述第一权值参数作为与所述卷积层对应的重要性参数。
5.根据权利要求1所述的方法,其特征在于,所述获取确定的待处理网络模型包括的卷积层中的当前待加载冗余层,包括:
获取确定的待处理网络模型包括的当前卷积层的卷积层序号;
获取所述确定的待处理网络模型的卷积层包括的待加载冗余层数组,所述待加载冗余层数组中存储有与待加载冗余层对应的卷...
【专利技术属性】
技术研发人员:彭登,
申请(专利权)人:广东博智林机器人有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。