一种基于梯度架构搜索的表现预测压缩方法技术

技术编号：34800178 阅读：65 留言：0更新日期：2022-09-03 20:06

本发明专利技术公开一种基于梯度架构搜索的表现预测压缩方法，属于神经网络压缩与加速技术领域，通过在图像分类训练集中进行搜索训练，通过softmax函数将搜索空间松弛为连续，采用放射缩放变换在保证优化结果不变的情况下，解决内点优化问题，以提高网络模型的鲁棒性，产生梯度优化网络模型；之后以准确率为基准对梯度优化网络模型进行训练，根据表现情况进行排序，并与图像分类验证集进行比较以评估网络性能，迭代更新梯度优化网络结构，以减少训练时间并提高网络精度，最后对所得梯度优化网络结构进行离散化微调和剪枝微调，从而在图像分类任务中实现轻量化网络结构的压缩。任务中实现轻量化网络结构的压缩。任务中实现轻量化网络结构的压缩。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于梯度架构搜索的表现预测压缩方法

[0001]本专利技术属于神经网络压缩与加速
，具体涉及一种基于梯度架构搜索的表现预测压缩方法。

技术介绍

[0002]近年来研究者们设计出各种神经网络模型，以适应于不同图像分类任务中。随着图像分类任务所需求的神经网络数量规模越来越多，使得神经网络的结构越来越复杂，导致图像分类任务所要处理的参数越来越多，需要数十亿次浮点运算才能完成对一幅图像的处理。而庞大的计算量与参数量也导致神经网络在诸多实际应用中部署困难，如基于移动设备、电脑和可穿戴的电子设备等应用。
[0003]随着对神经网络的研究，研究者们发现神经网络中存在大量的冗余参数，进而提出一系列模型压缩技术，包括参数剪枝、知识蒸馏、模型量化以及网络轻量化等技术，通过在保证准确率不变的情况下对网络参数进行剔除等方法尽可能降低神经网络的复杂度。随着对模型压缩技术的深入研究，人们更关注神经网络自身的结构，在尽可能保证性能不变的情况下对神经网络结构进行简化，以达到模型压缩的目的。因此研究者们对自动神经架构搜索方法进行了深入研究，并对NAS(神经结构搜索)算法进行了各种改进，相关研究工作复杂而丰富。但经过大量的研究发现，其搜索算法的计算量仍然很大，效率仍然很低，影响搜索后网络结构的性能，会进一步影响网络结构的轻量化。因此如何降低计算复杂度、提高搜索效率成为了当前研究的关键。

技术实现思路

[0004]本专利技术目的在于针对上述现有技术中图像分类神经结构搜索效率低和训练耗时长的问题，提供一种基于梯度架构搜索的...

【技术保护点】

【技术特征摘要】
1.一种基于梯度架构搜索的表现预测压缩方法，其特征在于，包括以下步骤：S1：根据图片分类训练集对构建的连续搜索空间依次进行节点优化和内点优化，训练后获得梯度优化网络模型；S2：针对梯度优化网络模型，使用表现预测算法搜索训练和评估验证，获得候选梯度优化网络结构；S3：将图片分类验证集输入至候选梯度优化网络结构，若输出的图像分类准确率低于预设值，则调整S1中连续搜索空间的宽度和深度，重新获得梯度优化网络结构；否则，将候选梯度优化网络结构作为梯度优化网络结构；S4：对梯度优化网络结构进行离散化微调和剪枝微调，获得图像分类轻量化剪枝后网络。2.根据权利要求1所述基于梯度架构搜索的表现预测压缩方法，其特征在于，S1的具体过程包括：S11：根据图像分类数据集中的图片分类训练集，构建由5个block组成的训练集，各block包括两种不同的cell；S12：初始化宽度和深度分别为N和F的搜索空间，定义搜索空间中cell与block之间的关系为：Cell
m
的输出为其中，Cell
m
代表第m个cell；b代表各block的编号；S13：对搜索空间进行归一化，得到连续搜索空间；S14：对连续搜索空间进行训练，具体包括：S141：采用梯度优化算法对连续搜索空间进行节点优化，具体为：对于在第b个block的Cell
m
，将其之前所有输出作为Cell
m
的cell节点图，定义连续搜索空间为：其中，x
(j)
为Cell
m
的cell节点图中的第j个节点；o(i,j)代表有向边运算操作；x
(i)
为Cell
m
的cell节点图中的第i个节点；采用softmax函数对所有cell的cell节点图中的所有节点进行松弛，将连续搜索空间的训练过程转化为对连续变量的节点优化过程，即其中，代表对第v个cell和第u个cell之间的有向边e
(v,u)
进行运算o操作；argmax代表最大值自变量点集函数；为有向边...

【专利技术属性】
技术研发人员：刘欣刚，狄玉洁，欧阳智强，蒋翔宇，贺鸿程，冯承霖，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人