用于生成网络模型信息的方法、装置、设备和介质制造方法及图纸

技术编号：25398997 阅读：34 留言：0更新日期：2020-08-25 23:04

本公开的实施例公开了用于生成网络模型信息的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括：对预先训练的初始超网络进行以下剪枝步骤：根据该初始超网络对应的帕累托曲线，确定该初始超网络各层的算子概率分布；基于该算子概率分布，对该初始超网络的各层的算子进行剪枝，得到子超网络；对该子超网络进行训练；响应于剪枝次数小于该预先设定的数目，将训练结束后的该子超网络作为新的初始超网络，继续执行该剪枝步骤。该实施方式通过对超网络进行剪枝，减轻了超网络中的权重耦合，对后续确定特定时延的高准确度的网络模型提供了方便。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成网络模型信息的方法、装置、设备和介质
本公开的实施例涉及计算机
，具体涉及用于生成网络模型信息的方法、装置、设备和计算机可读介质。
技术介绍
目前，在神经网络搜索过程中，超网络的某些层对于某些算子很少选择，原因在于包括这些多余算子的网络违背了时延限制，或者在验证数据集的效果很差。因此，需求一种对超网络进行剪枝的方法来去除上述超网络中每层的多余算子。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了用于生成网络模型信息的方法、装置、设备和计算机可读介质，来解决以上
技术介绍
部分提到的技术问题。第一方面，本公开的一些实施例提供了一种用于生成网络模型信息的方法，该方法包括：对预先训练的初始超网络进行以下剪枝步骤：根据上述初始超网络对应的帕累托曲线，确定上述初始超网络各层的算子概率分布；基于上述算子概率分布，对上述初始超网络的各层的算子进行剪枝，得到子超网络；对上述子超网络进行训练；响应于剪枝次数小于上述预先设定的数目，将训练结束后的上述子超网络作为新的初始超网络，继续执行上述剪枝步骤。第二方面，本公开的一些实施例提供了一种用于生成网络模型信息的装置，装置包括：剪枝单元，被配置成对预先训练的初始超网络进行以下剪枝步骤：根据上述初始超网络对应的帕累托曲线，确定上述初始超网络各层的算子概率分布...

【技术保护点】
1.一种用于生成网络模型信息的方法，包括：/n对预先训练的初始超网络进行以下剪枝步骤：/n根据所述初始超网络对应的帕累托曲线，确定所述初始超网络各层的算子概率分布；/n基于所述算子概率分布，对所述初始超网络的各层的算子进行剪枝，得到子超网络；/n对所述子超网络进行训练；/n响应于剪枝次数小于所述预先设定的数目，将训练结束后的所述子超网络作为新的初始超网络，继续执行所述剪枝步骤。/n

【技术特征摘要】
1.一种用于生成网络模型信息的方法，包括：
对预先训练的初始超网络进行以下剪枝步骤：
根据所述初始超网络对应的帕累托曲线，确定所述初始超网络各层的算子概率分布；
基于所述算子概率分布，对所述初始超网络的各层的算子进行剪枝，得到子超网络；
对所述子超网络进行训练；
响应于剪枝次数小于所述预先设定的数目，将训练结束后的所述子超网络作为新的初始超网络，继续执行所述剪枝步骤。

2.根据权利要求1所述的方法，其中，所述方法还包括：
基于所述剪枝后的超网络和演化算法，确定与目标时延相对应的网络模型；
对所确定的网络模型进行训练，得到训练结束后的网络模型。

3.根据权利要求2所述的方法，其中，所述方法还包括：
响应于所述训练结束后的网络模型包括目标检测网络，利用所述训练结束后的网络模型进行人脸识别。

4.根据权利要求1所述的方法，其中，所述对预先训练的初始超网络进行以下剪枝步骤还包括：
响应于剪枝次数等于预先设定的数目，将训练结束后的所述子超网络确定为剪枝后的超网络。

5.根据权利要求1所述的方法，其中，所述根据所述初始超网络对应的帕累托曲线，确定所述初始超网络各层的算子概率分布，包括：
对所述初始超网络进行多次采样，得到第一网络模型集合；
基于所述第一网络模型集合和演化算法，生成第二网络模型集合，其中，所述演化算法的演化过程中加入时延约束以使所述第二网络模型集合中的网络模型的时延满足预先设定的范围；
基于所述第二网络模型集合中各个网络模型的时延和准确度，确定帕累托曲线；
基于所述帕累托曲线，确定所述初始超网络各层的算子概率分布。

6.根据权利要求5所述的方法，其中，所述基于所述帕累托曲线，确定所述初始超网络各层的算子概率分布，包括：
抽取所述帕累托曲线上预定数目个点；
基于所述预定数目个点，确定相应的第三网络模型集合；
基于所述第三网络模型集合，确定所述初始超网络各层的算子概率分布。

7.根据权利要求5所...

【专利技术属性】
技术研发人员：夏鑫，肖学锋，王星，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人