神经网络结构搜索方法及装置、芯片、设备、存储介质制造方法及图纸

技术编号：37798687 阅读：14 留言：0更新日期：2023-06-09 09:28

本申请提供了神经网络结构搜索方法及装置、芯片、设备、存储介质；其中，所述方法包括：对预设的第一神经网络进行迭代训练，得到训练好的第一神经网络；在所述训练好的第一神经网络中进行子网搜索，得到用于执行目标任务的目标子网；其中，所述迭代训练的每次迭代过程包括：从待训练的所述第一神经网络中采样得到多个第一子网；确定所述第一子网的采样分值，所述采样分值用于表征所述第一子网的收敛速度得分；从所述多个第一子网中选择所述采样分值满足可训练条件的第一子网，以及对所述满足可训练条件的第一子网进行训练。训练条件的第一子网进行训练。训练条件的第一子网进行训练。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络结构搜索方法及装置、芯片、设备、存储介质

[0001]本申请涉及人工智能技术，涉及但不限于神经网络结构搜索方法及装置、芯片、设备、存储介质。

技术介绍

[0002]人工智能领域，尤其是计算机视觉领域，针对不同任务需要设计不同的神经网络结构，以满足不同任务的需求。随着人工智能技术的发展，神经网络结构的设计，正在从手工设计转型为机器自动设计。神经网络结构搜索(Neural Network Architecture Search，NAS)是通过特定的算法自动搜索出表现优秀的深度学习网络结构。
[0003]然而，在神经网络结构搜索中，对于提高神经网络的准确度和收敛速度，依然存在一定的优化空间。

技术实现思路

[0004]有鉴于此，本申请提供的神经网络结构搜索方法及装置、芯片、设备、存储介质，能够提高第一神经网络的准确度和收敛速度，从而有益于提高目标子网的准确度和节约设备功耗。
[0005]根据本申请实施例的一个方面，提供一种神经网络结构搜索方法，包括：对预设的第一神经网络进行迭代训练，得到训练好的第一神经网络；在所述训练好的第一神经网络中进行子网搜索，得到用于执行目标任务的目标子网；其中，所述迭代训练的每次迭代过程包括：从待训练的所述第一神经网络中采样得到多个第一子网；确定所述第一子网的采样分值，所述采样分值用于表征所述第一子网的收敛速度得分；从所述多个第一子网中选择所述采样分值满足可训练条件的第一子网，以及对所述满足可训练条件的第一子网进行训练。
[0006]根据本申请实施例...

【技术保护点】

【技术特征摘要】
1.一种神经网络结构搜索方法，其特征在于，所述方法包括：对预设的第一神经网络进行迭代训练，得到训练好的第一神经网络；在所述训练好的第一神经网络中进行子网搜索，得到用于执行目标任务的目标子网；其中，所述迭代训练的每次迭代过程包括：从待训练的所述第一神经网络中采样得到多个第一子网；确定所述第一子网的采样分值，所述采样分值用于表征所述第一子网的收敛速度得分；从所述多个第一子网中选择所述采样分值满足可训练条件的第一子网，以及对所述满足可训练条件的第一子网进行训练。2.根据权利要求1所述的方法，其特征在于，所述确定所述第一子网的采样分值，包括：根据所述第一子网中的神经网络层的影响因子和/或参数量，确定所述采样分值；其中，所述影响因子和所述神经网络层至输出层的距离呈正相关。3.根据权利要求2所述的方法，其特征在于，所述第一子网是从待训练的所述第一神经网络中随机采样得到的。4.根据权利要求3所述的方法，其特征在于，所述根据所述第一子网中的神经网络层的影响因子和/或参数量，确定所述采样分值，包括：根据所述第一子网中的神经网络层的影响因子和/或参数量，确定所述第一子网的公平性分值；确定所述第一子网的随机性分值；根据所述第一子网的公平性分值和所述随机性分值，确定所述第一子网的采样分值。5.根据权利要求4所述的方法，其特征在于，所述根据所述第一子网的公平性分值和所述随机性分值，确定所述第一子网的采样分值，包括：根据所述第一子网的公平性分值、所述随机性分值和控制系数，确定所述第一子网的采样分值；其中，所述控制系数用于控制所述随机性分值在所述采样分值中的比重。6.根据权利要求4所述的方法，其特征在于，所述根据所述第一子网中的神经网络层的影响因子和/或参数量，确定所述第一子网的公平性分值，包括：确定所述第一子网中的神经网络层的参数量占所述神经网络层在所述第一神经网络中的参数量的比例；根据所述第一子网中的神经网络层的影响因子和所述比例，确定所述第一子网的公平性分值。7.根据权利要求1至6任一项所述的方法，其特征在于，所述在所述训练好的第一神经网络中进行子...

【专利技术属性】
技术研发人员：赵亚西，
申请(专利权)人：哲库科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人