The embodiment of the application discloses a neural network structure search method, device, electronic device and medium, and relates to the technical field of neural network. The specific implementation scheme is as follows: the controller sends the candidate network structure information to the trainer according to the preset communication protocol; the trainer trains the neural network model according to the candidate network structure information and sample data, and feeds back the index information generated based on the neural network model to the controller according to the preset communication protocol; the controller searches again according to the index information If the structure information of the candidate network is convergent, the structure of the candidate network is determined as the final structure of the target neural network. Based on the preset communication mechanism, the information interaction between the controller and the trainer is realized based on the preset communication protocol, which overcomes the technical problem that the controller and the trainer must be based on the same development framework, and decouples the controller and the trainer.
【技术实现步骤摘要】
神经网络结构搜索方法、装置、电子设备和介质
本申请实施例涉及计算机
,尤其涉及神经网络
,具体涉及一种神经网络结构搜索方法、装置、电子设备和介质。
技术介绍
通过神经网络结构搜索(NeuralArchitectureSearch,NAS),可以帮助模型调参等开发人员自动搜索出最优的神经网络结构。目前,在神经网络结构自动搜索的过程中,控制器(controller)和训练器(trainer)必须基于同样的开发框架,才能通过结构搜索、模型构建和训练等循环的过程实现最优网络结构的获取。因此,现有技术中控制器与训练器之间的耦合性太强,不仅无法作为独立的进程进行单独调试,而且在开发框架不同的情况下,需要对训练器进行二次开发和指标对齐,增加了开发难度和时间消耗,对开发者技术能力要求较高。
技术实现思路
本申请实施例提供了一种神经网络结构搜索方法、装置、电子设备和介质,能够解除控制器与训练器之间的耦合性,便于控制器和训练器的独立调试和运行。第一方面,本申请实施例提供了一种神经网络结构搜索方法,包括:控制器依据预设通信协议,将搜索得到的候选网络结构信息向训练器发送;所述训练器依据所述候选网络结构信息以及样本数据训练神经网络模型,并依据所述预设通信协议,将基于所述神经网络模型生成的指标信息向所述控制器反馈;所述控制器依据所述指标信息进行重新搜索,若搜索得到的候选网络结构信息收敛,则将结构信息收敛的候选网络结构确定为最终搜索得到的目标神经网络结构。上述申请中的 ...
【技术保护点】
1.一种神经网络结构搜索方法,其特征在于,包括:/n控制器依据预设通信协议,将搜索得到的候选网络结构信息向训练器发送;/n所述训练器依据所述候选网络结构信息以及样本数据训练神经网络模型,并依据所述预设通信协议,将基于所述神经网络模型生成的指标信息向所述控制器反馈;/n所述控制器依据所述指标信息进行重新搜索,若搜索得到的候选网络结构信息收敛,则将结构信息收敛的候选网络结构确定为最终搜索得到的目标神经网络结构。/n
【技术特征摘要】
1.一种神经网络结构搜索方法,其特征在于,包括:
控制器依据预设通信协议,将搜索得到的候选网络结构信息向训练器发送;
所述训练器依据所述候选网络结构信息以及样本数据训练神经网络模型,并依据所述预设通信协议,将基于所述神经网络模型生成的指标信息向所述控制器反馈;
所述控制器依据所述指标信息进行重新搜索,若搜索得到的候选网络结构信息收敛,则将结构信息收敛的候选网络结构确定为最终搜索得到的目标神经网络结构。
2.根据权利要求1所述的方法,其特征在于,所述控制器依据预设通信协议,将搜索得到的候选网络结构信息向训练器发送,包括:
所述控制器采用所述预设通信协议中与所述控制器的开发框架关联的信息读取方式,从所述控制器搜索得到的信息中提取网络结构子信息;
所述控制器依据所述预设通信协议中的格式封装方式,将所述网络结构子信息封装为格式统一的候选网络结构信息,并将所述候选网络结构信息向训练器发送。
3.根据权利要求1所述的方法,其特征在于,所述训练器依据所述预设通信协议,将基于所述神经网络模型生成的指标信息向所述控制器反馈,包括:
所述训练器采用所述预设通信协议中与所述训练器的开发框架关联的信息读取方式,从所述训练器生成的信息中提取指标子信息;
所述训练器依据所述预设通信协议中的格式封装方式,将所述指标子信息封装为格式统一的指标信息,并将所述指标信息向所述控制器反馈。
4.根据权利要求1所述的方法,其特征在于,所述控制器依据预设通信协议,将搜索得到的候选网络结构信息向训练器发送,包括:
所述控制器基于搜索策略在搜索空间中进行神经网络结构搜索,得到候选网络结构信息;
所述控制器依据预设通信协议,将所述候选网络结构信息向所述训练器发送。
5.根据权利要求1所述的方法,其特征在于,所述训练器依据所述候选网络结构信息以及样本数据训练神经网络模型,并依据预设通信协议,将基于所述神经网络模型生成的指标信息向所述控制器反馈,包括:
所述训练器依据预设通信协议,对接收到的候选网络结构信息进行解析;
所述训练器依据解析得到的候选网络结构信息构建神经网络模型,并基于所述样本数据对所述神经网络模型进行训练和测试,以生成所述神经网络模型的指标信息;
所述训练器依据预设通信协议,将所述指标信息向所述控制器反馈。
6.根据权利要求1所述的方法,其特征在于,所述控制器依据所述指标信息进行重新搜索,包括:
所述控制器依据所述训练器的开发框架,对所述指标信息进行标准化处理;
所述控制器依据标准化处理...
【专利技术属性】
技术研发人员:温圣召,希滕,张刚,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。