神经网络结构搜索方法及系统、电子设备及存储介质技术方案

技术编号:26506503 阅读:58 留言:0更新日期:2020-11-27 15:34
本发明专利技术公开了一种神经网络结构搜索方法及系统、电子设备及存储介质,神经网络结构搜索方法包括:利用训练集对生成的神经网络模型进行训练,以及利用验证集验证神经网络模型的当前性能指标;将用于表征神经网络模型的结构的参数输入至推理时间预测模型,预测得到神经网络模型在目标硬件平台的推理时间;若当前性能指标和预测的推理时间均满足要求,则输出神经网络模型;否则,根据由当前性能指标和预测的推理时间计算得到的奖励值更新控制器的参数,并对控制器生成的神经网络模型重新进行训练,直至当前性能指标和预测的推理时间均满足要求。本发明专利技术能够高效准确地搜索出满足不同硬件平台要求的最优结构的神经网络模型。

【技术实现步骤摘要】
神经网络结构搜索方法及系统、电子设备及存储介质
本专利技术涉及计算机
,特别涉及一种神经网络结构搜索方法及系统、电子设备及存储介质。
技术介绍
人工智能已经在各个领域取得了很大的成功,这大部分依赖于手工设计的神经网络模型。近年来,神经网络结构搜索(NeuralArchitectureSearch,NAS)有了非常大的突破,可以帮助开发人员自动搜索出最优的神经网络结构。然而,通过NAS搜索出来的一种最优的神经网络结构往往无法适用于所有的硬件平台。在面对不同硬件平台的不同推理时间要求时,现有NAS无法准确高效地评估出搜索出的神经网络结构的推理时间。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中的NAS无法准确高效地评估出搜索出的神经网络结构的推理时间的缺陷,提供一种神经网络结构搜索方法及系统、电子设备及存储介质。本专利技术是通过下述技术方案来解决上述技术问题:本专利技术的第一方面提供一种神经网络结构搜索方法,包括以下步骤:利用训练集对生成的神经网络模型进行训练,以及利用验证集本文档来自技高网...

【技术保护点】
1.一种神经网络结构搜索方法,其特征在于,包括以下步骤:/n利用训练集对生成的神经网络模型进行训练,以及利用验证集验证所述神经网络模型的当前性能指标;/n将用于表征所述神经网络模型的结构的参数输入至推理时间预测模型,预测得到所述神经网络模型在目标硬件平台的推理时间;其中,所述推理时间预测模型通过不同结构的神经网络模型以及每个神经网络模型在所述目标硬件平台的推理时间训练得到;/n若所述当前性能指标和预测的推理时间均满足要求,则输出所述神经网络模型;否则,根据由所述当前性能指标和预测的推理时间计算得到的奖励值更新控制器的参数,并对所述控制器生成的神经网络模型重新进行训练,直至训练得到的神经网络模型...

【技术特征摘要】
1.一种神经网络结构搜索方法,其特征在于,包括以下步骤:
利用训练集对生成的神经网络模型进行训练,以及利用验证集验证所述神经网络模型的当前性能指标;
将用于表征所述神经网络模型的结构的参数输入至推理时间预测模型,预测得到所述神经网络模型在目标硬件平台的推理时间;其中,所述推理时间预测模型通过不同结构的神经网络模型以及每个神经网络模型在所述目标硬件平台的推理时间训练得到;
若所述当前性能指标和预测的推理时间均满足要求,则输出所述神经网络模型;否则,根据由所述当前性能指标和预测的推理时间计算得到的奖励值更新控制器的参数,并对所述控制器生成的神经网络模型重新进行训练,直至训练得到的神经网络模型的当前性能指标和预测的所述神经网络模型在目标硬件平台的推理时间均满足要求;
其中,所述当前性能指标和预测的推理时间均满足要求是指所述当前性能指标达到目标性能指标,且预测的推理时间小于所述目标硬件平台限制的推理时间。


2.如权利要求1所述的方法,其特征在于,所述利用训练集对生成的神经网络模型进行训练的步骤具体包括:利用训练集在确定的搜索空间内搜索神经网络模型。


3.如权利要求1所述的方法,其特征在于,所述推理时间预测模型为循环神经网络模型。


4.如权利要求3所述的方法,其特征在于,所述神经网络模型包括多个子网络模型,所述推理时间预测模型包括链式连接的多个循环单元,其中,所述子网络模型与所述循环单元一一对应;
所述将用于表征所述神经网络模型的结构的参数输入至推理时间预测模型,具体包括:
将用于表征所述子网络模型的结构的参数分别输入至与所述子网络模型对应的循环单元。


5.如权利要求1-4中任一项所述的方法,其特征在于,利用以下公式计算所述奖励值Reward:



其中,Pcurrent为训练得到的神经网络模型的当前性能指标,Latcurrent为预测的所述神经网络模型在目标硬件平台的推理时间,Lattarget为所述目标硬件平台限制的推理时间,α为调节平衡的超参数。


6.一种神经网络结构搜索系统,其特征在于,包括训练验证模块、时间预测模块、指标判断模块、参数更新模块、模型输出模块;
所述训练验证模块用于利用训练集对生成的神经网络模型进行训练,以及利用验证集验证所述神经网络模型的当前性能指标;
所述时间预测模块用于将用于表征所...

【专利技术属性】
技术研发人员:李明蹊
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1