【技术实现步骤摘要】
用于预测模型结构的延时的方法和装置
本公开的实施例涉及计算机
,具体涉及人工智能
,尤其涉及用于预测模型结构的延时的方法和装置。
技术介绍
随着人工智能技术和数据存储技术的发展,深度神经网络在许多领域的任务中取得了重要的成果。深度神经网络的网络结构对任务的执行效果具有直接的影响,因此,构建最优的神经网络结构成为了深度学习的一个研究热点。NAS(neuralarchitecturesearch,自动化神经网络结构搜索)是指用算法代替繁琐的人工操作,自动搜索出最佳的神经网络架构。通常NAS是基于特定的处理器性能约束条件进行的,例如在指定硬件延时约束条件的情况下,搜索出符合该约束条件的神经网络结构。而由于不同的硬件设备的性能不同,同一神经网络结构在不同硬件设备中运行时产生的实际延时可能存在差异。目前的方法是基于已有的硬件设备构建延时表,在网络结构自动搜索过程中根据延时表查找不同网络结构的延时。
技术实现思路
本公开的实施例提出了用于预测模型结构的延时的方法和装置、电子设备和计算机可读介质。< ...
【技术保护点】
1.一种用于预测模型结构的延时的方法,包括:/n通过执行训练操作获得训练完成的延时预测模型;/n利用训练完成的延时预测模型预测目标模型结构在设备运行环境中运行产生的延时;/n其中,所述训练操作包括:/n在预设的网络结构搜索空间中采样出网络结构作为样本模型结构;/n获取所述样本模型结构在所述设备运行环境中运行时产生的实际延时;/n利用所述样本模型结构训练预设的延时预测模型;/n基于所述样本模型结构在设备的运行环境中运行时产生的实际延时确定训练后的所述延时预测模型的预测误差,响应于确定所述预测误差满足预设的收敛条件,得出训练完成的延时预测模型。/n
【技术特征摘要】
1.一种用于预测模型结构的延时的方法,包括:
通过执行训练操作获得训练完成的延时预测模型;
利用训练完成的延时预测模型预测目标模型结构在设备运行环境中运行产生的延时;
其中,所述训练操作包括:
在预设的网络结构搜索空间中采样出网络结构作为样本模型结构;
获取所述样本模型结构在所述设备运行环境中运行时产生的实际延时;
利用所述样本模型结构训练预设的延时预测模型;
基于所述样本模型结构在设备的运行环境中运行时产生的实际延时确定训练后的所述延时预测模型的预测误差,响应于确定所述预测误差满足预设的收敛条件,得出训练完成的延时预测模型。
2.根据权利要求1所述的方法,其中,所述训练操作还包括:
响应于确定所述预测误差不满足预设的收敛条件,执行下一次训练操作,并且在下一次训练操作中增加采样的网络结构的数量。
3.根据权利要求1所述的方法,其中,所述方法还包括:通过执行多次迭代操作生成用于执行目标分类任务的神经网络模型;
所述迭代操作包括:
基于预设的控制器从预设的网络结构搜索空间内搜索出当前迭代操作中的候选网络结构;
利用所述训练完成的延时预测模型预测所述候选网络结构在设备运行环境中运行产生的延时;
基于所述候选网络结构在设备运行环境中运行产生的延时,作为反馈信息返回至所述控制器,以使所述控制器根据所述反馈信息进行更新;
响应于确定所述反馈信息达到预设的条件,将所述当前迭代操作中的候选网络结构确定为搜索出的用于执行目标分类任务的神经网络模型。
4.根据权利要求3所述的方法,其中,所述迭代操作还包括:
基于待分类的样本数据训练所述候选网络结构,得到训练完成的候选网络结构的分类准确率;
所述基于所述候选网络结构在设备运行环境中运行产生的延时,作为反馈信息返回至所述控制器,包括:
将所述候选网络结构的分类准确率作为奖励信息,所述候选网络结构在设备运行环境中运行产生的延时作为惩罚信息,确定出当前迭代操作的反馈信息。
5.根据权利要求3所述的方法,其中,所述基于所述候选网络结构在设备运行环境中运行产生的延时,作为反馈信息返回至所述控制器,包括:
基于待分类的样本数据训练所述候选网络结构,测试训练后的候选网络结构的实际延时;
响应于确定所述候选网络结构的实际延时超过所述预测模型预测出的候选网络结构在设备运行环境中运行产生的延时,根据所述候选网络结构的实际延时与所述延时预测模型预测出的候选网络结构在设备运行环境中运行产生的延时之间的差异确定当前的反馈信息。
6.一种用于预测模型结构的延时的装置,包括:
训练单元,被配置为通过执行训练操作获得训练完成的延时预测模型;
预测单元,被配置为利用训练完成的延时预测模型预测目标...
【专利技术属性】
技术研发人员:希滕,张刚,温圣召,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。