【技术实现步骤摘要】
网络结构运行时间评估及评估模型生成方法、系统和装置
本申请涉及深度学习领域,特别涉及网络结构运行时间评估及评估模型生成方法、系统和装置。
技术介绍
目前,深度学习技术在很多方向上都取得了巨大的成功。在深度学习技术中,网络结构(即神经网络结构)的好坏对于模型的效果有着非常重要的影响,手工设计网络结构需要非常丰富的经验及众多尝试,并且众多参数会产生爆炸性的组合,难于实现,因此近年来神经网络架构搜索技术(NAS,NeuralArchitectureSearch)成为研究热点。NAS是用算法代替繁琐的人工操作,自动搜索出最佳的网络结构,NAS的实现主要包括搜索空间定义、搜索策略和搜索目标评估等关键要素。搜索目标评估是指在搜索的过程中,如何评估搜索到的一个网络结构的好坏,如评估网络结构的运行时间。目前,通常采用以下方式来评估网络结构的运行时间:确定搜索到的网络结构的计算复杂度,根据计算复杂度来评估网络结构的运行时间。但是,网络结构的计算复杂度和网络结构的实际运行时间往往存在较大的偏差,因此通过这种方式得到的评估
【技术保护点】
1.一种网络结构运行时间评估方法,其特征在于,包括:/n对待处理的网络结构进行拆解,得到构成所述网络结构的各神经元;/n针对每个神经元,分别基于所述神经元的参数及预先训练得到的评估模型,确定出所述神经元的运行时间;/n根据各神经元的运行时间确定出所述网络结构的运行时间。/n
【技术特征摘要】
1.一种网络结构运行时间评估方法,其特征在于,包括:
对待处理的网络结构进行拆解,得到构成所述网络结构的各神经元;
针对每个神经元,分别基于所述神经元的参数及预先训练得到的评估模型,确定出所述神经元的运行时间;
根据各神经元的运行时间确定出所述网络结构的运行时间。
2.根据权利要求1所述的方法,其特征在于,
所述评估模型的数量为一个或大于一个;
当所述评估模型的数量大于一个时,所述基于所述神经元的参数及预先训练得到的评估模型,确定出所述神经元的运行时间包括:
将所述神经元的参数分别输入各评估模型,得到各评估模型评估出的所述神经元的运行时间,融合得到的各运行时间确定出所述神经元的运行时间。
3.根据权利要求2所述的方法,其特征在于,
所述融合得到的各运行时间确定出所述神经元的运行时间包括:计算得到的各运行时间的均值,将所述均值作为所述神经元的运行时间。
4.根据权利要求1所述的方法,其特征在于,
所述根据各神经元的运行时间确定出所述网络结构的运行时间包括:将各神经元的运行时间相加,将相加之和作为所述网络结构的运行时间。
5.一种评估模型生成方法,其特征在于,包括:
从预定范围内的神经元中选出部分神经元;
针对选出的每个神经元,分别构建所述神经元对应的训练数据,所述训练数据中包含所述神经元的参数及所述神经元的运行时间;
根据所述训练数据训练得到评估模型,以便当需要对待处理的网络结构进行运行时间评估时,利用所述评估模型及神经元的参数分别确定出构成所述网络结构的各神经元的运行时间,根据各神经元的运行时间确定出所述网络结构的运行时间。
6.根据权利要求5所述的方法,其特征在于,
所述从预定范围内的神经元中选出部分神经元包括:从搜索空间中所有可能的神经元中随机选出部分神经元。
7.根据权利要求5所述的方法,其特征在于,
该方法进一步包括:针对选出的每个神经元,分别将所述神经元发送到指定设备上运行,得到所述神经元的运行时间。
8.根据权利要求5所述的方法,其特征在于,
所述评估模型的数量为一个;
或者,所述评估模型的数量大于一个,以便当需要对待处理的网络结构进行运行时间评估时,针对任一神经元,将所述神经元的参数分别输入各评估模型,得到各评估模型评估出的所述神经元的运行时间,融合得到的各运行时间确定出所述神经元的运行时间。
9.一种网络结构运行时间评估装置,其特征在于,包括:拆解单元以及评估单元;
所述拆解单元,用于对待处理的网络结构进行拆解,得到构成所述网络结构的各神经元;
所述评估单元,用于针对每个神经元,分别基于所述神经元的参数及预先训练得到的评估模型,确定出所述神经元的...
【专利技术属性】
技术研发人员:张刚,温圣召,希滕,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。