神经网络结构搜索方法、装置、服务器及存储介质制造方法及图纸

技术编号:37673086 阅读:19 留言:0更新日期:2023-05-26 04:36
本公开实施例提供一种神经网络结构搜索方法、装置、服务器及计算机可读存储介质。所述方法包括:将预训练的超网络部署至用户终端,并测试超网络的推理延时;依据用户的等待时间阈值,以及超网络在用户终端以及测试终端的推理延时,根据线性关系确定用户在测试终端中对应的等待时间;从查找表中匹配等待时间对应的最优子网络;其中,查找表为预先在测试终端中,调用超网络测试各推理延时下的最优子网络后统计生成;从超网络中继承最优子网络对应的网络权重,进行子网络部署。本公开实施例可以在特定的终端设备上实现部署最适合的子模型,实现模型精度和模型推理时间的最佳均衡,进而提升用户体验。升用户体验。升用户体验。

【技术实现步骤摘要】
神经网络结构搜索方法、装置、服务器及存储介质


[0001]本公开实施例涉及神经网络
,尤其涉及一种神经网络结构搜索方法、装置、服务器及计算机可读存储介质。

技术介绍

[0002]随着科学技术的发展,神经网络结构的设计从依靠经验的手工设计转变为根据任务自动设计,从而实现高效神经网络模型设计、提高模型精度和提升算法生产的自动化水平。早期的神经网络结构搜索技术是基于强化学习和进化算法实现的,这类方法的缺点在于计算成本非常高,这严重限制了其应用前景。
[0003]目前在神经网络结构搜索
,通常是基于Cell型搜索空间、MobileNet型搜索空间等进行构建及操作的,这种技术方案的计算成本远低于基于强化学习和进化算法的神经网络结构搜索技术,但同样无法做到针对不同终端设备进行针对性优化。

技术实现思路

[0004]有鉴于现有技术中存在的上述问题,本公开实施例提供了一种神经网络结构搜索方法、装置、服务器及计算机可读存储介质,用以解决无法在不同的终端设备上应用其合适子模型的问题。
[0005]为解决上述问题,本公开实施例提供的技术方案是:一种神经网络结构搜索方法,包括:将预训练的超网络部署至用户终端,并测试所述超网络的推理延时;
[0006]依据用户的等待时间阈值,以及所述超网络在所述用户终端以及测试终端的推理延时,根据线性关系确定用户在所述测试终端中对应的等待时间;
[0007]从查找表中匹配所述等待时间对应的最优子网络;其中,所述查找表为预先在所述测试终端中,调用所述超网络测试各推理延时下的最优子网络后统计生成;
[0008]从所述超网络中继承所述最优子网络对应的网络权重,进行子网络部署。
[0009]进一步地,所述查找表的生成方法,包括:
[0010]将预训练的超网络部署至所述测试终端;
[0011]按照指定步长对指定延时区间进行划分,得到若干待测试延时;
[0012]确定所述超网络的子网络中,满足所述待测试延时的精度最高的子网络,作为所述最优子网络;
[0013]统计各所述待测试延时分别对应的最优子网络,生成查找表。
[0014]进一步地,所述确定所述超网络的子网络中,满足所述待测试延时的精度最高的子网络,包括:
[0015]从所述超网络中循环抽样若干子网络并分别测量推理延时,直到得到若干满足所述待测试延时的子网络,组成子网络集合;
[0016]调整所述子网络集合中子网络的特征,并重新测量推理延时,将满足所述待测试延时的子网络投入至所述子网络集合;
[0017]测试所述子网络集合中各子网络的推理精度,从中提取出精度最高的子网络。
[0018]进一步地,所述调整所述子网络集合中子网络的特征,包括:
[0019]按照第一概率随机调整所述子网络集合中子网络的编码特征,和/或,按照第二概率将所述子网络集合中随机若干子网络的编码特征进行组合。
[0020]进一步地,在所述按照指定步长对指定延时区间进行划分之前,还包括:
[0021]确定在所述测试终端中所述超网络的推理延时为a,所述超网络中最小子网络的推理延时为b;
[0022]将所述a与b间的延时区间,作为所述指定延时区间。
[0023]进一步地,所述依据用户的等待时间阈值,以及所述超网络在所述用户终端以及测试终端的推理延时,根据线性关系确定用户在所述测试终端中对应的等待时间,包括:
[0024]确定用户的等待时间阈值为h,在所述测试终端中所述超网络的推理延时为a,所述超网络的最小子网络的推理延时为b;
[0025]在所述用户终端中所述超网络的推理延时为a

,所述最小子网络的推理延时为b


[0026]确定所述查找表中与((b

a)/(b
’‑
a

))*(h

a

)+a最接近的推理延时,作为所述等待时间。
[0027]进一步地,所述超网络的训练方法,包括:
[0028]调用超网络对样本集进行训练推理,得到输出结果;
[0029]根据所述样本集的正确标签与所述输出结果生成的损失函数,进行模型参数的反馈更新,作为初训超网络;
[0030]从所述初训超网络中采样出最大子网络和若干其他子网络,并根据知识蒸馏法进行训练;
[0031]将所述最大子网络的输出结果作为伪标签,根据所述伪标签与所述其他子网络输出结果生成的损失函数,进行模型参数的反馈更新。
[0032]进一步地,所述超网络为:MobileNet搜索空间,或,ViT搜索空间。
[0033]本公开的实施例还提供了一种神经网络结构搜索装置,包括:
[0034]延时测试单元,用于将预训练的超网络部署至用户终端,并测试所述超网络的推理延时;
[0035]时间确定单元,用于依据用户的等待时间阈值,以及所述超网络在所述用户终端以及测试终端的推理延时,根据线性关系确定用户在所述测试终端中对应的等待时间;
[0036]网络匹配单元,用于从查找表中匹配所述等待时间对应的最优子网络;其中,所述查找表为预先在所述测试终端中,调用所述超网络测试各推理延时下的最优子网络后统计生成;
[0037]子网部署单元,用于从所述超网络中继承所述最优子网络对应的网络权重,进行子网络部署。
[0038]本公开的实施例还提供了一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的神经网络结构搜索方法。
[0039]本公开的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存
储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的神经网络结构搜索方法。
[0040]本公开实施例的有益效果在于,在对所有用户推送相同的神经网络模型的前提下,可以实现对特定终端设备的最佳的模型精度和推理延时的权衡,从而在该终端设备上部署最适合的子模型,提高使用不同终端设备的用户的体验。
附图说明
[0041]图1为本公开实施例的一种神经网络结构搜索方法的流程示意图;
[0042]图2为本公开实施例的一种MobileNet搜索空间的结构示意图;
[0043]图3为本公开实施例的一种轻量级ViT搜索空间的结构示意图;
[0044]图4为本公开实施例的一种超网络训练方法的流程示意图;
[0045]图5为本公开实施例的一种查找表生成方法的流程示意图;
[0046]图6为本公开实施例的一种子网络提取方法的流程示意图;
[0047]图7为本公开实施例的一种神经网络结构搜索装置的结构示意图;
[0048]图8为本公开实施例的一种服务器的硬件结构示意图。
具体实施方式
[0049]此处参考附图描述本申请的各种方案本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种神经网络结构搜索方法,其特征在于,包括:将预训练的超网络部署至用户终端,并测试所述超网络的推理延时;依据用户的等待时间阈值,以及所述超网络在所述用户终端以及测试终端的推理延时,根据线性关系确定用户在所述测试终端中对应的等待时间;从查找表中匹配所述等待时间对应的最优子网络;其中,所述查找表为预先在所述测试终端中,调用所述超网络测试各推理延时下的最优子网络后统计生成;从所述超网络中继承所述最优子网络对应的网络权重,进行子网络部署。2.如权利要求1所述的方法,其特征在于,所述查找表的生成方法,包括:将预训练的超网络部署至所述测试终端;按照指定步长对指定延时区间进行划分,得到若干待测试延时;确定所述超网络的子网络中,满足所述待测试延时的精度最高的子网络,作为所述最优子网络;统计各所述待测试延时分别对应的最优子网络,生成查找表。3.如权利要求2所述的方法,其特征在于,所述确定所述超网络的子网络中,满足所述待测试延时的精度最高的子网络,包括:从所述超网络中循环抽样若干子网络并分别测量推理延时,直到得到若干满足所述待测试延时的子网络,组成子网络集合;调整所述子网络集合中子网络的特征,并重新测量推理延时,将满足所述待测试延时的子网络投入至所述子网络集合;测试所述子网络集合中各子网络的推理精度,从中提取出精度最高的子网络。4.如权利要求3所述的方法,其特征在于,所述调整所述子网络集合中子网络的特征,包括:按照第一概率随机调整所述子网络集合中子网络的编码特征,和/或,按照第二概率将所述子网络集合中随机若干子网络的编码特征进行组合。5.如权利要求2所述的方法,其特征在于,在所述按照指定步长对指定延时区间进行划分之前,还包括:确定在所述测试终端中所述超网络的推理延时为a,所述超网络中最小子网络的推理延时为b;将所述a与b间的延时区间,作为所述指定延时区间。6.如权利要求1所述的方法,其特征在于,所述依据用户的等待时间阈值,以及所述超网络在所述用户终端以及测试终端的推理延时,根据线性关系确定用户在所述测试终端中对应的等待时间,包括:确定用户的等待时间阈值为h,在所述测...

【专利技术属性】
技术研发人员:刘嘉炜杨青
申请(专利权)人:度小满科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1