神经网络结构搜索方法、装置、服务器及存储介质制造方法及图纸

技术编号：37673086 阅读：19 留言：0更新日期：2023-05-26 04:36

本公开实施例提供一种神经网络结构搜索方法、装置、服务器及计算机可读存储介质。所述方法包括：将预训练的超网络部署至用户终端，并测试超网络的推理延时；依据用户的等待时间阈值，以及超网络在用户终端以及测试终端的推理延时，根据线性关系确定用户在测试终端中对应的等待时间；从查找表中匹配等待时间对应的最优子网络；其中，查找表为预先在测试终端中，调用超网络测试各推理延时下的最优子网络后统计生成；从超网络中继承最优子网络对应的网络权重，进行子网络部署。本公开实施例可以在特定的终端设备上实现部署最适合的子模型，实现模型精度和模型推理时间的最佳均衡，进而提升用户体验。升用户体验。升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络结构搜索方法、装置、服务器及存储介质

[0001]本公开实施例涉及神经网络
，尤其涉及一种神经网络结构搜索方法、装置、服务器及计算机可读存储介质。

技术介绍

[0002]随着科学技术的发展，神经网络结构的设计从依靠经验的手工设计转变为根据任务自动设计，从而实现高效神经网络模型设计、提高模型精度和提升算法生产的自动化水平。早期的神经网络结构搜索技术是基于强化学习和进化算法实现的，这类方法的缺点在于计算成本非常高，这严重限制了其应用前景。
[0003]目前在神经网络结构搜索
，通常是基于Cell型搜索空间、MobileNet型搜索空间等进行构建及操作的，这种技术方案的计算成本远低于基于强化学习和进化算法的神经网络结构搜索技术，但同样无法做到针对不同终端设备进行针对性优化。

技术实现思路

[0004]有鉴于现有技术中存在的上述问题，本公开实施例提供了一种神经网络结构搜索方法、装置、服务器及计算机可读存储介质，用以解决无法在不同的终端设备上应用其合适子模型的问题。
[0005]为解决上述问题，本公开实施例提供的技术方案是：一种神经网络结构搜索方法，包括：将预训练的超网络部署至用户终端，并测试所述超网络的推理延时；
[0006]依据用户的等待时间阈值，以及所述超网络在所述用户终端以及测试终端的推理延时，根据线性关系确定用户在所述测试终端中对应的等待时间；
[0007]从查找表中匹配所述等待时间对应的最优子网络；其中，所述查找表为预先在所述测试终端中，调用所述超...

【技术保护点】

【技术特征摘要】
1.一种神经网络结构搜索方法，其特征在于，包括：将预训练的超网络部署至用户终端，并测试所述超网络的推理延时；依据用户的等待时间阈值，以及所述超网络在所述用户终端以及测试终端的推理延时，根据线性关系确定用户在所述测试终端中对应的等待时间；从查找表中匹配所述等待时间对应的最优子网络；其中，所述查找表为预先在所述测试终端中，调用所述超网络测试各推理延时下的最优子网络后统计生成；从所述超网络中继承所述最优子网络对应的网络权重，进行子网络部署。2.如权利要求1所述的方法，其特征在于，所述查找表的生成方法，包括：将预训练的超网络部署至所述测试终端；按照指定步长对指定延时区间进行划分，得到若干待测试延时；确定所述超网络的子网络中，满足所述待测试延时的精度最高的子网络，作为所述最优子网络；统计各所述待测试延时分别对应的最优子网络，生成查找表。3.如权利要求2所述的方法，其特征在于，所述确定所述超网络的子网络中，满足所述待测试延时的精度最高的子网络，包括：从所述超网络中循环抽样若干子网络并分别测量推理延时，直到得到若干满足所述待测试延时的子网络，组成子网络集合；调整所述子网络集合中子网络的特征，并重新测量推理延时，将满足所述待测试延时的子网络投入至所述子网络集合；测试所述子网络集合中各子网络的推理精度，从中提取出精度最高的子网络。4.如权利要求3所述的方法，其特征在于，所述调整所述子网络集合中子网络的特征，包括：按照第一概率随机调整所述子网络集合中子网络的编码特征，和/或，按照第二概率将所述子网络集合中随机若干子网络的编码特征进行组合。5.如权利要求2所述的方法，其特征在于，在所述按照指定步长对指定延时区间进行划分之前，还包括：确定在所述测试终端中所述超网络的推理延时为a，所述超网络中最小子网络的推理延时为b；将所述a与b间的延时区间，作为所述指定延时区间。6.如权利要求1所述的方法，其特征在于，所述依据用户的等待时间阈值，以及所述超网络在所述用户终端以及测试终端的推理延时，根据线性关系确定用户在所述测试终端中对应的等待时间，包括：确定用户的等待时间阈值为h，在所述测...

【专利技术属性】
技术研发人员：刘嘉炜，杨青，
申请(专利权)人：度小满科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人