网络获取的方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号:38684086 阅读:21 留言:0更新日期:2023-09-02 22:56
本申请公开了一种网络获取的方法、装置、电子设备及计算机可读介质,应用于电子设备,所述方法包括:获取初始超网络,所述初始超网络包括至少一个子网络;从所述至少一个子网络中,查找运算能力满足指定运算需求的目标子网络;基于预先获取的训练数据对所述目标子网络进行训练,以更新所述初始超网络。本申请通过查找并训练运算能力满足指定运算需求的目标子网络,使目标子网络能够获得较为充分的训练,并使得到训练的子网络尽量聚集在给定的约束条件下,避免子网络过度分散。避免子网络过度分散。避免子网络过度分散。

【技术实现步骤摘要】
网络获取的方法、装置、电子设备及计算机可读介质


[0001]本申请涉及计算机
,更具体地,涉及一种网络获取的方法、装置、电子设备及计算机可读介质。

技术介绍

[0002]目前,深度神经网络在很多领域取得了重要的成果,而深度神经网络模型的结构对其性能具有直接的影响。为了以较高效率选出适应不同任务需求的最优的模型结构,可以预先构建包含所有可能的模型结构的超网络,对超网络进行训练,然后在实际深度学习任务中,从超网络中搜索出合适的子网络作为执行该深度学习任务的神经网络模型。然而,目前对超网络的训练方法效果较差,不够理想。

技术实现思路

[0003]本申请提出了一种网络获取的方法、装置、电子设备及计算机可读介质。
[0004]第一方面,本申请实施例提供了一种网络获取的方法,应用于电子设备,所述方法包括:获取初始超网络,所述初始超网络包括至少一个子网络;从所述至少一个子网络中,查找运算能力满足指定运算需求的目标子网络;基于预先获取的训练数据对所述目标子网络进行训练,以更新所述初始超网络。
[0005]第二方面,本申请实施例还提供了一种网络获取的装置,应用于电子设备,所述装置包括:获取单元、查找单元以及训练单元。其中,获取单元,用于获取初始超网络,所述初始超网络包括至少一个子网络;查找单元,用于从所述至少一个子网络中,查找运算能力满足指定运算需求的目标子网络;训练单元,用于基于预先获取的训练数据对所述目标子网络进行训练,以更新所述初始超网络。
[0006]第三方面,本申请实施例还提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述方法。
[0007]第四方面,本申请实施例还提供了一种计算机可读介质,所述可读存储介质存储有处理器可执行的程序代码,所述程序代码被所述处理器执行时使所述处理器执行上述方法。
[0008]第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法。
[0009]本申请提供的网络获取的方法、装置、电子设备及计算机可读介质,该方法首先获取初始超网络,从超网络中包括的至少一个子网络中,查找运算能力满足指定运算需求的目标子网络,基于预先获取的训练数据对所述目标子网络进行训练,以更新所述初始超网络。若随机搜索子网络进行训练,容易被采样到的子网络能够得到较充分的训练,而不容易被采样到的子网络不能得到较充分的训练,使训练的子网络过于分散。本申请通过查找并训练运算能力满足指定运算需求的目标子网络,可以排除对运算能力差的子网络的训练,
使得训练的子网络尽量聚集在给定的约束条件下,提高了训练效率,同时避免子网络过度分散。
[0010]本申请实施例的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请实施例的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0012]图1示出了超网络训练过程中子网的统计分布情况;
[0013]图2示出了本申请实施例提供的网络获取的方法应用的场景图;
[0014]图3示出了本申请实施例提供的网络获取的方法流程图;
[0015]图4示出了本申请又一实施例提供的网络获取的方法流程图;
[0016]图5示出了本申请还一实施例提供的网络获取的方法流程图;
[0017]图6示出了本申请还一实施例提供的网络获取的方法流程图;
[0018]图7示出了本申请另一实施例提供的网络获取的方法流程图;
[0019]图8示出了本申请实施例提供的网络获取的装置的单元框图;
[0020]图9示出了本申请实施例提供的电子设备的示意图;
[0021]图10示出了本申请实施例提供的计算机可读存储介质的结构框图;
[0022]图11示出了本申请实施例提供的计算机程序产品的结构框图。
具体实施方式
[0023]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0024]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0025]目前,深度神经网络在很多领域取得了重要的成果,而深度神经网络模型的结构对其性能具有直接的影响。传统的神经网络模型的结构是专家根据经验设计的,需要丰富的专家知识,网络结构的设计成本较高。现在通常使用网络结构自动搜索(Neural Architecture Search,NAS)通过算法代替繁琐的人工操作,自动搜索出最佳的神经网络架构。
[0026]具体的,可以预先构建包含所有可能的模型结构的超网络,对超网络进行训练,然后在实际深度学习任务中,从超网络中搜索出合适的子网络作为执行该深度学习任务的神经网络模型。
[0027]然而,专利技术人在研究中发现,通过目前方法随机搜索子网络进行训练,容易导致采样到的子网络过于分散。且容易被采样到的子网络能够得到较充分的训练,而不容易被采样到的子网络不能得到较充分的训练,导致一些区域的子网络训练不充分,训练获得的超网络效果不理想。例如,请参阅图1,图1的横坐标为浮点运算次数(Floating Point Operations,FLOPs),可以用于表征子网络模型的复杂程度,纵坐标为数量(Quantity),可以用于表征子网络被采样的次数,可以看到浮点运算次数FLOPs分布在40G~60G区间内被采样到的几率会很高,而分布在其他区域内的子网被采样到的几率很低,导致这些区域内的子网络会训练不充分。其中,G为单位giga,即1GFLOPs=109FLOPs。
[0028]因此,为了克服上述缺陷,本申请提供了一种网络获取的方法、装置、电子设备及计算机可读介质,该方法首先获取初始超网络,从超网络中包括的至少一个子网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
任一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1

7任一项...

【专利技术属性】
技术研发人员:赵娟萍
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1