【技术实现步骤摘要】
用于获取目标网络的方法及装置
本公开的实施例涉及计算机
,具体涉及用于获取目标网络的方法及装置。
技术介绍
为了适应多种网络结构的需要,可以通过NAS(NeuralArchitectureSearch,神经网络架构搜索技术)训练得到超网络。即,超网络包含多种网络结构,可以适用于多种不同的网络结构应用,实现了网络结构的共享。
技术实现思路
本公开的实施例提出了用于获取目标网络的方法及装置。第一方面,本公开的实施例提供了一种用于获取目标网络的方法,该方法包括:获取待处理网络和上述待处理网络的网络结构参数,上述网络结构参数包含上述待处理网络包含的至少一个初始网络结构中每个初始网络结构的初始分布参数;查询上述待处理网络中的、与基准网络结构相对应的至少一个目标初始网络结构的目标初始分布参数;基于上述目标初始分布参数和基准网络结构对上述待处理网络进行迭代操作,并计算迭代后的待处理网络中、上述至少一个目标初始网络结构的更新目标分布参数;响应于上述迭代操作的达到设定的迭代次数,或上述更新目标分布参数对应的当 ...
【技术保护点】
1.一种用于获取目标网络的方法,包括:/n获取待处理网络和所述待处理网络的网络结构参数,所述网络结构参数包含所述待处理网络包含的至少一个初始网络结构中每个初始网络结构的初始分布参数;/n查询所述待处理网络中的、与基准网络结构相对应的至少一个目标初始网络结构的目标初始分布参数;/n基于所述目标初始分布参数和基准网络结构对所述待处理网络进行迭代操作,并计算迭代后的待处理网络中、所述至少一个目标初始网络结构的更新目标分布参数;/n响应于所述迭代操作的达到设定的迭代次数,或所述更新目标分布参数对应的当前相对熵小于等于设定阈值,将所述迭代操作后的待处理网络标记为目标网络,其中,所述当 ...
【技术特征摘要】
1.一种用于获取目标网络的方法,包括:
获取待处理网络和所述待处理网络的网络结构参数,所述网络结构参数包含所述待处理网络包含的至少一个初始网络结构中每个初始网络结构的初始分布参数;
查询所述待处理网络中的、与基准网络结构相对应的至少一个目标初始网络结构的目标初始分布参数;
基于所述目标初始分布参数和基准网络结构对所述待处理网络进行迭代操作,并计算迭代后的待处理网络中、所述至少一个目标初始网络结构的更新目标分布参数;
响应于所述迭代操作的达到设定的迭代次数,或所述更新目标分布参数对应的当前相对熵小于等于设定阈值,将所述迭代操作后的待处理网络标记为目标网络,其中,所述当前相对熵用于表征更新目标分布参数与所述基准网络结构之间的差异度。
2.根据权利要求1所述的方法,其中,所述基于所述目标初始分布参数和基准网络结构对所述待处理网络进行迭代操作,包括:
确定所述目标初始网络结构与所述基准网络结构的初始网络差异结构;
基于所述初始网络差异结构对所述待处理网络进行迭代操作,得到迭代后的待处理网络。
3.根据权利要求2所述的方法,其中,所述基于所述初始网络差异结构对所述待处理网络进行迭代操作,包括:
基于所述初始网络差异结构设置所述待处理网络的反馈参数,并根据所述反馈参数对所述待处理网络进行迭代操作。
4.根据权利要求1所述的方法,其中,所述计算迭代后的待处理网络中、所述至少一个目标初始网络结构的更新目标分布参数,包括:
查询所述迭代后的待处理网络中的、与所述基准网络结构对应的至少一个更新目标初始网络结构;
计算所述至少一个更新目标初始网络结构在所述迭代后的待处理网络中的更新目标分布参数。
5.根据权利要求1所述的方法,其中,所述方法还包括:
根据所述更新目标分布参数确定所述至少一个目标初始网络结构与所述基准网络结构之间的差异度,得到当前相对熵。
6.一种用于获取目标网络的装置,包括:
数据获取单元,被配置成获取待处理网络和所述待处理网络的网络结构参数,所述网络结构参数包含所述待处理网络包含的至少一个初始网络结构中每个初始网络结构的初始分布参数;
参数查询单元,被配置成查...
【专利技术属性】
技术研发人员:希滕,张刚,温圣召,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。