当前位置: 首页 > 专利查询>清华大学专利>正文

基于图价值网络的神经网络架构搜索方法技术

技术编号:33131512 阅读:22 留言:0更新日期:2022-04-17 00:49
本申请提供了一种基于图价值网络的神经网络架构搜索方法,涉及神经网络架构搜索技术领域,旨在提供一种学习已搜索过的架构,以推理得到其他网络架构的神经网络架构搜索方法。所述方法包括:获取神经细胞的当前架构;以图价值网络为价值函数,以所述神经细胞的当前架构为状态,以改变所述神经细胞的当前架构的多种规定行为为动作,进行强化学习训练,得到目标神经细胞的架构;将多个相同的所述目标神经细胞的架构进行堆叠,得到神经网络的架构。得到神经网络的架构。得到神经网络的架构。

【技术实现步骤摘要】
基于图价值网络的神经网络架构搜索方法


[0001]本申请涉及神经网络架构搜索
,特别是涉及一种基于图价值网络的神经网络架构搜索方法。

技术介绍

[0002]设计神经网络的架构一直以来是一个难题。神经网络架构搜索旨在让计算机通过搜索算法自动得出搜索空间中的最优架构。
[0003]相关技术中的搜索方法着重于搜索策略,对于如何从已搜索过的网络架构的表现中学习到知识,从而推理得到其它网络架构的表现的考虑不足,而将其简单化,往往假设网络中不同操作相互独立,不能学习到已搜索过的网络架构。

技术实现思路

[0004]鉴于上述问题,本专利技术实施例提供了一种基于图价值网络的神经网络架构搜索方法,以便克服上述问题或者至少部分地解决上述问题。
[0005]本专利技术实施例提供的一种基于图价值网络的神经网络架构搜索方法,所述方法包括:
[0006]获取神经细胞的当前架构;
[0007]以图价值网络为价值函数,以所述神经细胞的当前架构为状态,以改变所述神经细胞的当前架构的多种规定行为为动作,进行强化学习训练,得到目标神经细胞的架构;
[0008]将多个相同的所述目标神经细胞的架构进行堆叠,得到神经网络的架构。
[0009]可选地,以图价值网络为价值函数,以所述神经细胞的当前架构为状态,以改变所述神经细胞的当前架构的多种规定行为为动作,进行强化学习训练,得到目标神经细胞的架构,包括:
[0010]步骤1:对所述神经细胞的当前架构执行多种规定行为,得到所述神经细胞的多个搜索架构
[0011]步骤2:获取所述图价值网络对所述神经细胞的多个搜索架构的评分;
[0012]步骤3:以所述神经细胞的多个搜索架构中评分最高的架构,更新所述神经细胞的当前架构;
[0013]重复步骤1

3,满足预设条件时,停止更新所述神经细胞的当前架构,将最后一次更新的当前架构作为所述目标神经细胞的架构。
[0014]可选地,所述预设条件包括:所述神经细胞上一次更新后的架构为被执行终止动作后的架构;和/或
[0015]所述图价值网络对所述神经细胞的多个搜索架构的评分,低于所述图价值网络对所述神经细胞的上一次更新后的架构的评分。
[0016]可选地,所述方法还包括:
[0017]获取神经细胞的多个样本架构;
[0018]将所述多个样本架构作为预设图价值网络的输入,对所述预设图价值网络进行训练,所述预设图价值网络输出所述多个样本架构的预测评分,其中,所述损失函数是根据每个样本架构的预测评分和超网络的评分确定的;
[0019]当所述损失函数收敛到最小值时,结束对所述预设图价值网络的训练,得到所述图价值网络;
[0020]获取所述图价值网络对所述神经细胞的多个搜索架构的评分,包括:
[0021]将所述神经细胞的多个搜索架构输入所述图价值网络,得到所述图价值网络输出的所述神经细胞的多个搜索架构的评分。
[0022]可选地,将所述神经细胞的多个搜索架构输入所述图价值网络,得到所述图价值网络输出的所述神经细胞的多个搜索架构的评分,包括:
[0023]将所述神经细胞的多个搜索架构建模为对应的多个有向图;
[0024]将所述多个有向图输入所述图价值网络的卷积层,得到所述多个有向图的特征;
[0025]将所述多个有向图的特征依次输入所述图价值网络的全连接层和激活层,得到所述多个有向图的价值;
[0026]将所述多个有向图的价值,作为所述图价值网络输出的所述神经细胞的多个搜索架构对应的评分。
[0027]可选地,所述神经细胞包括具有连接关系的多个块;将所述神经细胞的多个搜索架构建模为对应的多个有向图,包括:
[0028]将所述神经细胞中的块建模为有向图中的点,且以独热编码表征所述块的操作类型;
[0029]将所述块之间的连接关系建模为有向图中的边;
[0030]将所述神经细胞的输入建模为有向图中的源;
[0031]将所述神经细胞的输出建模为有向图中的汇。
[0032]可选地,所述神经细胞包括具有连接关系的多个块,所述块接收任意数量个输入,所述输入包括同一个神经细胞中排序在前的块的输出,和/或排序在前的多个神经细胞的输出;
[0033]连接所述多个块的输出,得到所述神经细胞的输出。
[0034]可选地,在连接所述多个块的输出之前,包括:
[0035]获取所述多个块中每个块的输入;
[0036]针对所述每个块,将块的输入相加,执行预设操作,得到所述块的输出,其中,所述预设操作为卷积、池化和直接连接中的任一者。
[0037]可选地,所述改变所述神经细胞的当前架构的多种规定行为包括:更改块的操作类型、增加连接关系、删除连接关系、终止动作。
[0038]本专利技术实施例包括以下优点:
[0039]本实施例中,可以获取神经细胞的当前架构;以图价值网络为价值函数,以所述神经细胞的当前架构为状态,以改变所述神经细胞的当前架构的多种规定行为为动作,进行强化学习训练,得到目标神经细胞的架构;将多个相同的所述目标神经细胞的架构进行堆叠,得到神经网络的架构。如此,以神经细胞的当前架构为状态进行强化学习训练,可以学习到已搜索过的架构;以图价值网络为价值函数,可以准确评判各架构的价值;利用目标神
经细胞的架构堆叠得到神经网络的架构,只需搜索一个神经细胞的架构就可以搭建整个神经网络,以便节约计算量。
附图说明
[0040]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0041]图1是本专利技术实施例中一种基于图价值网络的神经网络架构搜索方法的步骤流程图;
[0042]图2是本专利技术实施例中一种根据神经细胞的架构建模成的有向图的示意图;
[0043]图3是本专利技术实施例中神经细胞的一个搜索架构示意图。
具体实施方式
[0044]为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
[0045]相关技术中的搜索方法主要分为基于强化学习的方法、基于进化算法的方法和基于梯度的方法。其中,相关技术中的基于强化学习的搜索方法,通常是将神经细胞内部架构看作是链式架构,从前往后依次构建,因而状态被定义为已构建好的神经细胞架构的前缀部分,而动作被定义为神经网络中的一个块,可以被添加到前缀部分的末尾。该方法在学习已搜索过的网络架构以推理得到其他网络架构方面的考虑不足,忽略了实际的神经网络中,不同的操作和不同的操作之间的连接关系与网络的表项之间的复杂关系。
[0046]相关技术中的搜索方法,当搜索空间允许神经网络层有任意数量的输入来源时,神经网络模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图价值网络的神经网络架构搜索方法,其特征在于,所述方法包括:获取神经细胞的当前架构;以图价值网络为价值函数,以所述神经细胞的当前架构为状态,以改变所述神经细胞的当前架构的多种规定行为为动作,进行强化学习训练,得到目标神经细胞的架构;将多个相同的所述目标神经细胞的架构进行堆叠,得到神经网络的架构。2.根据权利要求1所述的方法,其特征在于,以图价值网络为价值函数,以所述神经细胞的当前架构为状态,以改变所述神经细胞的当前架构的多种规定行为为动作,进行强化学习训练,得到目标神经细胞的架构,包括:步骤1:对所述神经细胞的当前架构执行多种规定行为,得到所述神经细胞的多个搜索架构;步骤2:获取所述图价值网络对所述神经细胞的多个搜索架构的评分;步骤3:以所述神经细胞的多个搜索架构中评分最高的架构,更新所述神经细胞的当前架构;重复步骤1

3,在满足预设条件时,停止更新所述神经细胞的当前架构,将最后一次更新的当前架构作为所述目标神经细胞的架构。3.根据权利要求2所述的方法,其特征在于,所述预设条件包括:所述神经细胞上一次更新后的架构为被执行终止动作后的架构;和/或所述图价值网络对所述神经细胞的多个搜索架构的评分,低于所述图价值网络对所述神经细胞的上一次更新后的架构的评分。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取神经细胞的多个样本架构;将所述多个样本架构作为预设图价值网络的输入,对所述预设图价值网络进行训练,所述预设图价值网络输出所述多个样本架构的预测评分,其中,所述损失函数是根据每个样本架构的预测评分和超网络的评分确定的;当所述损失函数收敛到最小值时,结束对所述预设图价值网络的训练,得到所述图价值网络;获取所述图价值网络对所述神经细胞的多个搜索架构的评分,包括...

【专利技术属性】
技术研发人员:朱文武王鑫秦一鉴
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1