【技术实现步骤摘要】
【国外来华专利技术】利用权重共享的神经架构搜索
[0001]相关申请的交叉引用
[0002]本申请要求于2020年3月23日提交的美国专利申请序列号62/993,573的优先权,该申请的全部内容通过引用并入本文。
技术介绍
[0003]本说明书涉及确定神经网络的架构。
[0004]神经网络是采用一层或多层非线性单元来针对接收到的输入预测输出的机器学习模型。除了输出层之外,一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中的下一层——即,下一隐藏层或输出层——的输入。网络的每层根据相应参数的集合的当前值来从接收到的输入生成输出。
技术实现思路
[0005]本说明书描述了系统如何在一个或多个位所中的一个或多个计算机上被实施为计算机程序,所述计算机程序确定被配置为执行特定机器学习任务的神经网络的网络架构。
[0006]更具体地,系统确定在指定的资源约束的集合内执行机器学习任务的神经网络的架构。即,资源约束指定了神经网络在执行任务时消耗了多少计算资源的约束。
[0007]本说明书所描述的主题的特定实施例可以被实施,以便实现以下优点中的一个或多个。
[0008]在计算资源有限的设备上——例如移动设备、智能设备或其他边缘设备——执行机器学习任务需要既准确又计算高效的神经网络架构。例如,相同的具体神经网络架构如果被部署在速度较慢的设备上,则它可能又需要多于一个数量级的推断时间。此外,由于硬件和设备驱动器的差异,即使具有类似整体速度的两个设备(例如由不同制造商制造的智能电话CPU)也可能偏向非常不同的 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个计算机执行的方法,所述方法包括:接收特定机器学习任务的训练数据和验证数据;接收指定用于执行所述特定机器学习任务的目标时延的数据;以及使用所述训练数据和所述验证数据,从候选架构的空间中选择要被部署用于执行所述机器学习任务的神经网络的架构,其中所述空间中的每个候选架构具有由决策值的对应集合定义的模型参数的共享集合的不同子集,所述决策值的对应集合包括多个分类决策中的每个分类决策的相应决策值,并且其中所述选择包括:联合更新(i)控制器策略参数的集合,所述控制器策略参数针对所述多个分类决策中的每个分类决策定义该分类决策的决策值上的相应概率分布,以及(ii)参数的所述共享集合,其中:更新控制器策略参数的所述集合包括通过强化学习更新控制器策略参数的所述集合以最大化奖励函数,所述奖励函数测量由决策值的集合定义的候选架构的估计质量和估计时延,决策值的所述集合是从使用所述控制器策略参数生成的概率分布采样的,所述奖励函数包括测量候选架构的所述估计质量的质量项以及基于将所述候选架构的所述估计时延与所述目标时延进行比较的项的绝对值的时延项,并且更新模型参数的所述共享集合包括更新模型参数的所述共享集合以优化目标函数,所述目标函数测量由决策值的所述集合定义的所述候选架构的所述特定机器学习任务的性能,决策值的所述集合是从使用所述控制器策略参数生成的所述概率分布采样的;以及在所述联合更新之后,选择由所述多个分类决策中的每个分类决策的相应特定决策值定义的候选架构作为所述神经网络的所述架构。2.根据权利要求1所述的方法,其中所述联合更新包括重复地执行包括以下的操作:根据所述控制器策略参数的当前值,生成所述多个分类决策中的每个分类决策相应概率分布,使用所述相应概率分布,选择所述多个分类决策中的每个分类决策的相应决策值,使用所述验证数据,确定具有下述候选架构的神经网络的所述特定机器学习任务的估计质量:该候选架构具有由所选择的分类决策的决策值定义的模型参数的所述共享集合的子集,其中所述质量根据由所选择的分类决策的决策值定义的模型参数的所述共享集合的所述子集的当前值来估计,使用所述验证数据,确定在执行具有下述候选架构的所述神经网络的所述特定机器学习任务时的估计时延:该候选架构具有由所选择的分类决策的决策值定义的模型参数的所述共享集合的所述子集,通过强化学习,确定对所述控制器策略参数的更新,所述更新基于所述估计质量和所述估计时延改进所述奖励函数,以及使用所述训练数据,通过优化所述特定机器学习任务的目标函数来确定对模型参数的所述共享集合的所述子集的当前值的更新,所述子集由所述分类决策共享参数的集合的所选择的决策定义。3.根据权利要求2所述的方法,其中确定对模型参数的所述共享集合的所述子集的当
前值的所述更新包括对来自所述训练数据的一批量的训练示例计算对所述当前值的梯度更新。4.根据权利要求2或权利要求3中任一项所述的方法,其中使用所述验证数据确定估计时延包括针对来自所述验证数据的一批量的验证示例中的每个验证示例确定具有所述候选架构的所述神经网络的时延。5.根据权利要求4所述的方法,其中所述目标时延是所述神经网络被部署在一个或多个计算设备的特定集合上时的目标时延,并且其中确定时延包括在具有所述候选架构的所述神经网络被部署在一个或多个计算设备的所述特定集合上时,针对所述一批量的验证示例中的每个验证示例确定时延。6.根据权利要求2至5中任一项所述的方法,其中使用所述验证数据来确定具有所述候选架构的所述神经网络的所述特定机器学习任务的估计质量包括对来自所述验证数据的一批量的验证示例确定具有所述候选架构的所述神经网络的质量。7.根据任一项前述权利要求所述的方法,其中所述奖励函数是所述质量项和所述时延项的总和。8.根据任一项前述权利要求所述的方法,其中将所述候选架构的所述估计时延与所述目标时延进行比较的所述项是(i)所述候选架构的所述估计时延和所述目标时延之间的比率与(ii)1之间的差异。9.根据任一项前述权利要求所述的方法,其中所述时延项是所述绝对值和负标量值的乘积。10.根据任一项前述权利要求所述的方法,其中在所述联合更新之后,选择由所述多个分类决策中的每个分类决策的相应特定决策值定义的候选架构作为所述神经网络的所述架构包括:针对所述分类决策中的每个分类决策,选择在该分类决策的所述概率分布中具有最高概率的决策值作为所述特定决策值。11.根据任一项前述权利要求所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。