优化神经网络架构制造技术

技术编号：22367665 阅读：35 留言：0更新日期：2019-10-23 05:51

方法、系统和装置，包括在计算机存储介质上编码的计算机程序，用于优化神经网络架构。一种方法包括：接收训练数据；使用训练数据确定用于执行机器学习任务的优化的神经网络架构；以及确定具有优化的神经网络架构的神经网络的参数的训练的值。

Optimize neural network architecture

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】优化神经网络架构
技术介绍
本公开涉及训练神经网络。神经网络是机器学习模型，它使用一层或多层非线性单元来预测接收的输入的输出。除了输出层之外，一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出用作网络中下一层(即下一个隐藏层或输出层)的输入。网络的每个层根据相应参数集合的当前值从接收的输入生成输出。
技术实现思路
通常，本说明书中描述的主题的一个创新方面可以体现在用于确定最优的神经网络架构的方法中。该方面的其他实施例包括相应计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序，每个被配置为执行方法的动作。一个或多个计算机的系统可以被配置为借助于安装在系统上的软件、固件、硬件或其任何组合来执行特定操作或动作，所述系统在操作中可以使系统执行动作。一个或多个计算机程序可以被配置为通过包括当由数据处理装置执行时使装置执行动作的指令来执行特定操作或动作。本说明书中描述的主题可以在特定实施例中实现，以便实现以下优点中的一个或多个。通过使用如本说明书中描述的给定机器学习任务的训练数据来优化神经网络架构，可以改进最终训练的神经网络在机器学习任务上的性能。具体地，神经网络的架构可以针对任务的训练数据而定制，而不受预先存在的架构的约束，从而改进训练的神经网络的性能。通过跨多个工作器计算单元分布架构的优化，可以搜索和评估的可能架构的搜索空间大大增加，导致在机器学习任务上具有改进的性能的最终优化的架构。另外，通过在架构的紧凑表示上操作而不是直接需要修改神经网络，优化处理的效率得到改进，导致优化的架构被更快地确定，同时使用例如更少存储器和处理能力或两者的更少的计算资源来确定。在附...

【技术保护点】
1.一种方法，包括：接收用于训练神经网络以执行机器学习任务的训练数据，该训练数据包括多个训练示例和每个训练示例的相应目标输出；使用训练数据确定用于执行机器学习任务的优化神经网络架构，包括：使用多个工作器计算单元中的每一个重复执行以下操作，每个工作器计算单元与每个其他的工作器计算单元异步地操作：由工作器计算单元从群体储存库中的紧凑表示的当前群体中选择多个紧凑表示，其中当前群体中的每个紧凑表示编码用于执行机器学习任务的不同候选神经网络架构，由工作器计算单元从所选择的多个紧凑表示生成新的紧凑表示，由工作器计算单元确定具有由新的紧凑表示编码的架构的训练的神经网络的适合度的度量，以及由工作器计算单元将新的紧凑表示添加到群体储存库中的当前群体，并将新的紧凑表示与适合度的度量相关联；以及选择由与最佳适合度的度量相关联的紧凑表示编码的神经网络架构，作为优化的神经网络架构；以及确定具有优化的神经网络架构的神经网络的参数的训练的值。

【技术特征摘要】
【国外来华专利技术】2017.02.23 US 62/462,840;2017.02.23 US 62/462,8461.一种方法，包括：接收用于训练神经网络以执行机器学习任务的训练数据，该训练数据包括多个训练示例和每个训练示例的相应目标输出；使用训练数据确定用于执行机器学习任务的优化神经网络架构，包括：使用多个工作器计算单元中的每一个重复执行以下操作，每个工作器计算单元与每个其他的工作器计算单元异步地操作：由工作器计算单元从群体储存库中的紧凑表示的当前群体中选择多个紧凑表示，其中当前群体中的每个紧凑表示编码用于执行机器学习任务的不同候选神经网络架构，由工作器计算单元从所选择的多个紧凑表示生成新的紧凑表示，由工作器计算单元确定具有由新的紧凑表示编码的架构的训练的神经网络的适合度的度量，以及由工作器计算单元将新的紧凑表示添加到群体储存库中的当前群体，并将新的紧凑表示与适合度的度量相关联；以及选择由与最佳适合度的度量相关联的紧凑表示编码的神经网络架构，作为优化的神经网络架构；以及确定具有优化的神经网络架构的神经网络的参数的训练的值。2.如权利要求1所述的方法，其中，确定具有由新的紧凑表示编码的架构的训练的神经网络的适合度的度量包括：实例化具有由新的紧凑表示编码的架构的新神经网络；在训练数据的训练子集上训练新神经网络，以确定新神经网络的参数的训练的值；以及通过在训练数据的验证子集上评估训练的新神经网络的性能来确定适合度的度量。3.如权利要求2所述的方法，所述操作还包括：将新神经网络的参数的训练的值与群体储存库中新的紧凑表示相关联。4.如权利要求3所述的方法，其中，确定具有优化的神经网络架构的神经网络的参数的训练的值包括：选择与紧凑表示相关联的训练的值，作为具有优化的神经网络架构的神经网络的参数的训练的值，其中该紧凑表示与最佳适合度的度量相关联。5.如权利要求1-4中任一项所述的方法，还包括：使用一个或多个默认紧凑表示来初始化群体储存库，该默认紧凑表示编码用于执行机器学习任务的默认神经...

【专利技术属性】
技术研发人员：JA迪安，S摩尔，EA瑞尔，T布鲁尔，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人