使用部分梯度更新的推测性训练制造技术

技术编号：30222223 阅读：25 留言：0更新日期：2021-09-29 09:42

本申请公开了使用部分梯度更新的推测性训练。处理节点之间权重梯度的交换会给训练过程带来实质性的瓶颈。处理节点可以使用处理节点的局部权重梯度更新其自身的权重集合以用于训练过程的下一次迭代，而不是在权重梯度交换过程期间保持空闲。通过使用这些推测性权重直到权重梯度交换过程完成并且全局权重更新可用，可以开始训练的下一次迭代。如果推测性权重与来自全局权重更新的权重值足够接近，则处理节点处的训练过程可以使用从推测性权重计算出的结果继续训练，以减少整体训练时间。以减少整体训练时间。以减少整体训练时间。

全部详细技术资料下载

【技术实现步骤摘要】
使用部分梯度更新的推测性训练
相关申请的交叉引用
[0001]本申请要求于2020年3月26日提交的第16/831060号美国专利申请的优先权的权益。

技术介绍

[0001]神经网络可用于执行诸如识别图像中的对象之类的任务。在神经网络中，输入数据与权重组合以使用激活函数导出输出数据。例如，神经网络可以将图像作为输入数据，并输出某些对象处于图像中的决策或可能性。神经网络中使用的权重的集合可以通过训练过程来确定，在训练过程中，神经网络可以学习如何为应用程序执行某些计算任务。训练过程涉及向神经网络提供训练输入数据和支持特定决策(例如，在图像中检测到或未检测到对象)的对应的参考输出。神经网络可以执行计算以将权重与训练输入数据相结合，以生成训练输出数据，训练输出数据与参考输出数据相比较，以评定神经网络模型的准确性。在训练期间，可以提供不同的训练输入数据集来生成不同的训练输出数据集。神经网络的权重可以被调整成使训练输出数据和参考输出数据之间的差异最小化。为了改善神经网络生成正确决策的可能性，可以使用覆盖大量场景的大量训练输入数据来训练神经网络。因此，训练神经网络可能花费许多时间和计算资源。
附图说明
[0002]将参考附图来描述根据本公开的各实施例，其中：
[0003]图1图示出分类器设备的示例；
[0004]图2图示出预测模型的示例的简化框图；
[0005]图3图示出使用预测模型执行的操作的示例的简化框图；
[0006]图4图示出神经网络的训练过程的示例；
[0007]图5图示出分...

【技术保护点】

【技术特征摘要】
1.一种方法，包括：由神经网络训练系统中的多个处理节点中的处理节点使用第一权重集合执行训练过程的第一迭代以生成第一输出数据集；由所述处理节点基于所述第一输出数据集与参考输出数据集的比较导出局部权重梯度集合；由所述处理节点使用所述局部权重梯度集合来更新所述第一权重集合，以导出推测性权重集合；以及由所述处理节点在等待获得用于所述训练过程的第二迭代的第二权重集合时，使用所述推测性权重集合执行所述训练过程的所述第二迭代以生成第二输出数据集。2.如权利要求1所述的方法，进一步包括：获得用于所述训练过程的所述第二迭代的所述第二权重集合；以及确定所述第二权重集合与所述推测性权重集合之间的差异。3.如权利要求2所述的方法，进一步包括：确定所述第二权重集合与所述推测性权重集合之间的差异处于阈值差异或低于阈值差异；以及使用从所述推测性权重集合生成的所述第二输出数据集继续所述训练过程。4.如权利要求2所述的方法，进一步包括：确定所述第二权重集合与所述推测性权重集合之间的差异超过阈值差异；以及使用所述第二权重集合而不是所述推测性权重集合重复所述训练过程的所述第二迭代。5.如权利要求1
‑
4中任一项所述的方法，其特征在于，所述第二权重集合从所述神经网络训练系统的另一处理节点获得。6.如权利要求1
‑
4中任一项所述的方法，其特征在于，所述第二权重集合通过以下步骤获得：累积多个局部权重梯度集合，每个局部权重梯度集合由所述神经网络训练系统的所述多个处理节点中的对应处理节点导出；对所述局部权重梯度集合求平均，以导出平均权重梯度集合；以及使用所述平均权重梯度集合更新所述第一权重集合以生成所述第二权重集合。7.如权利要求1
‑
4中任一项所述的方法，进一步包括：在所述训练过程的预定次数的迭代之后执行权重同步操作，以跨所述神经网络训练系统的所述多个处理节点同步权重值。8.如权利要求1
‑
4中任一项所述的方法，其特征在于，所述多个处理节点经由网络彼此通信地耦合。9.一种计算设备，包括：神经网络计算电路；处理器，以及存储代码的存储器，当所述代码由所述处理器执行时，使得所述计算设备实现包括以下各项的操作：使用所述神经网络计算电路、利用第一权重集合执行训练过程的第一迭代，以生成第
一输出数据集；基于所述第一输出数据集与预期输出数据集的比较来导出局部权重梯度集合；使用所述局部权重梯度集合更新所述第一权重集合，以导出推测性权重集合；当等待用于所述训练过程的第二迭代的第二权重集合变得可用时，使用所述神经网络计算电路、利用所述推测性权重...

【专利技术属性】
技术研发人员：P，
申请(专利权)人：亚马逊技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人