一种神经网络协同训练方法、装置以及相关产品制造方法及图纸

技术编号：27567104 阅读：11 留言：0更新日期：2021-03-09 22:12

本申请提供一种神经网络协同训练方法、装置及相关产品。所述产品包括一种电子设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现神经网络协同训练方法。本申请提供的技术方案针对在进行神经网络各个网络层的运算过程中以及神经网络训练的过程中数据通信的通信时间长的问题，具有减少通信时间、提高运算效率的优点。提高运算效率的优点。提高运算效率的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络协同训练方法、装置以及相关产品

[0001]本申请涉及信息处理
，具体涉及一种神经网络协同训练方法、装置以及相关产品。

技术介绍

[0002]目前，人工神经网络是所有智能方法中最常见的计算模型之一。在进行神经网络各个网络层的运算过程中以及神经网络训练的过程中，存在数据通信的通信时间以及处理数据的计算时间。
[0003]然而，现有技术中还没有有效减少通信时间，使得数据通信的时间被数据计算的时间覆盖的方案。为了改进性能，有必要采用各种手段来改进神经网络中的网络层运算以及协同训练的过程。

技术实现思路

[0004]本申请实施例提供了一种神经网络协同训练方法、装置及相关产品，可减少数据通信时间，使得通信过程被计算过程覆盖，并提高协同训练的效率。
[0005]第一方面，提供一种协同训练的方法，所述方法应用于包括多个节点的人工智能处理器，所述多个节点包括控制节点以及多个计算节点，所述多个计算节点中的任一计算节点，所述方法包括如下步骤：
[0006]获取第一权值梯度数据；
[0007]在存在来自所述多个计算节点中的第二计算节点的第二权值梯度数据的情况下，在将来自所述第二计算节点的所述第二权值梯度数据与所述第一权值梯度数据进行加和运算得到更新的权值梯度数据的过程中，发送所述更新的权值梯度数据。
[0008]第二方面，提供一种协同训练的装置，所述装置应用于包括多个节点的人工智能处理器，所述多个节点包括控制节点以及多个计算节点，所述多个计算节点中的任一计算节点，所...

【技术保护点】

【技术特征摘要】
1.一种协同训练的方法，所述方法应用于包括多个节点的人工智能处理器，所述多个节点包括控制节点以及多个计算节点，所述多个计算节点中的任一计算节点，所述方法包括如下步骤：获取第一权值梯度数据；在存在来自所述多个计算节点中的第二计算节点的第二权值梯度数据的情况下，在将来自所述第二计算节点的所述第二权值梯度数据与所述第一权值梯度数据进行加和运算得到更新的权值梯度数据的过程中，发送所述更新的权值梯度数据。2.如权利要求1所述的方法，还包括：在不存在来自所述第二计算节点的权值梯度数据的情况下，发送所述第一权值梯度数据。3.如权利要求2所述的方法，还包括：接收获取梯度更新数据信号；在符合所述获取梯度更新数据信号的要求的情况下，执行如下步骤中的一者：在存在来自所述多个计算节点中的第二计算节点的第二权值梯度数据的情况下，在将来自所述第二计算节点的所述第二权值梯度数据与所述第一权值梯度数据进行加和运算得到更新的权值梯度数据的过程中，发送所述更新的权值梯度数据；或者在不存在来自所述第二计算节点的权值梯度数据的情况下，发送所述第一权值梯度数据。4.如权利要求3所述的方法，还包括：在不符合所述获取梯度更新数据信号的要求且存在来自所述第二计算节点的所述第二权值梯度数据的情况下，在接收所述第二权值梯度数据的过程中，发送所述第二权值梯度数据。5.如权利要求3或4所述的方法，其中，所述获取梯度更新数据信号包括需要相关计算节点的权值梯度数据的计算节点标识以及/或者更新的权值梯度数据的代数的标识。6.如权利要求5所述的方法，其中，所述获取梯度更新数据信号的要求包括：属于所述计算节点标识指示的计算节点；以及/或者所述第一权值梯度数据的代数与所述更新的权值梯度数据的代数之间的差值满足预设值。7.如权利要求1至6任意一者所述的方法，还包括：接收所述控制节点广播的权值数据；保存所述权值数据，其中，所述权值数据用于训练；在存在接收所述权值数据的第三计算节点的情况下，在接收所述权值数据的过程中，将所述权值数据发送至所述第三计算节点。8.如权利要求1至7任意一者所述的方法，还包括：发送获取所述第一权值梯度数据的时间戳，其中，所述时间戳用于将所述多个计算节点进行动态分组。9.如权利要求1至8任意一者所述的方法，其中，所述控制节点包括参数服务节点。10.如权利要求1至9任意一者所述的方法，其中，所述多个节点形成的拓扑结构包括环状、网状、树状，或者其他包括环状的结构。11.如权利要求1至10任意一者所述的方法，其中，所述节点包括神经网络芯片或者所
述神经网络芯片中的计算核。12.一种协同训练的装置，所述装置应用于包括多个节点的人工智能处理器，所述多个节点包括控制节点以及多个计算节点，所述多个计算节点中的任一计算节点，所述装置包括：获取单元，用于获取第一权值梯度数据；第一发送单元，用于在存在来自所述多个计算节点中的第二计算节点的第二权值梯度数据的情况下，在将来自所述第二计算节点的所述第二权值梯度数据与所述第一权值梯度数据进...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：安徽寒武纪信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人