一种分布式训练中的梯度更新方法及相关设备技术

技术编号：19935258 阅读：32 留言：0更新日期：2018-12-29 04:55

本申请公开了一种分布式训练中的梯度更新方法及相关设备，方法应用于计算节点服务器，所述方法包括：监测对目标数据进行分布式训练的全局轮换更新步数；基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断，将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中，由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新；基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断，计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。

全部详细技术资料下载

【技术实现步骤摘要】
一种分布式训练中的梯度更新方法及相关设备
本申请涉及计算机
，尤其涉及一种分布式训练中的梯度更新方法及相关设备。
技术介绍
目前，在深度学习的分布式训练中，通常会遇到梯度更新过程中计算节点等待轮换梯度更新而导致设备占用率较低的问题。因此，亟需一种能够解决分布式训练中设备占用率较低问题的技术方案。
技术实现思路
有鉴于此，本申请提供一种分布式训练中的梯度更新方法及相关设备，用以解决现有技术中分布式训练中设备占用率较低的技术问题。本申请提供了一种分布式训练中的梯度更新方法，应用于计算节点服务器，所述方法包括：监测对目标数据进行分布式训练的全局轮换更新步数；基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断，将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中，由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新；基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断，计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。上述方法，优选的，计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中，包括：基于本地训练模型，计算当前本地梯度；将所述当前本地梯度累加到所述本地梯度累计值中。上述方法，优选的，还包括：基于所述当前本地梯度，对所述计算节点服务器中的本地训练模型进行梯度更新。上述方法，优选的，还包括：接收所述参数服务器传输的全局训练模型，所述参数服务器传输的全局训练模型为经过基于所述本地梯度累计值的梯度更新后的模型；将接收到的全局训练模型更新为所述计算节点服务器的本地训练模型。上述方法...

【技术保护点】
1.一种分布式训练中的梯度更新方法，应用于计算节点服务器，所述方法包括：监测对目标数据进行分布式训练的全局轮换更新步数；基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断，将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中，由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新；基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断，计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。

【技术特征摘要】
1.一种分布式训练中的梯度更新方法，应用于计算节点服务器，所述方法包括：监测对目标数据进行分布式训练的全局轮换更新步数；基于所述全局轮换更新步数满足所述计算节点服务器的全局梯度更新条件的判断，将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中，由所述参数服务器对全局训练模型基于所述本地梯度累计值进行梯度更新；基于所述全局轮换更新步数不满足所述计算节点服务器的全局梯度更新条件的判断，计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中。2.根据权利要求1所述的方法，其特征在于，计算当前本地梯度并将所述当前本地梯度累加到所述本地梯度累计值中，包括：基于本地训练模型，计算当前本地梯度；将所述当前本地梯度累加到所述本地梯度累计值中。3.根据权利要求1或2所述的方法，其特征在于，还包括：基于所述当前本地梯度，对所述计算节点服务器中的本地训练模型进行梯度更新。4.根据权利要求1或2所述的方法，其特征在于，还包括：接收所述参数服务器传输的全局训练模型，所述参数服务器传输的全局训练模型为经过基于所述本地梯度累计值的梯度更新后的模型；将接收到的全局训练模型更新为所述计算节点服务器的本地训练模型。5.根据权利要求1或2所述的方法，其特征在于，所述全局梯度更新条件包括：全局轮换更新步数与计算节点服务器的本地轮换标识相对应。6.一种分布式训练中的梯度更新装置，应用于计算节点服务器，所述装置包括：步数监测单元，用于监测对目标数据进行分布式训练的全局轮换更新步数；条件判断单元，用于判断所述全局轮换更新步数是否满足所述计算节点服务器的全局梯度更新条件，如果是，触发梯度更新单元，否则，触发梯度累计单元；梯度更新单元，用于将所述计算节点服务器当前的本地梯度累计值传输给参数服务器中，由所述参数服务器对全局...

【专利技术属性】
技术研发人员：胡文晖，王鹏，王奇刚，
申请(专利权)人：联想北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人