The invention provides a distributed parameter server updating method based on genetic algorithm, which sends the loss value to the parameter server after the loss value Loss of the loss function is calculated by propagating forward to the working node, and then the parameter server can use the loss value to select the genetic algorithm and wait for each working section. Point backward propagation calculates the gradient of each parameter and sends it back. In other words, the synchronous waiting time is used to evaluate the parameters of the working nodes according to the loss value, and the cross-mutation is used to increase the randomness, so that the parameters of the working nodes with good convergence will be retained, and the parameters of the working nodes with poor convergence will be retained. The parameters of the working node are discarded. Each iteration also undergoes a generation of screening, after multiple generations of screening, the optimal individual genotype is obtained, which corresponds to the gradient selection of the working node, and is applied to parameter updating.
【技术实现步骤摘要】
一种基于遗传算法的分布式参数服务器更新方法
本专利技术涉及人工智能领域,更具体地,涉及一种基于遗传算法的分布式参数服务器更新方法。
技术介绍
典型的包含参数服务器的深度学习系统结构包括一个或多个参数服务器节点,多个工作节点。参数服务器节点共同维护和更新全局共享参数,彼此可以互相通信,多个工作节点保存一部分输入的训练数据集,彼此之间没有通信,各自利用数据集进行前向传播和后向传播计算得到新的模型梯度,并及时发回参数服务器,跟参数服务器交换最近的模型参数,从而进行下一轮的训练。在同步的数据并行模式中,随机梯度下降(SGD,StochasticGradientDescent)算法被普遍使用,它在每次梯度计算中,训练数据集分划分为包含多个样本的小批量数据子集,每个工作节点完成一个完整的迭代需要进行以下四个步骤:工作节点从参数服务器pull拉取最新的参数副本。工作节点从本地训练数据集中取出最新的一批数据进行计算,得到新的参数梯度。工作节点将新的计算的参数梯度推送给参数服务器。参数服务器汇总各个工作节点的梯度,并进行计算更新参数。其中第一步和第三步的参数交换是阻塞式网络通信即同步通信,第二跟第四步是模型训练准确率提升的关键所在。从最开始AlexSmola采用分布式的Memcache缓存技术作为存放参数的存储,用于不同工作节点之间同步模型参数,到现在最新的李沐提出的第三代参数服务器架构,关注点一直放在如何缩短参数交换的时间,解决工作节点与参数服务器的通信瓶颈,而第四步参数更新的计算一直沿用先汇总所有工作节点的梯度,最新的参数等于当前参数减去汇总后的平均参数梯度与学习速率的 ...
【技术保护点】
1.一种基于遗传算法的分布式参数服务器更新方法,其特征在于,包括以下步骤:S1:参数服务器接收到各工作节点发送的损失值Loss;S2:使用二进制编码方法对各工作节点的损失值Loss进行编码;S3:使用随机方法产生初始群体;S4:对初始群体中的每一个个体进行适应度计算;S5:采用轮盘赌选择方法对群体中的个体进行选择计算;S6:使用单点交叉方法对已经选用的个体进行交叉运算;S7:使用随机变异对进行过交叉运算后的个体进行变异运算;S8:判断进行变异运算后的群体的适应度总和是否增加;若有增加,跳转到步骤S4,若没有增加就跳转到S9;S9:取出适应度最高的个体基因作为最优解;S10:参数服务器根据最优解对各个工作节点的参数进行取舍来更新参数。
【技术特征摘要】
1.一种基于遗传算法的分布式参数服务器更新方法,其特征在于,包括以下步骤:S1:参数服务器接收到各工作节点发送的损失值Loss;S2:使用二进制编码方法对各工作节点的损失值Loss进行编码;S3:使用随机方法产生初始群体;S4:对初始群体中的每一个个体进行适应度计算;S5:采用轮盘赌选择方法对群体中的个体进行选择计算;S6:使用单点交叉方法对已经选用的个体进行交叉运算;S7:使用随机变异对进行过交叉运算后的个体进行变异运算;S8:判断进行变异运算后的群体的适应度总和是否增加;若有增加,跳转到步骤S4,若没有增加就跳转到S9;S9:取出适应度最高的个体基因作为最优解;S10:参数服务器根据最优解对各个工作节点的参数进行取舍来更新参数。2.根据权利要求1所述的基于遗传算法的分布式参数服务器更新方法,其特征在于,所述步骤S5的过程是:S51:计算所有个体适应度的总和SUM;S52:计算出每个个体的适应度与SUM的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。