一种基于遗传算法的分布式参数服务器更新方法技术

技术编号：18839849 阅读：18 留言：0更新日期：2018-09-05 08:21

本发明专利技术提供一种基于遗传算法的分布式参数服务器更新方法，该方法在工作节点前向传播计算出损失函数的损失值Loss后，就将损失值发送给参数服务器，参数服务器此时就可以利用损失值进行遗传算法的选择，并等待各工作节点后向传播计算出各层参数的梯度，发送回来。即利用了同步等待的时间，来根据损失值对工作节点的参数进行评估，进行一定的筛选，并使用交叉变异增加随机性，使得参数更新时不再使用所有的梯度的加和，而是对于收敛性好的工作节点的参数会保留，对于收敛性差的工作节点的参数进行丢弃。每一次迭代时同样经历一代筛选，经过多代筛选后，得到最优的个体基因型，将其对应到工作节点的梯度选用上，从而运用到参数更新中。

A distributed parameter server update method based on genetic algorithm

The invention provides a distributed parameter server updating method based on genetic algorithm, which sends the loss value to the parameter server after the loss value Loss of the loss function is calculated by propagating forward to the working node, and then the parameter server can use the loss value to select the genetic algorithm and wait for each working section. Point backward propagation calculates the gradient of each parameter and sends it back. In other words, the synchronous waiting time is used to evaluate the parameters of the working nodes according to the loss value, and the cross-mutation is used to increase the randomness, so that the parameters of the working nodes with good convergence will be retained, and the parameters of the working nodes with poor convergence will be retained. The parameters of the working node are discarded. Each iteration also undergoes a generation of screening, after multiple generations of screening, the optimal individual genotype is obtained, which corresponds to the gradient selection of the working node, and is applied to parameter updating.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于遗传算法的分布式参数服务器更新方法
本专利技术涉及人工智能领域，更具体地，涉及一种基于遗传算法的分布式参数服务器更新方法。
技术介绍
典型的包含参数服务器的深度学习系统结构包括一个或多个参数服务器节点，多个工作节点。参数服务器节点共同维护和更新全局共享参数，彼此可以互相通信，多个工作节点保存一部分输入的训练数据集，彼此之间没有通信，各自利用数据集进行前向传播和后向传播计算得到新的模型梯度，并及时发回参数服务器，跟参数服务器交换最近的模型参数，从而进行下一轮的训练。在同步的数据并行模式中，随机梯度下降(SGD，StochasticGradientDescent)算法被普遍使用，它在每次梯度计算中，训练数据集分划分为包含多个样本的小批量数据子集，每个工作节点完成一个完整的迭代需要进行以下四个步骤：工作节点从参数服务器pull拉取最新的参数副本。工作节点从本地训练数据集中取出最新的一批数据进行计算，得到新的参数梯度。工作节点将新的计算的参数梯度推送给参数服务器。参数服务器汇总各个工作节点的梯度，并进行计算更新参数。其中第一步和第三步的参数交换是阻塞式网络通信即同步通信，第二跟第四步是模型训练准确率提升的关键所在。从最开始AlexSmola采用分布式的Memcache缓存技术作为存放参数的存储，用于不同工作节点之间同步模型参数，到现在最新的李沐提出的第三代参数服务器架构，关注点一直放在如何缩短参数交换的时间，解决工作节点与参数服务器的通信瓶颈，而第四步参数更新的计算一直沿用先汇总所有工作节点的梯度，最新的参数等于当前参数减去汇总后的平均参数梯度与学习速率的...

【技术保护点】
1.一种基于遗传算法的分布式参数服务器更新方法，其特征在于，包括以下步骤：S1：参数服务器接收到各工作节点发送的损失值Loss；S2：使用二进制编码方法对各工作节点的损失值Loss进行编码；S3：使用随机方法产生初始群体；S4：对初始群体中的每一个个体进行适应度计算；S5：采用轮盘赌选择方法对群体中的个体进行选择计算；S6：使用单点交叉方法对已经选用的个体进行交叉运算；S7：使用随机变异对进行过交叉运算后的个体进行变异运算；S8：判断进行变异运算后的群体的适应度总和是否增加；若有增加，跳转到步骤S4，若没有增加就跳转到S9；S9：取出适应度最高的个体基因作为最优解；S10：参数服务器根据最优解对各个工作节点的参数进行取舍来更新参数。

【技术特征摘要】
1.一种基于遗传算法的分布式参数服务器更新方法，其特征在于，包括以下步骤：S1：参数服务器接收到各工作节点发送的损失值Loss；S2：使用二进制编码方法对各工作节点的损失值Loss进行编码；S3：使用随机方法产生初始群体；S4：对初始群体中的每一个个体进行适应度计算；S5：采用轮盘赌选择方法对群体中的个体进行选择计算；S6：使用单点交叉方法对已经选用的个体进行交叉运算；S7：使用随机变异对进行过交叉运算后的个体进行变异运算；S8：判断进行变异运算后的群体的适应度总和是否增加；若有增加，跳转到步骤S4，若没有增加就跳转到S9；S9：取出适应度最高的个体基因作为最优解；S10：参数服务器根据最优解对各个工作节点的参数进行取舍来更新参数。2.根据权利要求1所述的基于遗传算法的分布式参数服务器更新方法，其特征在于，所述步骤S5的过程是：S51：计算所有个体适应度的总和SUM；S52：计算出每个个体的适应度与SUM的...

【专利技术属性】
技术研发人员：叶彦，李欣鑫，吴维刚，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人