基于可编程网络的聚合通信优化方法及其系统技术方案

技术编号:43285215 阅读:37 留言:0更新日期:2024-11-12 16:07
本发明专利技术公开了一种基于可编程网络的聚合通信优化方法及系统,其包括计算可编程交换机的位置部署和梯度路由策略,并部署可编程交换机;训练深度神经网络模型,将模型参数的梯度切割为若干梯度数据包;根据梯度路由策略,为每个数据包标识可编程交换机编号,并发送到指定交换机;接收并在网全局梯度数据包;对在网聚合结果进行全局聚合得到全局梯度,将携带全局梯度的ACK包返回所有交换机;收到参数服务器的ACK包时,清空其中携带的梯度片段使用的聚合器的标识符字段,释放相关内存资源,并广播ACK包给所有工作节点;用ACK包中的全局梯度更新深度神经网络模型的参数,完成一次梯度聚合通信,基于更新参数进行下一次梯度计算和聚合通信。

【技术实现步骤摘要】

本专利技术涉及分布式训练技术,具体涉及一种基于可编程网络的聚合通信优化方法及其系统


技术介绍

1、随着人工智能和网络技术的迅猛发展,深度神经网络(dnns)已在新一代应用和服务的各个方面得到了广泛的应用,例如计算机视觉、自然语言处理等。由于数据集规模和模型大小的急剧增长,单一节点算力已无法满足不同应用场景庞大的计算需求,因此,dnn模型通常采用分布式训练(dt)的方法。多数分布式训练使用含有多个工作服务器和至少一个参数服务器(ps)的参数服务器架构来并行训练dnn模型,以缓解机器学习带来的计算开销。

2、一种可行的方法是利用可编程网络设备的可编程性,基于在网计算技术将分布式训练的梯度聚合计算任务卸载到可编程交换机上进行,即在网聚合(ina),从而显著减少网络传输的数据量,加快分布式训练。具体而言,在ps架构中,各工作节点计算出的待全局梯度结果进入网络后,只利用网络的传输功能,即交换机只负责转发,使梯度数据最终到达ps端且仅由ps聚合。得益于可编程网络设备的发展,可编程交换机的可编程性和在网计算能力能够为dt提供在网聚合功能

3、本文档来自技高网...

【技术保护点】

1.基于可编程网络的聚合通信优化方法,其特征在于,包括步骤:

2.根据权利要求1所述的聚合通信优化方法,其特征在于,计算可编程交换机位置部署和梯度路由策略的方法包括:

3.根据权利要求1或2所述的聚合通信优化方法,其特征在于,线性规划求解模型的表达式为:

4.根据权利要求3所述的聚合通信优化方法,其特征在于,流量负载和的表达式为:

5.根据权利要求1所述的聚合通信优化方法,其特征在于,聚合器可用的确定方法包括:

6.一种基于可编程网络的聚合通信优化系统,其特征在于,包括:

7.根据权利要求6所述的聚合通信优化系统,其...

【技术特征摘要】

1.基于可编程网络的聚合通信优化方法,其特征在于,包括步骤:

2.根据权利要求1所述的聚合通信优化方法,其特征在于,计算可编程交换机位置部署和梯度路由策略的方法包括:

3.根据权利要求1或2所述的聚合通信优化方法,其特征在于,线性规划求解模型的表达式为:

4.根据权利要求3所述的聚合通信优化方法,其特征在于,流量负载和的表达式为:

5.根据权利要求1所述...

【专利技术属性】
技术研发人员:罗龙陈栖栖杨树林范文琪虞红芳孙罡
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1