【技术实现步骤摘要】
本申请涉及通信,尤其涉及在网计算的聚合树生成方法、电子设备及计算机存储介质。
技术介绍
1、相关技术中的机器学习(machine learning,ml)在越来越大的数据集上构建越来越复杂的模型的能力,模型和数据集相互影响,导致训练时间增加。为应对增加的时间,使用分布式训练,大规模集群中使用数百、数千个成员(worker)进行并行训练,每个成员worker在本地计算梯度更新值,并在worker之间相互传递各自的梯度更新数据。通过多次的迭代完成整个训练数据集的更新。然而,由于worker会产生密集的信息流来传达他们的模型更新,而训练则会暂停,直到更新完成。分布式训练的性能瓶颈已经从计算转移到了通信。为了减少通信的数据量,增加吞吐量、减小时延并加快训练时间,提出了在网计算(in-network computing,inc)方式,每个worker将梯度更新数据发送给交换机switch,在switch中进行聚合操作,并将结果返回给worker。这个过程中利用了switch的聚合功能,多个数据包合并,减少了数据量和带宽的需求,降低了时延。
...【技术保护点】
1.一种在网计算的聚合树生成方法,其特征在于,包括:
2.如权利要求1所述的在网计算的聚合树生成方法,其特征在于,从在网计算架构的拓扑网络中,识别出与所有所述成员节点均能形成链路连接的目标交换机节点,包括:
3.如权利要求1所述的在网计算的聚合树生成方法,其特征在于,从所有所述目标交换机节点中选取网络性能最优的交换机节点,确定为聚合树的根节点,包括:
4.如权利要求3所述的在网计算的聚合树生成方法,其特征在于,确定各所述目标交换机节点对应的目标网络性能参数,包括:
5.如权利要求4所述的在网计算的聚合树生成方法,其特征在
...【技术特征摘要】
1.一种在网计算的聚合树生成方法,其特征在于,包括:
2.如权利要求1所述的在网计算的聚合树生成方法,其特征在于,从在网计算架构的拓扑网络中,识别出与所有所述成员节点均能形成链路连接的目标交换机节点,包括:
3.如权利要求1所述的在网计算的聚合树生成方法,其特征在于,从所有所述目标交换机节点中选取网络性能最优的交换机节点,确定为聚合树的根节点,包括:
4.如权利要求3所述的在网计算的聚合树生成方法,其特征在于,确定各所述目标交换机节点对应的目标网络性能参数,包括:
5.如权利要求4所述的在网计算的聚合树生成方法,其特征在于,基于各所述通信链路的链路网络性能参数,确定各所述目标交换机节点对应的目标网络性能参数,包括:
6.如权利要求4所述的在网计算的聚合树生成方法,其特征在于,基于各所述通信链路的链路网络性能参数,确定各所述目标交换机节点对应的目标网络性能参数,包括:
7.如权利要求6所述的在网计算的聚合树生成方法,其特征在于,基于各所述目标通信链路的链路网络性能参数,确定各所述目标交换机节点对应的目标网络性能参数,包括:
8.如权利要求4至7中任一项所述的在网计算的聚合树生成方法,其特征在于,
9.如权利要求3至7中任一项所述的在网计算的聚合树生成方法,其特征在于,在所述目标网络性能参数为网络时延信息的情况下,所...
【专利技术属性】
技术研发人员:高陈强,喻敬海,
申请(专利权)人:中兴通讯股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。