【技术实现步骤摘要】
本专利技术涉及通信,尤其涉及数据多播方法、装置、系统、电子设备及存储介质。
技术介绍
1、在大规模模型训练中,当使用多个gpu/cpu(graphics processing unit/centralprocessing unit,图形处理单元/中央处理单元)进行模型并行、数据并行或流水线并行处理时,经常需要执行数据多播操作,以确保所有参与计算的设备能够共享相同的数据。
2、图1是现有技术中通常所采用的数据多播方案。该方案中,cpu/gpu1作为源节点,需要将其上的数据多播给cpu/gpu0、cpu/gpu2和cpu/gpu3三个目的节点。在此过程中,cpu/gpu1首先需读取待多播的数据三次,并针对每个目标存储地址生成独立的数据存储报文发送至交换组件;随后,交换组件会根据接收到的目标存储地址解码,将相应的数据存储报文转发至正确的目的节点。
3、然而,上述现有的数据多播方式存在明显的技术问题。首先,由于源节点必须多次读取同一份数据来满足不同目的地的需求,会增加源节点内存带宽的负担。其次,在网络层面,由于每次传输都
...【技术保护点】
1.一种数据多播方法,其特征在于,应用于数据源节点,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取多播数据的多播地址信息,包括:
3.根据权利要求2所述的方法,其特征在于,在所述接收所述第三方节点根据所述请求返回的多播地址信息,作为所述多播数据的多播地址信息之后,还包括:
4.根据权利要求1所述的方法,其特征在于,所述生成一份携带有所述多播数据和多播地址信息的数据存储报文,包括:
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述多播地址信息包括:
6.一种数据多播方法,其特征在于
...【技术特征摘要】
1.一种数据多播方法,其特征在于,应用于数据源节点,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取多播数据的多播地址信息,包括:
3.根据权利要求2所述的方法,其特征在于,在所述接收所述第三方节点根据所述请求返回的多播地址信息,作为所述多播数据的多播地址信息之后,还包括:
4.根据权利要求1所述的方法,其特征在于,所述生成一份携带有所述多播数据和多播地址信息的数据存储报文,包括:
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述多播地址信息包括:
6.一种数据多播方法,其特征在于,应用于交换节点,所述方法包括:
7.根据权利要求6所述的方法,其特征在于,在所述根据所述数据存储报文中的多播地址信息,确定对应的多播组各成员节点之前,还包括:
8.根据权利要求6或7所述的方法,其特征在于,所述多播地址信息包括:
9.一种数据多播方法,其特征在于,应用于多播组成员节点,所述方法包括:
10.根据权利要求9所述的方法,其特征在于,在所述读取所述数据存储报文中的多播地址信息,确定自身的节点存储地址之前,还包括:
11.根据权利要求9或10所述的方法,其特征在于,所述多播地址信息包括:
12.一种数据多播装置,其特征在于,应用于数据源节点,所述装置包括:
13.根据权利要求12所述的装置,其特征在于,所述地址获取模块具体用于:
14.根据权利要求13所述的装置,其特征在于,所述地址获取模块还用于在所述接收所述第三方节点根据所述请求返回的多播地址信息,作为所述多播数据的多播地址信息之后:
15.根据权利要求12所述的装置,其特征在于,所述报文生成模块具体用于:
【专利技术属性】
技术研发人员:兰可嘉,程永波,
申请(专利权)人:海光信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。