【技术实现步骤摘要】
一种面向机器学习的分布式计算互连网络系统及通信方法
本专利技术属于通信
,更进一步涉及互连网络通信
中的一种面向机器学习的分布式计算互连网络系统及通信方法,本专利技术利用光交换机、光电混合交换机和计算节点组成的互连网络系统,实现分布式计算互连网络系统中各个计算节点之间的高效通信。
技术介绍
随着计算技术的发展,许多新兴应用需要非常巨大的计算能力才能完成,尤其是以大数据和大模型为基础的机器学习应用。集中式计算完全依赖于一台大型的中心计算机的处理能力。与集中式计算相反,分布式计算中,多个通过网络互连的计算节点都具有较高的计算能力,它们之间相互传递数据,实现信息共享,共同协作完成一个处理任务。如果采用集中式计算,需要耗费相当长的时间来完成复杂的处理任务。分布式计算将该任务分解成许多小的部分,分配给多个计算节点进行处理。这样可以节约整体计算时间,大幅提高计算效率。互连网络系统作为分布式计算中连接各个计算节点的重要组成部分,它的性能主要依赖于网络直径、可扩展性和可靠性等参数。另一方面,面对网络中复杂多变的流量环境, ...
【技术保护点】
1.一种面向机器学习的分布式计算互连网络系统,包括光交换子系统和计算子系统,其特征在于:/n所述光交换子系统包括编号为A
【技术特征摘要】
20191115 CN 20191111758881.一种面向机器学习的分布式计算互连网络系统,包括光交换子系统和计算子系统,其特征在于:
所述光交换子系统包括编号为A0,A1,…,Ai,…,A2N-1的2N台光交换机,每台光交换机包括N个交换端口,其中N≥1,Ai表示第i台光交换机;
所述计算子系统包括N个计算单元,每个计算单元包括N个子计算单元,每个子计算单元包括1台光电混合交换机和N个计算节点,每个光电混合交换机包括2个上行端口、N个下行端口和N-1个交换端口,每个计算节点包括1个上行端口;每个子计算单元所包含的光电混合交换机的N个下行端口分别与N个计算节点的上行端口连接,每个计算单元所包含的每一个光电混合交换机的N-1个交换端口分别与同一计算单元内的其他N-1个光电混合交换机的1个交换端口连接;
所述计算子系统所包含的N2个光电混合交换机的编号为M(0,0),M(0,1),…,M(0,N-1);M(1,0),M(1,1),…,M(1,N-1);…;M(x,y);…;M(N-1,0),M(N-1,1),…,M(N-1,N-1);其中M(x,y)表示第x个计算单元中第y台光电混合交换机,0≤x≤N-1,0≤y≤N-1;
所述光交换子系统中光交换机Ai的每个交换端口与计算子系统中光电混合交换机M(x,y)的1个上行端口连接,其中i%N=y,%表示i对N取模。
2.根据权利要求1所述的一种面向机器学习的分布式计算互连网络系统,其特征在于,所述计算节点,采用CPU或者GPU。
3.一种面向机器学习的分布式计算互连网络的通信方法,其特征在于,包括如下步骤:
(1)每个计算节点产生数据分组并发送:
每个计算节点Sr根据自身的地址和与Sr进行通信的每个计算节点Sd的地址产生数据分组,并将所有数据分组发送至与计算节点Sr相连的光电混合交换机Rs;
(2)每个光电混合交换机Rs对每个数据分组进行解析:
每个光电混合交换机Rs对每个Sr产生的数据分组进行解析,得到Sr的地址和所有与Sr进行通信的计算节点Sd的地址;
(3)每个光电混合交换机Rs判断计算节点Sr与Sd是否在同一个计算单元内:
每个光电混合交换机Rs通过解析得到的Sr的地址和所有与Sr进行通信的计算节点Sd的地址,判断计算节点Sr与Sd是否在同一个计算单元内,若是,执行步骤(4),否则,执行步骤(7);
(4)每个光电混合交换机Rs判断计算节点Sr与Sd是否在同一个子计算单元内:
每个光电混合交换机Rs通过解析得到...
【专利技术属性】
技术研发人员:顾华玺,鹿云峰,余晓杉,王琨,任泽昂,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。