System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及通信领域,特别涉及一种互联装置、高性能交换装置及大模型一体机。
技术介绍
1、随着ai(artificial intelligence,人工智能)大模型的突飞猛进发展,基础大模型预训练的客户集中度会进一步提高,绝大多数客户业务场景将会是基于基础大模型的微调和推理应用。针对大模型预训练、微调应用算力特征需求特点,在设计ai大模型一体机时,为了提升算力,采用大规模多卡模式,即包括多张gpu(graphics processing unit,图形处理器)卡,并将多个gpu卡划分为多个组,每组内的任意两个gpu能够互联,但是任意两个组间的gpu无法互联,导致互联速率和通信带宽较低,通信性能差。
2、因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
1、本专利技术的目的是提供一种互联装置、高性能交换装置及大模型一体机,能够灵活调整互联拓扑架构,使该互联拓扑架构上的所有设备实现全互联,提高互联速率和通信带宽。
2、为解决上述技术问题,本专利技术提供了一种互联装置,包括多个交换芯片,所述交换芯片包括多个对外接口和多个互联接口,所述交换芯片的所述对外接口用于连接外部设备,第一交换芯片的所述互联接口与第二交换芯片的所述互联接口可选择地连接;所述第一交换芯片为多个所述交换芯片中的任一个所述交换芯片,所述第二交换芯片为多个所述交换芯片中除所述第一交换芯片外的任一个所述交换芯片;
3、所述第一交换芯片还包括嵌入式控
4、其中,所述嵌入式控制器还用于枚举自身所在第一交换芯片上连接的所述外部设备、所述目标接口连接的第二交换芯片上连接的所述外部设备,确定各个所述外部设备的全局编号,基于所述全局编号建立内部路由表,以便利用所述内部路由表对接收到的数据进行转发;所述外部设备的全局编号由所述外部设备的设备编号及所述外部设备连接的交换芯片的芯片编号组成。
5、其中,所述嵌入式控制器还用于接收接口配置信息,基于所述接口配置信息调整自身所在第一交换芯片的所述对外接口的接口参数,以使所述对外接口的接口参数与所述对外接口连接的外部设备的通信参数匹配。
6、其中,当基于所述拓扑配置信息确认自身所在第一交换芯片的多个所述互联接口中存在目标接口,控制所述目标接口与所述第二交换芯片的所述互联接口一一对应的建立连接的过程包括:
7、当基于所述拓扑配置信息确认自身所在第一交换芯片的多个所述互联接口中存在目标接口,控制所述目标接口使能,以使所述目标接口与所述第二交换芯片中使能的目标接口一一对应的建立连接;
8、控制自身所在第一交换芯片的多个所述互联接口中除所述目标接口外的所述互联接口不使能。
9、其中,所述交换芯片的数量为n个,每一所述交换芯片的所述互联接口的数量为n-1个,n为大于1的整数,第i个所述交换芯片的第j个所述互联接口与第j+1个所述交换芯片的第i个所述互联接口可选择地连接,i=1,2,…,n-1,j=i,…,n-1。
10、为解决上述技术问题,本专利技术还供了一种高性能交换装置,包括:
11、如上文任意一项所述的互联装置,所述互联装置包括多个交换芯片,每一所述交换芯片包括嵌入式控制器,所述嵌入式控制器包括多个配置寄存器;
12、管理装置,用于接收用户配置指令,基于所述用户配置指令确定拓扑配置信息和/或接口配置信息,根据所述拓扑配置信息和/或所述接口配置信息确定每一所述交换芯片的配置参数组,将每一所述配置参数组中的各个配置参数值对应写入所述交换芯片的嵌入式控制器中的各个所述配置寄存器;
13、电源装置,用于为所述互联装置和所述管理装置供电。
14、其中,所述管理装置包括多个管理控制器,多个所述管理控制器均与所述互联装置连接;
15、当前交互控制器,用于与所述互联装置进行数据交互;当前交互控制器为多个所述管理控制器中的任一个处于正常工作状态的管理控制器。
16、其中,所述高性能交换装置还包括复杂可编程逻辑器件;
17、每一所述管理控制器还用于按预设周期向所述复杂可编程逻辑器件发送心跳信号;
18、所述复杂可编程逻辑器件,用于确定多个所述管理控制器中是否存在处于异常工作状态的故障控制器,若存在,判断所述故障控制器是否为当前交互控制器,若是,控制所述故障控制器与所述互联装置停止进行数据交互,并在多个所述管理控制器中选择任一个处于所述正常工作状态的管理控制器作为新的当前交互控制器;所述异常工作状态为未按所述预设周期发送所述心跳信号的工作状态。
19、其中,多个所述管理控制器中包括主管理控制器及从管理控制器,所述从管理控制器为多个所述管理控制器中除所述主管理控制器之外的管理控制器;
20、所述复杂可编程逻辑器件,还用于当判定当前交互控制器为所述从管理控制器,且确定存在处于正常工作状态的主管理控制器时,控制当前交互控制器与所述互联装置停止进行数据交互,并选择一个处于所述正常工作状态的主管理控制器作为新的当前交互控制器。
21、其中,所述高性能交换装置还包括第一切换装置,所述第一切换装置的多个第一端与多个所述管理控制器一一对应连接,所述第一切换装置的多个第二端与多个所述交换芯片一一对应连接,所述第一切换装置的控制端与所述复杂可编程逻辑器件连接;
22、所述复杂可编程逻辑器件,具体用于确定多个所述管理控制器中是否存在处于异常工作状态的故障控制器,若存在,判断所述故障控制器是否为当前交互控制器,若是,生成与所述故障控制器对应的第一控制指令,并在多个所述管理控制器中选择任一个处于所述正常工作状态的管理控制器作为新的当前交互控制器,生成与所述新的当前交互控制器对应的第二控制指令;
23、所述第一切换装置,用于在接收到所述第一控制指令时,基于所述第一控制指令确定第一目标端,控制所述第一目标端连接的管理控制器和各个所述交换芯片之间的通信链路断开,在接收到所述第二控制指令时,基于所述第二控制指令确定第二目标端,控制所述第二目标端连接的管理控制器和各个所述交换芯片之间的通信链路连通。
24、其中,所述高性能交换装置还包括:
25、第一端口扩展芯片,所述第一端口扩展芯片的第一端与所述第一切换装置的第二端连接,所述第一端口扩展芯片的多个第二端与多个所述交换芯片一一对应连接。
26、其中,与所述互联装置进行数据交互的过程包括:
27、将每一所述配置参数组中的各个配置参数对应写入所述交换芯片的嵌入式控制器中的各个所述配置寄存器;
28、获取各个所述交换芯片的状态参本文档来自技高网...
【技术保护点】
1.一种互联装置,其特征在于,包括多个交换芯片,所述交换芯片包括多个对外接口和多个互联接口,所述交换芯片的所述对外接口用于连接外部设备,第一交换芯片的所述互联接口与第二交换芯片的所述互联接口可选择地连接;所述第一交换芯片为多个所述交换芯片中的任一个所述交换芯片,所述第二交换芯片为多个所述交换芯片中除所述第一交换芯片外的任一个所述交换芯片;
2.根据权利要求1所述的互联装置,其特征在于,所述嵌入式控制器还用于枚举自身所在第一交换芯片上连接的所述外部设备、所述目标接口连接的第二交换芯片上连接的所述外部设备,确定各个所述外部设备的全局编号,基于所述全局编号建立内部路由表,以便利用所述内部路由表对接收到的数据进行转发;所述外部设备的全局编号由所述外部设备的设备编号及所述外部设备连接的交换芯片的芯片编号组成。
3.根据权利要求2所述互联装置,其特征在于,所述嵌入式控制器还用于接收接口配置信息,基于所述接口配置信息调整自身所在第一交换芯片的所述对外接口的接口参数,以使所述对外接口的接口参数与所述对外接口连接的外部设备的通信参数匹配。
4.根据权利要求1所述
5.根据权利要求1-4任意一项所述的互联装置,其特征在于,所述交换芯片的数量为n个,每一所述交换芯片的所述互联接口的数量为n-1个,n为大于1的整数,第i个所述交换芯片的第j个所述互联接口与第j+1个所述交换芯片的第i个所述互联接口可选择地连接,i=1,2,…,n-1,j=i,…,n-1。
6.一种高性能交换装置,其特征在于,包括:
7.根据权利要求6所述的高性能交换装置,其特征在于,所述管理装置包括多个管理控制器,多个所述管理控制器均与所述互联装置连接;
8.根据权利要求7所述的高性能交换装置,其特征在于,所述高性能交换装置还包括复杂可编程逻辑器件;
9.根据权利要求8所述的高性能交换装置,其特征在于,多个所述管理控制器中包括主管理控制器及从管理控制器,所述从管理控制器为多个所述管理控制器中除所述主管理控制器之外的管理控制器;
10.根据权利要求8所述的高性能交换装置,其特征在于,所述高性能交换装置还包括第一切换装置,所述第一切换装置的多个第一端与多个所述管理控制器一一对应连接,所述第一切换装置的多个第二端与多个所述交换芯片一一对应连接,所述第一切换装置的控制端与所述复杂可编程逻辑器件连接;
11.根据权利要求10所述的高性能交换装置,其特征在于,所述高性能交换装置还包括:
12.根据权利要求8所述的高性能交换装置,其特征在于,与所述互联装置进行数据交互的过程包括:
13.根据权利要求12所述的高性能交换装置,其特征在于,所述高性能交换装置还包括散热装置,所述散热装置包括至少一个风扇;
14.根据权利要求12-13任意一项所述的高性能交换装置,其特征在于,所述第一基板控制器、所述管理控制器、所述复杂可编程逻辑器件以及所述互联装置通过以太网连接;
15.一种大模型一体机,其特征在于,包括:
16.根据权利要求15所述的大模型一体机,其特征在于,所述大模型一体机还包括第二基板控制器和多个第二切换装置;
17.根据权利要求15所述的大模型一体机,其特征在于,所述大模型一体机还包括多个网卡,所述互联装置包括多个交换芯片,每一所述交换芯片上连接有至少一个所述网卡,以使所述互联装置上连接的所述异构计算设备通过所述网卡与其他大模型一体机进行组网。
18.根据权利要求15所述的大模型一体机,其特征在于,所述互联装置包括多个交换芯片,所述大模型一体机还包括多个网卡,所述异构计算设备通过所述网卡与所述交换芯片连接,所述异构计算设备通过所述网卡与其他大模型一体机进行组网。
19.根据权利要求15所述的大模型一体机,其特征在于,所述大模型一体机还包括:
20.根据权利要求19所述的大模型一体机,其特征在于,所述内存扩展卡包括第三底板控制器和多个内存控制器,每一所述内存控制器挂载至少一个内存条;
21.根据权利要求15-20任意一项所述的大模型一体机,其特征在于,所述大模型一体机还包括池化管理引擎;
...【技术特征摘要】
1.一种互联装置,其特征在于,包括多个交换芯片,所述交换芯片包括多个对外接口和多个互联接口,所述交换芯片的所述对外接口用于连接外部设备,第一交换芯片的所述互联接口与第二交换芯片的所述互联接口可选择地连接;所述第一交换芯片为多个所述交换芯片中的任一个所述交换芯片,所述第二交换芯片为多个所述交换芯片中除所述第一交换芯片外的任一个所述交换芯片;
2.根据权利要求1所述的互联装置,其特征在于,所述嵌入式控制器还用于枚举自身所在第一交换芯片上连接的所述外部设备、所述目标接口连接的第二交换芯片上连接的所述外部设备,确定各个所述外部设备的全局编号,基于所述全局编号建立内部路由表,以便利用所述内部路由表对接收到的数据进行转发;所述外部设备的全局编号由所述外部设备的设备编号及所述外部设备连接的交换芯片的芯片编号组成。
3.根据权利要求2所述互联装置,其特征在于,所述嵌入式控制器还用于接收接口配置信息,基于所述接口配置信息调整自身所在第一交换芯片的所述对外接口的接口参数,以使所述对外接口的接口参数与所述对外接口连接的外部设备的通信参数匹配。
4.根据权利要求1所述的互联装置,其特征在于,当基于所述拓扑配置信息确认自身所在第一交换芯片的多个所述互联接口中存在目标接口,控制所述目标接口与所述第二交换芯片的所述互联接口一一对应的建立连接的过程包括:
5.根据权利要求1-4任意一项所述的互联装置,其特征在于,所述交换芯片的数量为n个,每一所述交换芯片的所述互联接口的数量为n-1个,n为大于1的整数,第i个所述交换芯片的第j个所述互联接口与第j+1个所述交换芯片的第i个所述互联接口可选择地连接,i=1,2,…,n-1,j=i,…,n-1。
6.一种高性能交换装置,其特征在于,包括:
7.根据权利要求6所述的高性能交换装置,其特征在于,所述管理装置包括多个管理控制器,多个所述管理控制器均与所述互联装置连接;
8.根据权利要求7所述的高性能交换装置,其特征在于,所述高性能交换装置还包括复杂可编程逻辑器件;
9.根据权利要求8所述的高性能交换装置,其特征在于,多个所述管理控制器中包括主管理控制器及从管理控制器...
【专利技术属性】
技术研发人员:高显扬,慈潭龙,吴安,徐通,
申请(专利权)人:苏州元脑智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。