设备复位方法技术

技术编号:39821305 阅读:12 留言:0更新日期:2023-12-22 19:41
本申请公开了一种设备复位方法

【技术实现步骤摘要】
设备复位方法、装置、存储介质及电子设备


[0001]本申请涉及计算机
,具体而言,涉及一种设备复位方法

装置

存储介质及电子设备


技术介绍

[0002]随着高性能计算

人工智能和存储等应用场景复杂度的提高,为提高资源利用率,需要在传统服务器硬件架构的基础上重新设计服务器资源管理架构,此外,在服务器资源管理架构的使用过程中,服务器中的设备在较多场景下均需要进行复位

相关技术中通过关闭主电源对设备进行复位,需要消耗较长的时间且效率低

[0003]因此,如何提高对设备进行复位的效率成为业界亟待解决的技术问题


技术实现思路

[0004]本申请提供一种设备复位方法

装置

存储介质及电子设备,用以解决现有技术中如何提高对设备进行复位的效率的技术问题

[0005]第一方面,本申请提供了一种设备复位方法,应用于服务器中任一资源池的基板管理控制器;所述服务器包括多个资源池,各个资源池中均包括复杂可编程逻辑器件和基板管理控制器,所述复杂可编程逻辑器件,用于将所述任一资源池的基板管理控制器发送的复位信号传输至各个资源池中的待复位设备;所述方法包括:
[0006]接收复位命令并对所述复位命令进行解析,得到所述复位命令对应的复位场景;
[0007]基于所述复位场景确定所述复位场景对应的复位方法;
[0008]执行所述复位方法,以确定目标复杂可编程逻辑器件和目标待复位设备,并将所述复位信号发送至所述目标复杂可编程逻辑器件,使所述目标待复位设备复位

[0009]在一些实施例中,所述各个资源池包括计算资源池

交换资源池

存储资源池和异构加速资源池;所述计算资源池通过所述交换资源池与所述存储资源池和所述异构加速资源池进行连接;所述计算资源池包括主机,所述主机中包括至少一个第一设备;所述接收复位命令之前,还包括:
[0010]在所述服务器接通电源的情况下,将通电信号发送至各个资源池的基板管理控制器,并接收各个基板管理控制器发送的通电完成信号;
[0011]向与所述交换资源池相连的所述存储资源池

所述异构加速资源池和所述计算资源池发送复位信号;
[0012]基于所述复位信号将所述第一设备,以及所述存储资源池和所述异构加速资源池的第二设备进行复位;
[0013]将所述交换资源池中的交换设备与复位后的第一设备和第二设备建立连接

[0014]在一些实施例中,所述将所述交换资源池中的交换设备与复位后的第一设备和第二设备建立连接之后,还包括:
[0015]获取所述交换资源池中各个交换设备与所述第一设备和所述第二设备之间的连
接关系,以及获取所述主机与所述第二设备的对应关系;
[0016]控制所述主机进行开机,并基于所述对应关系将所述主机对应的第二设备进行复位;
[0017]将所述连接关系和所述对应关系存储在所述任一资源池的基板管理控制器中;
[0018]向第一基板管理控制器发送限制指令,所述限制指令用于限制所述第一基板管理控制器对所述第一基板管理控制器的资源池中的设备进行控制;
[0019]其中,所述第一基板管理控制器为除所述任一资源池外的资源池的基板管理控制器

[0020]在一些实施例中,所述控制所述主机进行开机,并基于所述对应关系将所述主机对应的第二设备进行复位,包括:
[0021]基于开机信号对所述主机进行开机;
[0022]在监控到所述主机发送的复位信号的情况下,向所述交换资源池的复杂可编程逻辑器件发送所述复位信号;
[0023]基于所述复杂可编程逻辑器件将所述复位信号发送至所述主机对应的第二设备,控制所述主机对应的第二设备进行复位,并将所述主机与所述主机对应的第二设备建立连接

[0024]在一些实施例中,在所述复位场景为任一主机重启,对所述任一主机对应的第二设备进行复位的情况下,所述执行所述复位方法,包括:
[0025]确定待重启主机,将所述待重启主机进行重启;
[0026]基于所述连接关系和所述对应关系,确定所述待重启主机对应的第二设备连接的交换设备的连接端口;
[0027]基于所述连接端口确定所述目标复杂可编程逻辑器件;
[0028]向所述目标复杂可编程逻辑器件发送所述复位信号,以使所述目标待复位设备复位,所述目标待复位设备为所述待重启主机对应的第二设备

[0029]在一些实施例中,在所述复位场景为对所述主机对应的第二设备进行重新分配的情况下,所述执行所述复位方法,包括:
[0030]确定待分配设备,将所述待分配设备作为所述目标待复位设备;
[0031]向所述交换设备发送断开命令,基于所述断开命令将所述待分配设备与所述主机断开连接;
[0032]向所述目标复杂可编程逻辑器件发送所述复位信号,以使断开连接后的待分配设备复位;
[0033]将所述断开连接后的待分配设备与新的主机建立连接;
[0034]基于所述待分配设备和所述新的主机与所述交换设备的连接关系,以及所述待分配设备和所述新的主机的对应关系,对所述连接关系和所述对应关系进行更新

[0035]在一些实施例中,在所述复位场景为在任一交换设备存在异常,对与所述任一交换设备连接的资源池中的设备进行复位的情况下,所述执行所述复位方法包括:
[0036]将所述任一交换设备连接的主机和第二设备,作为目标待复位设备;
[0037]将所述任一交换设备连接的主机进行重启;
[0038]向所述目标复杂可编程逻辑器件发送所述复位信号,以使所述目标待复位设备复
位;
[0039]将所述目标待复位设备与所述交换资源池中的除所述任一交换设备外的其他交换设备进行连接;
[0040]基于连接结果对所述连接关系进行更新

[0041]第二方面,本申请提供了一种设备复位装置,应用于服务器中任一资源池的基板管理控制器;所述服务器包括多个资源池,各个资源池中均包括复杂可编程逻辑器件和基板管理控制器,所述复杂可编程逻辑器件,用于将所述任一资源池的基板管理控制器发送的复位信号传输至各个资源池中的待复位设备;所述基板管理控制器包括:
[0042]接收模块,用于接收复位命令并对所述复位命令进行解析,得到所述复位命令对应的复位场景;
[0043]确定模块,用于基于所述复位场景确定所述复位场景对应的复位方法;
[0044]复位模块,用于执行所述复位方法,以确定目标复杂可编程逻辑器件和目标待复位设备,并将所述复位信号发送至所述目标复杂可编程逻辑器件,使所述目标待复位设备复位

[0045]第三方面,本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种设备复位方法,其特征在于,应用于服务器中任一资源池的基板管理控制器;所述服务器包括多个资源池,各个资源池中均包括复杂可编程逻辑器件和基板管理控制器,所述复杂可编程逻辑器件,用于将所述任一资源池的基板管理控制器发送的复位信号传输至各个资源池中的待复位设备;所述方法包括:接收复位命令并对所述复位命令进行解析,得到所述复位命令对应的复位场景;基于所述复位场景确定所述复位场景对应的复位方法;执行所述复位方法,以确定目标复杂可编程逻辑器件和目标待复位设备,并将所述复位信号发送至所述目标复杂可编程逻辑器件,使所述目标待复位设备复位
。2.
根据权利要求1所述的设备复位方法,其特征在于,所述各个资源池包括计算资源池

交换资源池

存储资源池和异构加速资源池;所述计算资源池通过所述交换资源池与所述存储资源池和所述异构加速资源池进行连接;所述计算资源池包括主机,所述主机中包括至少一个第一设备;所述接收复位命令之前,还包括:在所述服务器接通电源的情况下,将通电信号发送至各个资源池的基板管理控制器,并接收各个基板管理控制器发送的通电完成信号;向与所述交换资源池相连的所述存储资源池

所述异构加速资源池和所述计算资源池发送复位信号;基于所述复位信号将所述第一设备,以及所述存储资源池和所述异构加速资源池的第二设备进行复位;将所述交换资源池中的交换设备与复位后的第一设备和第二设备建立连接
。3.
根据权利要求2所述的设备复位方法,其特征在于,所述将所述交换资源池中的交换设备与复位后的第一设备和第二设备建立连接之后,还包括:获取所述交换资源池中各个交换设备与所述第一设备和所述第二设备之间的连接关系,以及获取所述主机与所述第二设备的对应关系;控制所述主机进行开机,并基于所述对应关系将所述主机对应的第二设备进行复位;将所述连接关系和所述对应关系存储在所述任一资源池的基板管理控制器中;向第一基板管理控制器发送限制指令,所述限制指令用于限制所述第一基板管理控制器对所述第一基板管理控制器的资源池中的设备进行控制;其中,所述第一基板管理控制器为除所述任一资源池外的资源池的基板管理控制器
。4.
根据权利要求3所述的设备复位方法,其特征在于,所述控制所述主机进行开机,并基于所述对应关系将所述主机对应的第二设备进行复位,包括:基于开机信号对所述主机进行开机;在监控到所述主机发送的复位信号的情况下,向所述交换资源池的复杂可编程逻辑器件发送所述复位信号;基于所述复杂可编程逻辑器件将所述复位信号发送至所述主机对应的第二设备,控制所述主机对应的第二设备进行复位,并将所述主机与所述主机对应的第二设备建立连接
。5.
根据权利要求3所述的设备复位方法,其特征在于,在所述复位场景为任一主...

【专利技术属性】
技术研发人员:郭洁汪浩王兴隆郭平马晓宇于明
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1